Ratenbegrenzungen regeln die Anzahl der Anfragen, die Sie innerhalb eines bestimmten Zeitraums an die Gemini API senden können. Diese Limits tragen dazu bei, eine faire Nutzung aufrechtzuerhalten, vor Missbrauch zu schützen und die Systemleistung für alle Nutzer zu gewährleisten.
Aktive Ratenbegrenzungen in AI Studio ansehen
So funktionieren Ratenbegrenzungen
Ratenbegrenzungen werden in der Regel anhand von drei Dimensionen gemessen:
- Anfragen pro Minute (RPM)
- Tokens pro Minute (Eingabe) (TPM)
- Anfragen pro Tag (RPD)
Ihre Nutzung wird mit jedem Limit verglichen. Wenn Sie eines der Limits überschreiten, wird ein Fehler aufgrund der Ratenbegrenzung ausgelöst. Wenn Ihr RPM-Limit beispielsweise 20 beträgt, führt das Senden von 21 Anfragen innerhalb einer Minute zu einem Fehler, auch wenn Sie Ihr TPM-Limit oder andere Limits nicht überschritten haben.
Ratenbegrenzungen werden pro Projekt und nicht pro API-Schlüssel angewendet. Kontingente für Anfragen pro Tag (RPD) werden um Mitternacht (Pacific Time) zurückgesetzt.
Die Limits variieren je nach verwendetem Modell. Einige Limits gelten nur für bestimmte Modelle. Beispielsweise wird „Bilder pro Minute“ (Images per minute, IPM) nur für Modelle berechnet, die Bilder generieren können (Nano Banana). Es ist aber konzeptionell ähnlich wie TPM. Für andere Modelle gilt möglicherweise ein Limit für Tokens pro Tag (Tokens per day, TPD).
Für experimentelle Modelle und Modelle in der Vorabversion gelten strengere Ratenbegrenzungen.
Nutzungsstufen
Ratenbegrenzungen sind an die Nutzungsstufe des Projekts gebunden. Wenn Ihre API-Nutzung und Ihre Ausgaben steigen, werden Sie automatisch auf eine höhere Stufe mit höheren Ratenbegrenzungen hochgestuft.
Die Voraussetzungen für die Stufen 2 und 3 basieren auf den kumulativen Gesamtausgaben für Google Cloud-Dienste (einschließlich, aber nicht beschränkt auf die Gemini API) für das mit Ihrem Projekt verknüpfte Abrechnungskonto.
| Nutzungsstufe | Voraussetzung | Obergrenze für Abrechnungsstufe |
|---|---|---|
| Kostenlos | Aktives Projekt oder kostenlose Testversion | – |
| Stufe 1 | Aktives Rechnungskonto einrichten und verknüpfen | 250 $ |
| Stufe 2 | 100 $bezahlt + 3 Tage seit der ersten erfolgreichen Zahlung | 2.000 $ |
| Stufe 3 | 1.000 $bezahlt + 30 Tage seit der ersten erfolgreichen Zahlung | 20.000 $ bis 100.000 $+ |
Die Erfüllung der angegebenen Voraussetzungen reicht in der Regel für die Genehmigung aus. In seltenen Fällen kann eine Anfrage zur Hochstufung jedoch aufgrund anderer Faktoren abgelehnt werden, die während der Überprüfung ermittelt wurden.
Dieses System trägt dazu bei, die Sicherheit und Integrität der Gemini API-Plattform für alle Nutzer aufrechtzuerhalten.
Gemini API-Ratenbegrenzungen
Ratenbegrenzungen hängen von verschiedenen Faktoren ab (z. B. von Ihrer Nutzungsstufe) und können in Google AI Studio eingesehen werden. Wenn sich Ihre Stufe und Ihr Kontostatus im Laufe der Zeit ändern, werden Ihre Ratenbegrenzungen automatisch aktualisiert.
Aktive Ratenbegrenzungen in AI Studio ansehen
Die angegebenen Ratenbegrenzungen sind nicht garantiert und die tatsächliche Kapazität kann variieren.
Ratenbegrenzungen für die Prioritätsinferenz
Prioritätsnutzung gelten eigene Raten begrenzungen, auch wenn die Nutzung auf die allgemeinen Ratenbegrenzungen für interaktiven Traffic angerechnet wird. Standardratenbegrenzungen: 0,3-fache der Standardratenbegrenzung für jedes Modell und jede Stufe
Ratenbegrenzungen für Batch-APIs
Batch-API-Anfragen unterliegen eigenen Raten begrenzungen, die von den Ratenbegrenzungen für API-Aufrufe ohne Batchverarbeitung getrennt sind.
- Gleichzeitige Batchanfragen:100
- Limit für die Größe der Eingabedatei:2 GB
- Limit für den Dateispeicher:20 GB
- Tokens in der Warteschlange pro Modell:In der Tabelle Batch-Tokens in der Warteschlange ist die maximale Anzahl von Tokens aufgeführt, die für die Batchverarbeitung für alle aktiven Batchjobs für ein bestimmtes Modell in die Warteschlange gestellt werden können.
Stufe 1
| Modell | Batch-Tokens in der Warteschlange | |||
|---|---|---|---|---|
| Textausgabemodelle | ||||
| Gemini 3.1 Pro (Vorabversion) | 5.000.000 | |||
| Gemini 3.1 Flash-Lite (Vorabversion) | 10.000.000 | |||
| Gemini 3 Flash (Vorabversion) | 3.000.000 | |||
| Gemini 2.5 Pro | 5.000.000 | |||
| Gemini 2.5 Pro TTS | 25.000 | |||
| Gemini 2.5 Flash | 3.000.000 | |||
| Gemini 2.5 Flash (Vorabversion) | 3.000.000 | |||
| Gemini 2.5 Flash Image (Vorabversion) | 3.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 10.000.000 | |||
| Gemini 2.5 Flash-Lite (Vorabversion) | 10.000.000 | |||
| Gemini 2.0 Flash | 10.000.000 | |||
| Gemini 2.0 Flash Image | 3.000.000 | |||
| Gemini 2.0 Flash-Lite | 10.000.000 | |||
| Multimodale Generierungsmodelle | ||||
| Gemini 3.1 Flash Image (Vorabversion) 🍌 | 1.000.000 | |||
| Gemini 3 Pro Image (Vorabversion) 🍌 | 2.000.000 | |||
| Einbettungsmodelle | ||||
| Gemini Embedding | 500.000 | |||
Stufe 2
| Modell | Batch-Tokens in der Warteschlange | |||
|---|---|---|---|---|
| Textausgabemodelle | ||||
| Gemini 3.1 Pro (Vorabversion) | 500.000.000 | |||
| Gemini 3.1 Flash-Lite (Vorabversion) | 500.000.000 | |||
| Gemini 3.1 Flash (Vorabversion) | 400.000.000 | |||
| Gemini 2.5 Pro | 500.000.000 | |||
| Gemini 2.5 Pro TTS | 100.000 | |||
| Gemini 2.5 Flash | 400.000.000 | |||
| Gemini 2.5 Flash (Vorabversion) | 400.000.000 | |||
| Gemini 2.5 Flash Image (Vorabversion) | 400.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 500.000.000 | |||
| Gemini 2.5 Flash-Lite (Vorabversion) | 500.000.000 | |||
| Gemini 2.0 Flash | 1.000.000.000 | |||
| Gemini 2.0 Flash Image | 400.000.000 | |||
| Gemini 2.0 Flash-Lite | 1.000.000.000 | |||
| Multimodale Generierungsmodelle | ||||
| Gemini 3.1 Flash Image (Vorabversion) 🍌 | 250.000.000 | |||
| Gemini 3 Pro Image (Vorabversion) 🍌 | 270.000.000 | |||
| Einbettungsmodelle | ||||
| Gemini Embedding | 5.000.000 | |||
Stufe 3
| Modell | Batch-Tokens in der Warteschlange | |||
|---|---|---|---|---|
| Textausgabemodelle | ||||
| Gemini 3.1 Pro (Vorabversion) | 1.000.000.000 | |||
| Gemini 3.1 Flash-Lite (Vorabversion) | 1.000.000.000 | |||
| Gemini 3.1 Flash (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.5 Pro | 1.000.000.000 | |||
| Gemini 2.5 Pro TTS | 1.000.000 | |||
| Gemini 2.5 Flash | 1.000.000.000 | |||
| Gemini 2.5 Flash (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.5 Flash Image (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.5 Flash TTS | 4.000.000 | |||
| Gemini 2.5 Flash-Lite | 1.000.000.000 | |||
| Gemini 2.5 Flash-Lite (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.0 Flash | 5.000.000.000 | |||
| Gemini 2.0 Flash Image | 1.000.000.000 | |||
| Gemini 2.0 Flash-Lite | 5.000.000.000 | |||
| Multimodale Generierungsmodelle | ||||
| Gemini 3.1 Flash Image (Vorabversion) 🍌 | 750.000.000 | |||
| Gemini 3 Pro Image (Vorabversion) 🍌 | 1.000.000.000 | |||
| Einbettungsmodelle | ||||
| Gemini Embedding | 10.000.000 | |||
Auf die nächste Stufe upgraden
Wenn Sie von der kostenlosen Stufe zu einer kostenpflichtigen Stufe wechseln möchten, müssen Sie zuerst die Abrechnung in AI Studio einrichten.
Sobald Ihr Projekt die angegebenen Kriterien erfüllt, wird es automatisch auf die nächste Stufe hochgestuft. Stufen-Upgrades von der kostenlosen Stufe auf Stufe 1 werden in der Regel sofort wirksam. Nachfolgende Stufen-Upgrades werden innerhalb von 10 Minuten wirksam. Navigieren Sie zur Seite „Projekte“ in AI Studio, um Ihre Stufen zu prüfen.
Erhöhung der Ratenbegrenzung beantragen
Für jede Modellvariante gilt eine zugehörige Ratenbegrenzung (Anfragen pro Minute, RPM). Weitere Informationen zu diesen Ratenbegrenzungen finden Sie auf der Seite Ratenbegrenzung in AI Studio.
Erhöhung der Ratenbegrenzung für kostenpflichtige Stufen beantragen
Wir können nicht garantieren, dass Ihre Ratenbegrenzung erhöht wird, werden Ihre Anfrage aber bestmöglich prüfen.