Gemini Deep Research ist jetzt in der Vorabversion mit Funktionen wie gemeinsamer Planung, Visualisierung und MCP-Unterstützung verfügbar.

Ratenlimits

Ratenbegrenzungen regeln die Anzahl der Anfragen, die Sie innerhalb eines bestimmten Zeitraums an die Gemini API senden können. Diese Limits tragen dazu bei, eine faire Nutzung aufrechtzuerhalten, vor Missbrauch zu schützen und die Systemleistung für alle Nutzer zu gewährleisten.

Aktive Ratenbegrenzungen in AI Studio ansehen

So funktionieren Ratenbegrenzungen

Ratenbegrenzungen werden in der Regel anhand von drei Dimensionen gemessen:

Anfragen pro Minute (RPM)
Tokens pro Minute (Eingabe) (TPM)
Anfragen pro Tag (RPD)

Ihre Nutzung wird mit jedem Limit verglichen. Wenn Sie eines der Limits überschreiten, wird ein Fehler aufgrund der Ratenbegrenzung ausgelöst. Wenn Ihr RPM-Limit beispielsweise 20 beträgt, führt das Senden von 21 Anfragen innerhalb einer Minute zu einem Fehler, auch wenn Sie Ihr TPM-Limit oder andere Limits nicht überschritten haben.

Ratenbegrenzungen werden pro Projekt und nicht pro API-Schlüssel angewendet. Kontingente für Anfragen pro Tag (RPD) werden um Mitternacht (Pacific Time) zurückgesetzt.

Die Limits variieren je nach verwendetem Modell. Einige Limits gelten nur für bestimmte Modelle. Beispielsweise wird „Bilder pro Minute“ (Images per minute, IPM) nur für Modelle berechnet, die Bilder generieren können (Nano Banana). Es ist aber konzeptionell ähnlich wie TPM. Für andere Modelle gilt möglicherweise ein Limit für Tokens pro Tag (Tokens per day, TPD).

Für experimentelle Modelle und Modelle in der Vorabversion gelten strengere Ratenbegrenzungen.

Nutzungsstufen

Ratenbegrenzungen sind an die Nutzungsstufe des Projekts gebunden. Wenn Ihre API-Nutzung und Ihre Ausgaben steigen, werden Sie automatisch auf eine höhere Stufe mit höheren Ratenbegrenzungen hochgestuft.

Die Voraussetzungen für die Stufen 2 und 3 basieren auf den kumulativen Gesamtausgaben für Google Cloud-Dienste (einschließlich, aber nicht beschränkt auf die Gemini API) für das mit Ihrem Projekt verknüpfte Abrechnungskonto.

Nutzungsstufe	Voraussetzung	Obergrenze für Abrechnungsstufe
Kostenlos	Aktives Projekt oder kostenlose Testversion	–
Stufe 1	Aktives Rechnungskonto einrichten und verknüpfen	250 $
Stufe 2	100 $bezahlt + 3 Tage seit der ersten erfolgreichen Zahlung	2.000 $
Stufe 3	1.000 $bezahlt + 30 Tage seit der ersten erfolgreichen Zahlung	20.000 $ bis 100.000 $+

Die Erfüllung der angegebenen Voraussetzungen reicht in der Regel für die Genehmigung aus. In seltenen Fällen kann eine Anfrage zur Hochstufung jedoch aufgrund anderer Faktoren abgelehnt werden, die während der Überprüfung ermittelt wurden.

Dieses System trägt dazu bei, die Sicherheit und Integrität der Gemini API-Plattform für alle Nutzer aufrechtzuerhalten.

Gemini API-Ratenbegrenzungen

Ratenbegrenzungen hängen von verschiedenen Faktoren ab (z. B. von Ihrer Nutzungsstufe) und können in Google AI Studio eingesehen werden. Wenn sich Ihre Stufe und Ihr Kontostatus im Laufe der Zeit ändern, werden Ihre Ratenbegrenzungen automatisch aktualisiert.

Aktive Ratenbegrenzungen in AI Studio ansehen

Die angegebenen Ratenbegrenzungen sind nicht garantiert und die tatsächliche Kapazität kann variieren.

Ratenbegrenzungen für die Prioritätsinferenz

Prioritätsnutzung gelten eigene Raten begrenzungen, auch wenn die Nutzung auf die allgemeinen Ratenbegrenzungen für interaktiven Traffic angerechnet wird. Standardratenbegrenzungen: 0,3-fache der Standardratenbegrenzung für jedes Modell und jede Stufe

Ratenbegrenzungen für Batch-APIs

Batch-API-Anfragen unterliegen eigenen Raten begrenzungen, die von den Ratenbegrenzungen für API-Aufrufe ohne Batchverarbeitung getrennt sind.

Gleichzeitige Batchanfragen:100
Limit für die Größe der Eingabedatei:2 GB
Limit für den Dateispeicher:20 GB
Tokens in der Warteschlange pro Modell:In der Tabelle Batch-Tokens in der Warteschlange ist die maximale Anzahl von Tokens aufgeführt, die für die Batchverarbeitung für alle aktiven Batchjobs für ein bestimmtes Modell in die Warteschlange gestellt werden können.

Stufe 1

Modell	Batch-Tokens in der Warteschlange
Textausgabemodelle
Gemini 3.1 Pro (Vorabversion)	5.000.000
Gemini 3.1 Flash-Lite (Vorabversion)	10.000.000
Gemini 3 Flash (Vorabversion)	3.000.000
Gemini 2.5 Pro	5.000.000
Gemini 2.5 Pro TTS	25.000
Gemini 2.5 Flash	3.000.000
Gemini 2.5 Flash (Vorabversion)	3.000.000
Gemini 2.5 Flash Image (Vorabversion)	3.000.000
Gemini 2.5 Flash TTS	100.000
Gemini 2.5 Flash-Lite	10.000.000
Gemini 2.5 Flash-Lite (Vorabversion)	10.000.000
Gemini 2.0 Flash	10.000.000
Gemini 2.0 Flash Image	3.000.000
Gemini 2.0 Flash-Lite	10.000.000
Multimodale Generierungsmodelle
Gemini 3.1 Flash Image (Vorabversion) 🍌	1.000.000
Gemini 3 Pro Image (Vorabversion) 🍌	2.000.000
Einbettungsmodelle
Gemini Embedding	500.000

Stufe 2

Modell	Batch-Tokens in der Warteschlange
Textausgabemodelle
Gemini 3.1 Pro (Vorabversion)	500.000.000
Gemini 3.1 Flash-Lite (Vorabversion)	500.000.000
Gemini 3.1 Flash (Vorabversion)	400.000.000
Gemini 2.5 Pro	500.000.000
Gemini 2.5 Pro TTS	100.000
Gemini 2.5 Flash	400.000.000
Gemini 2.5 Flash (Vorabversion)	400.000.000
Gemini 2.5 Flash Image (Vorabversion)	400.000.000
Gemini 2.5 Flash TTS	100.000
Gemini 2.5 Flash-Lite	500.000.000
Gemini 2.5 Flash-Lite (Vorabversion)	500.000.000
Gemini 2.0 Flash	1.000.000.000
Gemini 2.0 Flash Image	400.000.000
Gemini 2.0 Flash-Lite	1.000.000.000
Multimodale Generierungsmodelle
Gemini 3.1 Flash Image (Vorabversion) 🍌	250.000.000
Gemini 3 Pro Image (Vorabversion) 🍌	270.000.000
Einbettungsmodelle
Gemini Embedding	5.000.000

Stufe 3

Modell	Batch-Tokens in der Warteschlange
Textausgabemodelle
Gemini 3.1 Pro (Vorabversion)	1.000.000.000
Gemini 3.1 Flash-Lite (Vorabversion)	1.000.000.000
Gemini 3.1 Flash (Vorabversion)	1.000.000.000
Gemini 2.5 Pro	1.000.000.000
Gemini 2.5 Pro TTS	1.000.000
Gemini 2.5 Flash	1.000.000.000
Gemini 2.5 Flash (Vorabversion)	1.000.000.000
Gemini 2.5 Flash Image (Vorabversion)	1.000.000.000
Gemini 2.5 Flash TTS	4.000.000
Gemini 2.5 Flash-Lite	1.000.000.000
Gemini 2.5 Flash-Lite (Vorabversion)	1.000.000.000
Gemini 2.0 Flash	5.000.000.000
Gemini 2.0 Flash Image	1.000.000.000
Gemini 2.0 Flash-Lite	5.000.000.000
Multimodale Generierungsmodelle
Gemini 3.1 Flash Image (Vorabversion) 🍌	750.000.000
Gemini 3 Pro Image (Vorabversion) 🍌	1.000.000.000
Einbettungsmodelle
Gemini Embedding	10.000.000

Auf die nächste Stufe upgraden

Wenn Sie von der kostenlosen Stufe zu einer kostenpflichtigen Stufe wechseln möchten, müssen Sie zuerst die Abrechnung in AI Studio einrichten.

Sobald Ihr Projekt die angegebenen Kriterien erfüllt, wird es automatisch auf die nächste Stufe hochgestuft. Stufen-Upgrades von der kostenlosen Stufe auf Stufe 1 werden in der Regel sofort wirksam. Nachfolgende Stufen-Upgrades werden innerhalb von 10 Minuten wirksam. Navigieren Sie zur Seite „Projekte“ in AI Studio, um Ihre Stufen zu prüfen.

Erhöhung der Ratenbegrenzung beantragen

Für jede Modellvariante gilt eine zugehörige Ratenbegrenzung (Anfragen pro Minute, RPM). Weitere Informationen zu diesen Ratenbegrenzungen finden Sie auf der Seite Ratenbegrenzung in AI Studio.

Erhöhung der Ratenbegrenzung für kostenpflichtige Stufen beantragen

Wir können nicht garantieren, dass Ihre Ratenbegrenzung erhöht wird, werden Ihre Anfrage aber bestmöglich prüfen.