I limiti di frequenza regolano il numero di richieste che puoi effettuare all'API Gemini in un determinato periodo di tempo. Questi limiti contribuiscono a mantenere un utilizzo equo, a proteggere dagli abusi e a mantenere le prestazioni del sistema per tutti gli utenti.
Visualizzare i limiti di frequenza attivi in AI Studio
Come funzionano i limiti di frequenza
I limiti di frequenza vengono in genere misurati in base a tre dimensioni:
- Richieste al minuto (RPM)
- Token al minuto (input) (TPM)
- Richieste al giorno (RPD)
Il tuo utilizzo viene valutato in base a ogni limite e il superamento di uno di questi limiti attiverà un errore di limite di frequenza. Ad esempio, se il limite di RPM è 20, l'invio di 21 richieste in un minuto genererà un errore, anche se non hai superato il limite di TPM o altri limiti.
I limiti di frequenza vengono applicati per progetto, non per chiave API. Le quote di richieste al giorno (RPD) vengono reimpostate alla mezzanotte del fuso orario del Pacifico.
I limiti variano a seconda del modello specifico utilizzato e alcuni limiti si applicano solo a modelli specifici. Ad esempio, le immagini al minuto (IPM) vengono calcolate solo per i modelli in grado di generare immagini (Nano Banana), ma sono concettualmente simili a TPM. Altri modelli potrebbero avere un limite di token al giorno (TPD).
I limiti di frequenza sono più restrittivi per i modelli sperimentali e di anteprima.
Livelli di utilizzo
I limiti di frequenza sono legati al livello di utilizzo del progetto. Man mano che l'utilizzo e la spesa dell'API aumentano, verrà eseguito automaticamente l'upgrade a un livello superiore con limiti di frequenza maggiori.
Le qualifiche per i livelli 2 e 3 si basano sulla spesa cumulativa totale per i servizi Google Cloud (inclusa, a titolo esemplificativo, l'API Gemini) per l'account di fatturazione collegato al progetto.
| Livello di utilizzo | Qualificazione | Limite del livello di fatturazione |
|---|---|---|
| Nessun costo | Progetto attivo o prova senza costi | N/D |
| Livello 1 | Configura e collega un account di fatturazione attivo | 250 $ |
| Livello 2 | Pagamento di 100 $+ 3 giorni dal primo pagamento riuscito | 2000 $ |
| Livello 3 | Pagamento di 1000 $+ 30 giorni dal primo pagamento riuscito | 20.000 $ - 100.000 $ e oltre |
Sebbene in genere il soddisfacimento dei criteri di qualificazione indicati sia sufficiente per l'approvazione, in rari casi una richiesta di upgrade può essere rifiutata in base ad altri fattori identificati durante la procedura di revisione.
Questo sistema contribuisce a mantenere la sicurezza e l'integrità della piattaforma dell'API Gemini per tutti gli utenti.
Limiti di frequenza dell'API Gemini
I limiti di frequenza dipendono da una serie di fattori (ad esempio il livello di utilizzo) e possono essere visualizzati in Google AI Studio. Man mano che il livello e lo stato dell'account cambiano nel tempo, i limiti di frequenza verranno aggiornati automaticamente.
Visualizzare i limiti di frequenza attivi in AI Studio
I limiti di frequenza specificati non sono garantiti e la capacità effettiva può variare.
Limiti di frequenza dell'inferenza di priorità
Il consumo dipriorità ha i propri limiti di frequenza, anche se il consumo viene conteggiato ai fini dei limiti di frequenza del traffico interattivo complessivo. I limiti di frequenza predefiniti sono: 0,3 volte il limite di frequenza standard per ogni modello e livello
Limiti di frequenza dell'API batch
Le richieste dell'API batch sono soggette a limiti di frequenza propri, separati dalle chiamate API non batch.
- Richieste batch simultanee: 100
- Limite di dimensione del file di input: 2 GB
- Limite di spazio di archiviazione dei file: 20 GB
- Token in coda per modello: la tabella Token batch in coda elenca il numero massimo di token che possono essere messi in coda per l'elaborazione batch in tutti i job batch attivi per un determinato modello.
Livello 1
| Modello | Token batch in coda | |||
|---|---|---|---|---|
| Modelli di testo | ||||
| Gemini 3.1 Pro (anteprima) | 5.000.000 | |||
| Gemini 3.1 Flash-Lite (anteprima) | 10.000.000 | |||
| Gemini 3 Flash (anteprima) | 3.000.000 | |||
| Gemini 2.5 Pro | 5.000.000 | |||
| Gemini 2.5 Pro TTS | 25.000 | |||
| Gemini 2.5 Flash | 3.000.000 | |||
| Gemini 2.5 Flash (anteprima) | 3.000.000 | |||
| Gemini 2.5 Flash Image (anteprima) | 3.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 10.000.000 | |||
| Gemini 2.5 Flash-Lite (anteprima) | 10.000.000 | |||
| Gemini 2.0 Flash | 10.000.000 | |||
| Gemini 2.0 Flash Image | 3.000.000 | |||
| Gemini 2.0 Flash-Lite | 10.000.000 | |||
| Modelli di generazione multimodale | ||||
| Gemini 3.1 Flash Image (anteprima) 🍌 | 1.000.000 | |||
| Gemini 3 Pro Image (anteprima) 🍌 | 2.000.000 | |||
| Modelli di embedding | ||||
| Gemini Embedding | 500.000 | |||
Livello 2
| Modello | Token batch in coda | |||
|---|---|---|---|---|
| Modelli di testo | ||||
| Gemini 3.1 Pro (anteprima) | 500.000.000 | |||
| Gemini 3.1 Flash-Lite (anteprima) | 500.000.000 | |||
| Gemini 3.1 Flash (anteprima) | 400.000.000 | |||
| Gemini 2.5 Pro | 500.000.000 | |||
| Gemini 2.5 Pro TTS | 100.000 | |||
| Gemini 2.5 Flash | 400.000.000 | |||
| Gemini 2.5 Flash (anteprima) | 400.000.000 | |||
| Gemini 2.5 Flash Image (anteprima) | 400.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 500.000.000 | |||
| Gemini 2.5 Flash-Lite (anteprima) | 500.000.000 | |||
| Gemini 2.0 Flash | 1.000.000.000 | |||
| Gemini 2.0 Flash Image | 400.000.000 | |||
| Gemini 2.0 Flash-Lite | 1.000.000.000 | |||
| Modelli di generazione multimodale | ||||
| Gemini 3.1 Flash Image (anteprima) 🍌 | 250.000.000 | |||
| Gemini 3 Pro Image (anteprima) 🍌 | 270.000.000 | |||
| Modelli di embedding | ||||
| Gemini Embedding | 5.000.000 | |||
Livello 3
| Modello | Token batch in coda | |||
|---|---|---|---|---|
| Modelli di testo | ||||
| Gemini 3.1 Pro (anteprima) | 1.000.000.000 | |||
| Gemini 3.1 Flash-Lite (anteprima) | 1.000.000.000 | |||
| Gemini 3.1 Flash (anteprima) | 1.000.000.000 | |||
| Gemini 2.5 Pro | 1.000.000.000 | |||
| Gemini 2.5 Pro TTS | 1.000.000 | |||
| Gemini 2.5 Flash | 1.000.000.000 | |||
| Gemini 2.5 Flash (anteprima) | 1.000.000.000 | |||
| Gemini 2.5 Flash Image (anteprima) | 1.000.000.000 | |||
| Gemini 2.5 Flash TTS | 4.000.000 | |||
| Gemini 2.5 Flash-Lite | 1.000.000.000 | |||
| Gemini 2.5 Flash-Lite (anteprima) | 1.000.000.000 | |||
| Gemini 2.0 Flash | 5.000.000.000 | |||
| Gemini 2.0 Flash Image | 1.000.000.000 | |||
| Gemini 2.0 Flash-Lite | 5.000.000.000 | |||
| Modelli di generazione multimodale | ||||
| Gemini 3.1 Flash Image (anteprima) 🍌 | 750.000.000 | |||
| Gemini 3 Pro Image (anteprima) 🍌 | 1.000.000.000 | |||
| Modelli di embedding | ||||
| Gemini Embedding | 10.000.000 | |||
Come eseguire l'upgrade al livello successivo
Per passare dal livello senza costi a un livello a pagamento, devi prima configurare la fatturazione in AI Studio.
Una volta soddisfatti i criteri specificati, verrà eseguito automaticamente l'upgrade del progetto al livello successivo. In genere, gli upgrade di livello dal livello senza costi al livello 1 diventano effettivi immediatamente, mentre gli upgrade di livello successivi diventano effettivi entro 10 minuti. Vai alla pagina Progetti in AI Studio per controllare i livelli.
Richiedere un aumento del limite di frequenza
Ogni variante del modello ha un limite di frequenza associato (richieste al minuto, RPM). Per informazioni dettagliate su questi limiti di frequenza, consulta la pagina Limiti di frequenza di AI Studio.
Richiedere un aumento del limite di frequenza del livello a pagamento
Non offriamo alcuna garanzia sull'aumento del limite di frequenza, ma faremo del nostro meglio per esaminare la tua richiesta.