Quotas et limites

Ce document répertorie les quotas et limites qui s'appliquent au Gemini pour Google Cloud.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressources Google Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs de Google Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud.

Le système Cloud Quotas effectue les opérations suivantes :

  • Surveille votre consommation de produits et services Google Cloud
  • Limite votre consommation de ces ressources
  • Permet de demander des modifications de la valeur du quota

Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud. Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud, les quotas sont partagés entre toutes les applications et adresses IP.

Il existe également des limites pour les ressources Gemini. Ces limites ne sont pas liées au système de quotas. Sauf indication contraire, les limites ne peuvent pas être modifiées.

Requêtes par seconde

Gemini pour Google Cloud applique des quotas de requêtes par seconde pour chaque utilisateur d'un projet.

Quota Valeur
Requêtes par seconde 2

Requêtes par jour

Gemini pour Google Cloud applique des quotas pour le nombre total de requêtes par jour pour chaque utilisateur d'un projet.

Quota Valeur
Requêtes par jour pour Gemini Code Assist ou Gemini dans Requêtes de code BigQuery, telles que la génération et le code de code l'achèvement. 6000
de requêtes par jour pour le chat, la visualisation, les analyses de tables d'insights sur les données et les autres demandes qui affichent les réponses dans le volet Gemini la console Google Cloud et les IDE. 240

Quotas pour Gemini dans BigQuery

Pour les clients qui utilisent Gemini dans BigQuery avec pour l'édition BigQuery Enterprise Plus, les quotas sont fournis en fonction d'utilisation quotidienne moyenne des heures d'utilisation des emplacements Enterprise Plus pour le dernier calendrier complet mois. Ce quota s'applique au niveau de l'organisation et est disponible pour tous projets de cette organisation auxquels des emplacements en édition Enterprise Plus ont été attribués. Les quotas sont arrondis à la centaine d'heures d'utilisation la plus proche.

Quotas pour 100 heures d'utilisation des emplacements (utilisation moyenne quotidienne de l'édition Enterprise Plus) Valeur
Requêtes de saisie automatique de code par jour 150
Requêtes de génération de code par jour 10
Requêtes par jour pour le chat, la visualisation, les analyses de table et les autres demandes qui affichent les réponses dans le volet Gemini console Google Cloud. 5

Exemple: Organisation disposant d'une édition Enterprise Plus avec 100 emplacements comme référence,utilise en moyenne 2 400 heures d'utilisation des emplacements jour (100 emplacements x 24 heures = 2 400 heures d'utilisation des emplacements). Par conséquent, dans les mois, il bénéficie des quotas quotidiens suivants:

  • 3 600 requêtes de saisie automatique de code par jour
  • 240 requêtes de génération de code par jour
  • 120 analyses de tables de chat, de visualisation et d'insights sur les données par jour

Si votre organisation n'a acheté Réservations de l'édition Plus jusqu'à présent, puis après l'achat de l'édition Enterprise Plus d'édition, vous recevrez le quota par défaut des éléments suivants pour le premier mois civil complet:

  • 7 500 requêtes de saisie automatique de code par jour
  • 500 requêtes de génération de code par jour
  • 250 analyses de table de chat, de visualisations et d'insights sur les données par jour

Si vous commencez à utiliser les réservations Enterprise Plus en milieu de mois, le quota par défaut s'applique jusqu'à la fin du mois suivant.

Demander une augmentation du quota

Pour demander une augmentation ou une diminution de la plupart des quotas, vous pouvez utiliser Google Cloud Console. Pour en savoir plus, consultez Demander une augmentation de quota.