Points de terminaison du service Amazon Bedrock quotas de service Amazon Bedrock

Points de terminaison et quotas Amazon Bedrock

Pour vous connecter par programmation à un AWS service, vous utilisez un point de terminaison. AWS les services proposent les types de points de terminaison suivants dans certaines ou toutes les AWS régions prises en charge par le service : points de terminaison IPv4, points de terminaison à double pile et points de terminaison FIPS. Certains services fournissent des points de terminaison mondiaux. Pour de plus amples informations, veuillez consulter AWS points de terminaison de service.

Les quotas de service, également appelés limites, correspondent au nombre maximal de ressources ou d'opérations de service pour votre AWS compte. Pour de plus amples informations, veuillez consulter AWS service quotas.

Vous trouverez ci-dessous les points de terminaison et les quotas de service pour ce service.

Points de terminaison du service Amazon Bedrock

API du plan de contrôle Amazon Bedrock

Le tableau suivant fournit une liste des Region-specific points de terminaison pris en charge par Amazon Bedrock pour la gestion, la formation et le déploiement de modèles. Utilisez ces points de terminaison pour les opérations de l'API Amazon Bedrock.

Nom de la région	Région	Point de terminaison	Protocole
US East (Ohio)	us-east-2	bedrock.us-east-2.amazonaws.com bedrock-fips.us-east-2.amazonaws.com	HTTPS HTTPS
USA Est (Virginie du Nord)	us-east-1	bedrock.us-east-1.amazonaws.com bedrock-fips.us-east-1.amazonaws.com	HTTPS HTTPS
USA Ouest (Californie du Nord)	us-west-1	bedrock.us-west-1.amazonaws.com bedrock-fips.us-west-1.amazonaws.com	HTTPS HTTPS
USA Ouest (Oregon)	us-west-2	bedrock.us-west-2.amazonaws.com bedrock-fips.us-west-2.amazonaws.com	HTTPS HTTPS
Afrique (Le Cap)	af-south-1	bedrock.af-south-1.amazonaws.com	HTTPS
Asie-Pacifique (Hyderabad)	ap-south-2	bedrock.ap-south-2.amazonaws.com	HTTPS
Asie-Pacifique (Jakarta)	ap-southeast-3	bedrock.ap-southeast-3.amazonaws.com	HTTPS
Asie-Pacifique (Malaisie)	ap-southeast-5	bedrock.ap-southeast-5.amazonaws.com	HTTPS
Asie-Pacifique (Melbourne)	ap-southeast-4	bedrock.ap-southeast-4.amazonaws.com	HTTPS
Asia Pacific (Mumbai)	ap-south-1	bedrock.ap-south-1.amazonaws.com	HTTPS
Asie-Pacifique (Nouvelle Zélande)	ap-southeast-6	bedrock.ap-southeast-6.amazonaws.com	HTTPS
Asie-Pacifique (Osaka)	ap-northeast-3	bedrock.ap-northeast-3.amazonaws.com	HTTPS
Asia Pacific (Seoul)	ap-northeast-2	bedrock.ap-northeast-2.amazonaws.com	HTTPS
Asie-Pacifique (Singapour)	ap-southeast-1	bedrock.ap-southeast-1.amazonaws.com	HTTPS
Asie-Pacifique (Sydney)	ap-southeast-2	bedrock.ap-southeast-2.amazonaws.com	HTTPS
Asie-Pacifique (Taipei)	ap-east-2	bedrock.ap-east-2.amazonaws.com	HTTPS
Asie-Pacifique (Thaïlande)	ap-southeast-7	bedrock.ap-southeast-7.amazonaws.com	HTTPS
Asie-Pacifique (Tokyo)	ap-northeast-1	bedrock.ap-northeast-1.amazonaws.com	HTTPS
Canada (Centre)	ca-central-1	bedrock.ca-central-1.amazonaws.com bedrock-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
Canada-Ouest (Calgary)	ca-west-1	bedrock.ca-west-1.amazonaws.com bedrock-fips.ca-west-1.amazonaws.com	HTTPS HTTPS
Europe (Francfort)	eu-central-1	bedrock.eu-central-1.amazonaws.com	HTTPS
Europe (Irlande)	eu-west-1	bedrock.eu-west-1.amazonaws.com	HTTPS
Europe (Londres)	eu-west-2	bedrock.eu-west-2.amazonaws.com	HTTPS
Europe (Milan)	eu-south-1	bedrock.eu-south-1.amazonaws.com	HTTPS
Europe (Paris)	eu-west-3	bedrock.eu-west-3.amazonaws.com	HTTPS
Europe (Espagne)	eu-south-2	bedrock.eu-south-2.amazonaws.com	HTTPS
Europe (Stockholm)	eu-north-1	bedrock.eu-north-1.amazonaws.com	HTTPS
Europe (Zurich)	eu-central-2	bedrock.eu-central-2.amazonaws.com	HTTPS
Israël (Tel Aviv)	il-central-1	bedrock.il-central-1.amazonaws.com	HTTPS
Mexique (Centre)	mx-central-1	bedrock.mx-central-1.amazonaws.com	HTTPS
Moyen-Orient (Bahreïn)	me-south-1	bedrock.me-south-1.amazonaws.com	HTTPS
Moyen-Orient (EAU)	me-central-1	bedrock.me-central-1.amazonaws.com	HTTPS
Amérique du Sud (São Paulo)	sa-east-1	bedrock.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud (US-East)	us-gov-east-1	bedrock.us-gov-east-1.amazonaws.com bedrock-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud (US-West)	us-gov-west-1	bedrock.us-gov-west-1.amazonaws.com bedrock-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

API d'exécution Amazon Bedrock

Le tableau suivant fournit une liste des Region-specific points de terminaison pris en charge par Amazon Bedrock pour effectuer des demandes d'inférence pour les modèles hébergés dans Amazon Bedrock. Utilisez ces points de terminaison pour les opérations de l'API Amazon Bedrock Runtime.

Nom de la région	Région	Point de terminaison	Protocole
US East (Ohio)	us-east-2	bedrock-runtime.us-east-2.amazonaws.com bedrock-runtime-fips.us-east-2.amazonaws.com	HTTPS HTTPS
USA Est (Virginie du Nord)	us-east-1	bedrock-runtime.us-east-1.amazonaws.com bedrock-runtime-fips.us-east-1.amazonaws.com	HTTPS HTTPS
US West (Oregon)	us-west-2	bedrock-runtime.us-west-2.amazonaws.com bedrock-runtime-fips.us-west-2.amazonaws.com	HTTPS HTTPS
Asie-Pacifique (Hyderabad)	ap-south-2	bedrock-runtime.ap-south-2.amazonaws.com	HTTPS
Asia Pacific (Mumbai)	ap-south-1	bedrock-runtime.ap-south-1.amazonaws.com	HTTPS
Asie-Pacifique (Osaka)	ap-northeast-3	bedrock-runtime.ap-northeast-3.amazonaws.com	HTTPS
Asia Pacific (Seoul)	ap-northeast-2	bedrock-runtime.ap-northeast-2.amazonaws.com	HTTPS
Asie-Pacifique (Singapour)	ap-southeast-1	bedrock-runtime.ap-southeast-1.amazonaws.com	HTTPS
Asie-Pacifique (Sydney)	ap-southeast-2	bedrock-runtime.ap-southeast-2.amazonaws.com	HTTPS
Asie-Pacifique (Tokyo)	ap-northeast-1	bedrock-runtime.ap-northeast-1.amazonaws.com	HTTPS
Canada (Centre)	ca-central-1	bedrock-runtime.ca-central-1.amazonaws.com bedrock-runtime-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
Europe (Francfort)	eu-central-1	bedrock-runtime.eu-central-1.amazonaws.com	HTTPS
Europe (Irlande)	eu-west-1	bedrock-runtime.eu-west-1.amazonaws.com	HTTPS
Europe (Londres)	eu-west-2	bedrock-runtime.eu-west-2.amazonaws.com	HTTPS
Europe (Milan)	eu-south-1	bedrock-runtime.eu-south-1.amazonaws.com	HTTPS
Europe (Paris)	eu-west-3	bedrock-runtime.eu-west-3.amazonaws.com	HTTPS
Europe (Espagne)	eu-south-2	bedrock-runtime.eu-south-2.amazonaws.com	HTTPS
Europe (Stockholm)	eu-north-1	bedrock-runtime.eu-north-1.amazonaws.com	HTTPS
Europe (Zurich)	eu-central-2	bedrock-runtime.eu-central-2.amazonaws.com	HTTPS
Amérique du Sud (São Paulo)	sa-east-1	bedrock-runtime.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud (US-East)	us-gov-east-1	bedrock-runtime.us-gov-east-1.amazonaws.com bedrock-runtime-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud (US-West)	us-gov-west-1	bedrock-runtime.us-gov-west-1.amazonaws.com bedrock-runtime-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

API de compilation Agents for Amazon Bedrock

Le tableau suivant fournit une liste des Region-specific points de terminaison pris en charge par Agents for Amazon Bedrock pour créer et gérer des agents et des bases de connaissances. Utilisez ces points de terminaison pour les opérations d'API Agents for Amazon Bedrock.

Nom de la région	Région	Point de terminaison	Protocole
USA Est (Virginie du Nord)	us-east-1	bedrock-agent.us-east-1.amazonaws.com	HTTPS
USA Est (Virginie du Nord)	us-east-1	bedrock-agent-fips.us-east-1.amazonaws.com	HTTPS
USA Ouest (Oregon)	us-west-2	bedrock-agent.us-west-2.amazonaws.com	HTTPS
USA Ouest (Oregon)	us-west-2	bedrock-agent-fips.us-west-2.amazonaws.com	HTTPS
Asie-Pacifique (Singapour)	ap-southeast-1	bedrock-agent.ap-southeast-1.amazonaws.com	HTTPS
Asie-Pacifique (Sydney)	ap-southeast-2	bedrock-agent.ap-southeast-2.amazonaws.com	HTTPS
Asie-Pacifique (Tokyo)	ap-northeast-1	bedrock-agent.ap-northeast-1.amazonaws.com	HTTPS
Asie-Pacifique (Séoul)	ap-northeast-2	bedrock-agent.ap-northeast-2.amazonaws.com	HTTPS
Canada (Centre)	ca-central-1	bedrock-agent.ca-central-1.amazonaws.com	HTTPS
Europe (Francfort)	eu-central-1	bedrock-agent.eu-central-1.amazonaws.com	HTTPS
Europe (Irlande)	eu-west-1	bedrock-agent.eu-west-1.amazonaws.com	HTTPS
Europe (Londres)	eu-west-2	bedrock-agent.eu-west-2.amazonaws.com	HTTPS
Europe (Paris)	eu-west-3	bedrock-agent.eu-west-3.amazonaws.com	HTTPS
Asie-Pacifique (Mumbai)	ap-south-1	bedrock-agent.ap-south-1.amazonaws.com	HTTPS
Amérique du Sud (São Paulo)	sa-east-1	bedrock-agent.sa-east-1.amazonaws.com	HTTPS

API d’exécution Agents for Amazon Bedrock

Le tableau suivant fournit une liste des Region-specific points de terminaison pris en charge par Agents for Amazon Bedrock pour appeler des agents et interroger des bases de connaissances. Utilisez ces points de terminaison pour les opérations de l'API Agents for Amazon Bedrock Runtime.

Nom de la région	Région	Point de terminaison	Protocole
USA Est (Virginie du Nord)	us-east-1	bedrock-agent-runtime.us-east-1.amazonaws.com	HTTPS
USA Est (Virginie du Nord)	us-east-1	bedrock-agent-runtime-fips.us-east-1.amazonaws.com	HTTPS
USA Ouest (Oregon)	us-west-2	bedrock-agent-runtime.us-west-2.amazonaws.com	HTTPS
USA Ouest (Oregon)	us-west-2	bedrock-agent-runtime-fips.us-west-2.amazonaws.com	HTTPS
Asie-Pacifique (Singapour)	ap-southeast-1	bedrock-agent-runtime.ap-southeast-1.amazonaws.com	HTTPS
Asie-Pacifique (Sydney)	ap-southeast-2	bedrock-agent-runtime.ap-southeast-2.amazonaws.com	HTTPS
Asie-Pacifique (Tokyo)	ap-northeast-1	bedrock-agent-runtime.ap-northeast-1.amazonaws.com	HTTPS
Asie-Pacifique (Séoul)	ap-northeast-2	bedrock-agent-runtime.ap-northeast-2.amazonaws.com	HTTPS
Canada (Centre)	ca-central-1	bedrock-agent-runtime.ca-central-1.amazonaws.com	HTTPS
Europe (Francfort)	eu-central-1	bedrock-agent-runtime.eu-central-1.amazonaws.com	HTTPS
Europe (Paris)	eu-west-3	bedrock-agent-runtime.eu-west-3.amazonaws.com	HTTPS
Europe (Irlande)	eu-west-1	bedrock-agent-runtime.eu-west-1.amazonaws.com	HTTPS
Europe (Londres)	eu-west-2	bedrock-agent-runtime.eu-west-2.amazonaws.com	HTTPS
Asie-Pacifique (Mumbai)	ap-south-1	bedrock-agent-runtime.ap-south-1.amazonaws.com	HTTPS
Amérique du Sud (São Paulo)	sa-east-1	bedrock-agent-runtime.sa-east-1.amazonaws.com	HTTPS

API d'automatisation des données Amazon Bedrock

Le tableau suivant fournit une liste des Region-specific points de terminaison pris en charge par Data Automation for Amazon Bedrock. Les points de terminaison qui utilisent le mot runtime invoquent des plans et des projets pour extraire des informations des fichiers. Utilisez ces points de terminaison pour les opérations de l'API Amazon Bedrock Data Automation Runtime. Les points de terminaison runtime non utilisés sont utilisés pour créer des plans et des projets afin de fournir des conseils d'extraction. Utilisez ces points de terminaison pour les opérations de création de l'API Amazon Bedrock Data Automation

Nom de la région	Région	Point de terminaison	Protocole
US East (Ohio)	us-east-2	bedrock-data-automation.us-east-2.amazonaws.com bedrock-data-automation-runtime.us-east-2.amazonaws.com bedrock-data-automation-fips.us-east-2.amazonaws.com bedrock-data-automation-runtime-fips.us-east-2.amazonaws.com	HTTPS HTTPS HTTPS HTTPS
USA Est (Virginie du Nord)	us-east-1	bedrock-data-automation.us-east-1.amazonaws.com bedrock-data-automation-runtime.us-east-1.api.aws bedrock-data-automation-runtime.us-east-1.amazonaws.com bedrock-data-automation.us-east-1.api.aws bedrock-data-automation-fips.us-east-1.amazonaws.com bedrock-data-automation-runtime-fips.us-east-1.api.aws bedrock-data-automation-runtime-fips.us-east-1.amazonaws.com bedrock-data-automation-fips.us-east-1.api.aws	HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS
USA Ouest (Oregon)	us-west-2	bedrock-data-automation.us-west-2.amazonaws.com bedrock-data-automation-runtime.us-west-2.api.aws bedrock-data-automation-runtime.us-west-2.amazonaws.com bedrock-data-automation.us-west-2.api.aws bedrock-data-automation-fips.us-west-2.amazonaws.com bedrock-data-automation-runtime-fips.us-west-2.api.aws bedrock-data-automation-runtime-fips.us-west-2.amazonaws.com bedrock-data-automation-fips.us-west-2.api.aws	HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS
Asia Pacific (Mumbai)	ap-south-1	bedrock-data-automation.ap-south-1.amazonaws.com bedrock-data-automation-runtime.ap-south-1.amazonaws.com	HTTPS HTTPS
Asie-Pacifique (Sydney)	ap-southeast-2	bedrock-data-automation.ap-southeast-2.amazonaws.com bedrock-data-automation-runtime.ap-southeast-2.amazonaws.com	HTTPS HTTPS
Asie-Pacifique (Tokyo)	ap-northeast-1	bedrock-data-automation.ap-northeast-1.amazonaws.com bedrock-data-automation-runtime.ap-northeast-1.amazonaws.com	HTTPS HTTPS
Canada (Centre)	ca-central-1	bedrock-data-automation.ca-central-1.amazonaws.com bedrock-data-automation-runtime.ca-central-1.amazonaws.com bedrock-data-automation-fips.ca-central-1.amazonaws.com bedrock-data-automation-runtime-fips.ca-central-1.amazonaws.com	HTTPS HTTPS HTTPS HTTPS
Europe (Francfort)	eu-central-1	bedrock-data-automation.eu-central-1.amazonaws.com bedrock-data-automation-runtime.eu-central-1.amazonaws.com	HTTPS HTTPS
Europe (Irlande)	eu-west-1	bedrock-data-automation.eu-west-1.amazonaws.com bedrock-data-automation-runtime.eu-west-1.amazonaws.com	HTTPS HTTPS
Europe (Londres)	eu-west-2	bedrock-data-automation.eu-west-2.amazonaws.com bedrock-data-automation-runtime.eu-west-2.amazonaws.com	HTTPS HTTPS
Europe (Espagne)	eu-south-2	bedrock-data-automation.eu-south-2.amazonaws.com bedrock-data-automation-runtime.eu-south-2.amazonaws.com	HTTPS HTTPS
AWS GovCloud (US-West)	us-gov-west-1	bedrock-data-automation.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime.us-gov-west-1.amazonaws.com bedrock-data-automation-fips.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS HTTPS HTTPS

quotas de service Amazon Bedrock

Astuce

Amazon Bedrock disposant d'un grand nombre de quotas, nous vous recommandons de consulter les quotas de service à l'aide de la console plutôt que d'utiliser le tableau ci-dessous. Ouvrez Amazon Bedrock quotas. Utilisez le champ de recherche pour trouver des quotas spécifiques. Utilisez l'icône en forme de roue dentée pour contrôler le nombre de quotas affichés sur une page.

Nom	Par défaut	Ajustable	Description
(Optimisation rapide avancée) Tâches actives par compte	Chaque région prise en charge : 20	Oui	Le nombre maximum de tâches APO (Advanced Prompt Optimization) actives par compte.
(Optimisation rapide avancée) Tâches inactives par compte	Chaque région prise en charge : 5 000	Oui	Nombre maximum de tâches APO (Advanced Prompt Optimization) inactives par compte.
(Raisonnement automatisé) Annotations dans les politiques	Chaque Région prise en charge : 10	Non	Le nombre maximum d'annotations dans une politique de raisonnement automatisé.
(Raisonnement automatisé) CancelAutomatedReasoningPolicyBuildWorkflow demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' CancelAutomatedReasoningPolicyBuildWorkflow API par seconde.
(Raisonnement automatisé) Constructions simultanées par politique	Chaque région prise en charge : 2	Non	Le nombre maximum de builds simultanés par politique de raisonnement automatisé.
(Raisonnement automatisé) Constitutions de politiques simultanées par compte	Chaque région prise en charge : 5	Non	Le nombre maximum de politiques de raisonnement automatisé simultanées sont créées dans un seul compte.
(Raisonnement automatisé) CreateAutomatedReasoningPolicy demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' CreateAutomatedReasoningPolicy API par seconde.
(Raisonnement automatisé) CreateAutomatedReasoningPolicyTestCase demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' CreateAutomatedReasoningPolicyTestCase API par seconde.
(Raisonnement automatisé) CreateAutomatedReasoningPolicyVersion demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' CreateAutomatedReasoningPolicyVersion API par seconde.
(Raisonnement automatisé) DeleteAutomatedReasoningPolicy demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' DeleteAutomatedReasoningPolicy API par seconde.
(Raisonnement automatisé) DeleteAutomatedReasoningPolicyBuildWorkflow demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' DeleteAutomatedReasoningPolicyBuildWorkflow API par seconde.
(Raisonnement automatisé) DeleteAutomatedReasoningPolicyTestCase demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' DeleteAutomatedReasoningPolicyTestCase API par seconde.
(Raisonnement automatisé) ExportAutomatedReasoningPolicyVersion demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' ExportAutomatedReasoningPolicyVersion API par seconde.
(Raisonnement automatisé) GetAutomatedReasoningPolicy demandes par seconde	Par région prise en charge : 10	Oui	Le nombre maximum de demandes d' GetAutomatedReasoningPolicy API par seconde.
(Raisonnement automatisé) GetAutomatedReasoningPolicyAnnotations demandes par seconde	Par région prise en charge : 10	Oui	Le nombre maximum de demandes d' GetAutomatedReasoningPolicyAnnotations API par seconde.
(Raisonnement automatisé) GetAutomatedReasoningPolicyBuildWorkflow demandes par seconde	Par région prise en charge : 10	Oui	Le nombre maximum de demandes d' GetAutomatedReasoningPolicyBuildWorkflow API par seconde.
(Raisonnement automatisé) GetAutomatedReasoningPolicyBuildWorkflowResultAssets demandes par seconde	Par région prise en charge : 10	Oui	Le nombre maximum de demandes d' GetAutomatedReasoningPolicyBuildWorkflowResultAssets API par seconde.
(Raisonnement automatisé) GetAutomatedReasoningPolicyNextScenario demandes par seconde	Par région prise en charge : 10	Oui	Le nombre maximum de demandes d' GetAutomatedReasoningPolicyNextScenario API par seconde.
(Raisonnement automatisé) GetAutomatedReasoningPolicyTestCase demandes par seconde	Par région prise en charge : 10	Oui	Le nombre maximum de demandes d' GetAutomatedReasoningPolicyTestCase API par seconde.
(Raisonnement automatisé) GetAutomatedReasoningPolicyTestResult demandes par seconde	Par région prise en charge : 10	Oui	Le nombre maximum de demandes d' GetAutomatedReasoningPolicyTestResult API par seconde.
(Raisonnement automatisé) ListAutomatedReasoningPolicies demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' ListAutomatedReasoningPolicies API par seconde.
(Raisonnement automatisé) ListAutomatedReasoningPolicyBuildWorkflows demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' ListAutomatedReasoningPolicyBuildWorkflows API par seconde.
(Raisonnement automatisé) ListAutomatedReasoningPolicyTestCases demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' ListAutomatedReasoningPolicyTestCases API par seconde.
(Raisonnement automatisé) ListAutomatedReasoningPolicyTestResults demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' ListAutomatedReasoningPolicyTestResults API par seconde.
(Raisonnement automatisé) Politiques par compte	Chaque région prise en charge : 100	Non	Le nombre maximum de politiques de raisonnement automatisé dans un compte.
(Raisonnement automatisé) Règles de politique	Chaque région prise en charge : 500	Non	Le nombre maximum de règles dans une politique de raisonnement automatisé.
(Raisonnement automatique) Taille du document source (Mo)	Chaque région prise en charge : 5	Non	Taille maximale du document source (Mo) pour créer une politique de raisonnement automatique.
(Raisonnement automatisé) Jetons de document source	Chaque région prise en charge : 122 880	Non	Le nombre maximum de jetons autorisés dans un document source lors de la création d'une politique de raisonnement automatisé.
(Raisonnement automatisé) StartAutomatedReasoningPolicyBuildWorkflow demandes par seconde	Par région prise en charge : 1	Oui	Le nombre maximum de demandes d' StartAutomatedReasoningPolicyBuildWorkflow API par seconde.
(Raisonnement automatisé) StartAutomatedReasoningPolicyTestWorkflow demandes par seconde	Par région prise en charge : 1	Oui	Le nombre maximum de demandes d' StartAutomatedReasoningPolicyTestWorkflow API par seconde.
(Raisonnement automatisé) Tests par politique	Chaque région prise en charge : 100	Non	Le nombre maximum de tests par politique de raisonnement automatisé.
(Raisonnement automatisé) Types par politique	Chaque région prise en charge : 50	Non	Le nombre maximum de types dans une politique de raisonnement automatisé.
(Raisonnement automatisé) UpdateAutomatedReasoningPolicy demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' UpdateAutomatedReasoningPolicy API par seconde.
(Raisonnement automatisé) UpdateAutomatedReasoningPolicyAnnotations demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' UpdateAutomatedReasoningPolicyAnnotations API par seconde.
(Raisonnement automatisé) UpdateAutomatedReasoningPolicyTestCase demandes par seconde	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes d' UpdateAutomatedReasoningPolicyTestCase API par seconde.
(Raisonnement automatisé) Valeurs par type dans la politique	Chaque région prise en charge : 50	Non	Le nombre maximum de valeurs par type dans une politique de raisonnement automatisé.
(Raisonnement automatisé) Variables dans les politiques	Chaque région prise en charge : 200	Non	Le nombre maximum de variables dans une politique de raisonnement automatisé.
(Raisonnement automatisé) Versions par politique	Chaque Région prise en charge : 1 000	Non	Le nombre maximum de versions par politique de raisonnement automatisé.
(Automatisation des données) (Console) Taille maximale du fichier de document (Mo)	Chaque région prise en charge : 200	Non	Taille de fichier maximale pour la console
(Automatisation des données) (Console) Nombre maximal de pages par fichier de document	Chaque Région prise en charge : 20	Non	Le nombre maximum de pages par document dans la console
(Automatisation des données) CreateBlueprint - Nombre maximum de plans par compte	Chaque région prise en charge : 350	Oui	Le nombre maximum de plans par compte
(Automatisation des données) CreateBlueprintVersion - Nombre maximal de versions de Blueprint par Blueprint	Par région prise en charge : 10	Oui	Le nombre maximum de versions par plan
(Automatisation des données) CreateDataAutomationLibrary - Nombre maximal de bibliothèques d'automatisation de données par compte	Par région prise en charge : 10	Oui	Le nombre maximum de bibliothèques d'automatisation des données par compte
(Automatisation des données) Longueur de la description des champs (caractères)	Chaque région prise en charge : 300	Non	Longueur maximale de description pour les champs en caractères
(Automatisation des données) InvokeBlueprintOptimizationAsync - Nombre maximal de tâches simultanées d'optimisation du plan	Chaque région prise en charge : 3	Oui	Le nombre maximum de jobs ouverts dans Invoke Blueprint Optimization Async
(Automatisation des données) InvokeBlueprintOptimizationAsync - Nombre maximal de tâches d'optimisation du plan par jour	Chaque Région prise en charge : 30	Non	Le nombre maximum de tâches asynchrones d'optimisation du Blueprint Invoke par jour
(Automatisation des données) InvokeDataAutomation (Synchronisation) - Document - Nombre maximal de demandes	Chaque région prise en charge : 60	Oui	Le nombre maximum de InvokeDataAutomation demandes par minute pour la modalité documentaire
(Automatisation des données) InvokeDataAutomation (Synchronisation) - Image - Nombre maximal de demandes	us-east-1 : 200 us-west-2 : 200 Chacune des autres régions prises en charge : 100	Oui	Le nombre maximum de InvokeDataAutomation demandes par minute pour la modalité d'image
(Automatisation des données) InvokeDataAutomationAsync - Audio - Nombre maximal de tâches simultanées	us-east-1 : 20 us-west-2 : 20 Chacune des autres régions prises en charge : 2	Oui	Le nombre maximum de tâches ouvertes Invoke Data Automation Async pour les fichiers audio
(Automatisation des données) InvokeDataAutomationAsync - Document - Nombre maximal de tâches simultanées	ap-south-1 : 5 ca-central-1 : 5 eu-south-2 : 5 eu-west-2 : 5 Chacune des autres régions prises en charge : 25	Oui	Le nombre maximum de tâches ouvertes Invoke Data Automation Async pour les documents
(Automatisation des données) InvokeDataAutomationAsync - Image - Nombre maximal de tâches simultanées	us-east-1 : 20 us-west-2 : 20 Chacune des autres régions prises en charge : 5	Oui	Le nombre maximum de tâches ouvertes Invoke Data Automation Async pour les images
(Automatisation des données) InvokeDataAutomationAsync - Nombre maximum de postes vacants	Chaque région prise en charge : 1 800	Non	Le nombre maximum de tâches ouvertes Invoke Data Automation Async pour les images
(Automatisation des données) InvokeDataAutomationAsync - Vidéo - Nombre maximal de tâches simultanées	us-east-1 : 20 us-west-2 : 20 Chacune des autres régions prises en charge : 3	Oui	Le nombre maximum de jobs ouverts par Invoke Data Automation Async pour les vidéos
(Automatisation des données) Nombre maximal de phrases de vocabulaire par bibliothèque	Chaque région prise en charge : 500	Oui	Le nombre maximum de phrases de vocabulaire personnalisées pouvant être configurées par bibliothèque
(Automatisation des données) Fréquence d'échantillonnage audio maximale (Hz)	Chaque région prise en charge : 48 000	Non	Fréquence d'échantillonnage audio maximale
(Automatisation des données) Nombre maximum de plans par projet (Audios)	Par région prise en charge : 1	Non	Le nombre maximum de plans par projet pour les fichiers audio
(Automatisation des données) Nombre maximal de plans par projet (documents)	Chaque Région prise en charge : 40	Non	Le nombre maximum de plans par projet pour les documents
(Automatisation des données) Nombre maximal de plans par projet (images)	Par région prise en charge : 1	Non	Le nombre maximum de plans par projet pour les images
(Automatisation des données) Nombre maximum de plans par projet (vidéos)	Par région prise en charge : 1	Non	Le nombre maximum de plans par projet pour les vidéos
(Automatisation des données) Taille maximale du plan JSON (caractères)	Chaque région prise en charge : 100 000	Non	La taille maximale du JSON en caractères
(Automatisation des données) Niveaux maximaux de hiérarchie des champs	Par région prise en charge : 1	Non	Le niveau de nombre maximal de la hiérarchie des champs
(Automatisation des données) Nombre maximum de pages par document	Chaque Région prise en charge : 3 000	Non	Le nombre maximum de pages par document
(Automatisation des données) Résolution maximale	Chaque région prise en charge : 8 000	Non	La résolution maximale pour les images
(Automatisation des données) Taille maximale du fichier audio (Mo)	Chaque région prise en charge : 2 048	Non	La taille de fichier maximale pour l'audio
(Automatisation des données) Durée audio maximale (minutes)	Chaque région prise en charge : 240	Non	Durée maximale de l'audio en minutes
(Automatisation des données) Taille maximale du fichier de document (Mo)	Chaque région prise en charge : 500	Non	La taille maximale du fichier
(Automatisation des données) Taille maximale du fichier image (Mo)	Chaque région prise en charge : 5	Non	La taille de fichier maximale pour les images
(Automatisation des données) Longueur maximale du champ d'instructions pour le plan audio - (caractères)	Chaque région prise en charge : 500	Oui	La longueur maximale du champ d'instruction pour le plan audio en caractères
(Automatisation des données) Nombre maximal de plans par demande d'inférence de démarrage (Audios)	Par région prise en charge : 1	Non	Le nombre maximum de plans intégrés dans la demande d'inférence Start
(Automatisation des données) Nombre maximal de plans par demande d'inférence de démarrage (documents)	Chaque Région prise en charge : 10	Non	Le nombre maximum de plans intégrés dans la demande d'inférence Start
(Automatisation des données) Nombre maximal de plans par demande d'inférence de démarrage (images)	Par région prise en charge : 1	Non	Le nombre maximum de plans intégrés dans la demande d'inférence Start
(Automatisation des données) Nombre maximal de plans par demande d'inférence de démarrage (vidéos)	Par région prise en charge : 1	Non	Le nombre maximum de plans intégrés dans la demande d'inférence Start
(Automatisation des données) Nombre maximal de champs de liste par plan	Chaque région prise en charge : 15	Non	Le nombre maximum de champs de liste par Blueprint
(Automatisation des données) Taille maximale du fichier vidéo (Mo)	Chaque région prise en charge : 10 240	Non	La taille de fichier maximale pour les vidéos
(Automatisation des données) Durée maximale de la vidéo (minutes)	Chaque région prise en charge : 240	Non	Durée maximale des vidéos en minutes
(Automatisation des données) Fréquence d'échantillonnage audio minimale (Hz)	Chaque région prise en charge : 8 000	Non	Le taux d'échantillonnage audio minimal
(Automatisation des données) Durée audio minimale (millisecondes)	Chaque région prise en charge : 500	Non	Durée minimale du son en millisecondes
(Évaluation) Nombre de tâches d'évaluation automatique de modèles simultanées	Chaque Région prise en charge : 20	Non	Nombre maximal de tâches d'évaluation automatique de modèles que vous pouvez spécifier simultanément dans ce compte dans la région actuelle.
(Évaluation) Nombre de tâches d'évaluation de modèles simultanées faisant appel à des travailleurs humains	Chaque Région prise en charge : 10	Non	Le nombre maximum de tâches d'évaluation de modèles faisant appel à des travailleurs humains peut être spécifié à la fois dans ce compte dans la région actuelle.
(Évaluation) Nombre de métriques personnalisées	Chaque Région prise en charge : 10	Non	Nombre maximal de mesures personnalisées que vous pouvez spécifier dans une tâche d'évaluation de modèle faisant appel à des travailleurs humains.
(Évaluation) Nombre d'ensembles de données instantanés personnalisés dans le cadre d'une tâche d'évaluation de modèles basée sur l'homme	Par région prise en charge : 1	Non	Le nombre maximum de jeux de données d'invite personnalisés que vous pouvez spécifier dans une tâche d'évaluation de modèle basée sur l'homme dans ce compte dans la région actuelle.
(Évaluation) Nombre de jeux de données par tâche	Chaque région prise en charge : 5	Non	Nombre maximal de jeux de données que vous pouvez spécifier dans une tâche d'évaluation de modèle automatisée. Cela inclut les ensembles de données d'invite personnalisés et intégrés.
(Évaluation) Nombre de postes d'évaluation	Chaque région prise en charge : 5 000	Non	Le nombre maximum de tâches d'évaluation de modèles que vous pouvez créer dans ce compte dans la région actuelle.
(Évaluation) Nombre de mesures par ensemble de données	Chaque région prise en charge : 3	Non	Le nombre maximal de mesures que vous pouvez spécifier par ensemble de données dans une tâche d'évaluation automatique de modèle. Cela inclut à la fois des métriques personnalisées et intégrées.
(Évaluation) Nombre de modèles dans un travail d'évaluation de modèles faisant appel à des travailleurs humains	Chaque région prise en charge : 2	Non	Nombre maximal de modèles que vous pouvez spécifier dans une tâche d'évaluation de modèles faisant appel à des travailleurs humains.
(Évaluation) Nombre de modèles dans le travail d'évaluation automatique de modèles	Par région prise en charge : 1	Non	Nombre maximal de modèles que vous pouvez spécifier dans une tâche d'évaluation automatique de modèles.
(Évaluation) Nombre d'invites dans un ensemble de données d'instructions personnalisé	Chaque Région prise en charge : 1 000	Non	Le nombre maximum d'invites qu'un jeu de données d'invite personnalisé peut contenir.
(Évaluation) Taille de l'invite	Chaque Région prise en charge : 4	Non	Taille maximale (en Ko) d'une invite individuelle dans un jeu de données d'invite personnalisé.
(Évaluation) Temps de travail pour les travailleurs	Chaque Région prise en charge : 30	Non	Durée maximale (en jours) dont un travailleur peut disposer pour effectuer des tâches.
(Flux) Nœuds d'agent par flux	Chaque Région prise en charge : 20	Non	Le nombre maximum de nœuds d'agent.
(Flux) Nœuds collecteurs par flux	Par région prise en charge : 1	Non	Le nombre maximum de nœuds collecteurs.
(Flux) Conditionnez les nœuds par flux	Chaque région prise en charge : 5	Non	Le nombre maximum de nœuds de condition.
(Flux) Conditions par nœud de condition	Chaque région prise en charge : 5	Non	Le nombre maximum de conditions par nœud de condition.
(Flux) de CreateFlow demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de CreateFlow demandes par seconde.
(Flux) de CreateFlowAlias demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de CreateFlowAlias demandes par seconde.
(Flux) de CreateFlowVersion demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de CreateFlowVersion demandes par seconde.
(Flux) de DeleteFlow demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de DeleteFlow demandes par seconde.
(Flux) de DeleteFlowAlias demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de DeleteFlowAlias demandes par seconde.
(Flux) de DeleteFlowVersion demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de DeleteFlowVersion demandes par seconde.
(Flux) Alias de flux par flux	Chaque Région prise en charge : 10	Non	Le nombre maximum d'alias de flux.
(Flux) Exécutions de flux par compte	Chaque Région prise en charge : 1 000	Oui	Le nombre maximum d'exécutions de flux par compte.
(Flux) Versions de flux par flux	Chaque Région prise en charge : 10	Non	Le nombre maximum de versions de flux.
(Flux) Flux par compte	Chaque région prise en charge : 100	Oui	Le nombre maximum de flux par compte.
(Flux) de GetFlow demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de GetFlow demandes par seconde.
(Flux) de GetFlowAlias demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de GetFlowAlias demandes par seconde.
(Flux) de GetFlowVersion demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de GetFlowVersion demandes par seconde.
(Flux) Nœuds de code en ligne par flux	Chaque région prise en charge : 5	Non	Le nombre maximum de nœuds de code en ligne par flux.
(Flux) Nœuds d'entrée par flux	Par région prise en charge : 1	Non	Le nombre maximal de nœuds d'entrée de flux.
(Flux) Nœuds d'itérateur par flux	Par région prise en charge : 1	Non	Le nombre maximum de nœuds itérateurs.
(Flux) Nœuds de base de connaissances par flux	Chaque Région prise en charge : 20	Non	Nombre maximal de nœuds de base de connaissances.
(Flux) Nœuds de fonction Lambda par flux	Chaque Région prise en charge : 20	Non	Nombre maximal de nœuds de fonction Lambda.
(Flux) Nœuds Lex par flux	Chaque région prise en charge : 5	Non	Le nombre maximum de nœuds Lex.
(Flux) de ListFlowAliases demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de ListFlowAliases demandes par seconde.
(Flux) de ListFlowVersions demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de ListFlowVersions demandes par seconde.
(Flux) de ListFlows demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de ListFlows demandes par seconde.
(Flux) Nœuds de sortie par flux	Chaque Région prise en charge : 20	Non	Le nombre maximum de nœuds de sortie de flux.
(Flux) de PrepareFlow demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de PrepareFlow demandes par seconde.
(Flux) Nœuds d'invite par flux	Chaque région prise en charge : 20	Oui	Le nombre maximal de nœuds d'invite.
(Flux) Nœuds de récupération S3 par flux	Chaque Région prise en charge : 10	Non	Le nombre maximum de nœuds de récupération S3.
(Flux) Nœuds de stockage S3 par flux	Chaque Région prise en charge : 10	Non	Nombre maximal de nœuds de stockage S3.
(Flux) Nombre total de nœuds par flux	Chaque Région prise en charge : 40	Non	Nombre maximal de nœuds dans un flux.
(Flux) de UpdateFlow demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de UpdateFlow demandes par seconde.
(Flux) de UpdateFlowAlias demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de UpdateFlowAlias demandes par seconde.
(Flux) de ValidateFlowDefinition demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de ValidateFlowDefinition demandes par seconde.
(Rambardes) Politiques de raisonnement automatisées par garde-corps	Chaque région prise en charge : 2	Non	Le nombre maximum de politiques de raisonnement automatisé par garde-corps.
(Guardrails) Politique de contenu Taille de saisie maximale en unités de texte (niveau classique)	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 1 000 ap-northeast-2 : 1 000 ap-south-1 : 1 000 ap-southeast-1 : 1 000 ap-southeast-2 : 1 000 eu-central-1 : 1 000 eu-south-1 : 25 eu-west-3 : 25 sa-east-1 : 25 Chacune des autres régions prises en charge : 106	Oui	Taille maximale du texte saisi, mesurée en unités de texte, qui peut être traitée pour les filtres de contenu. Bien que cette limite s'applique au niveau classique, nous vous recommandons de migrer vers le niveau standard en raison de sa robustesse supérieure, de ses fonctionnalités supplémentaires et de son support multilingue.
(Guardrails) Politique de contenu Taille d'entrée maximale en unités de texte (niveau standard - recommandé)	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 500 ap-northeast-2 : 1 000 ap-south-1 : 500 ap-southeast-1 : 1 000 ap-southeast-2 : 400 eu-central-1 : 500 eu-south-1 : 25 eu-west-3 : 25 Chacune des autres régions prises en charge : 106	Oui	Taille maximale du texte saisi, mesurée en unités de texte, qui peut être traitée pour les filtres de contenu. Cela s'applique au niveau standard, qui est recommandé.
(Guardrails) Politique de base contextuelle Taille d'entrée maximale en unités de texte	Chaque région prise en charge : 106	Oui	La taille maximale du texte saisi, mesurée en unités de texte, qui peut être traitée par les politiques de base contextuelles
(Guardrails) Longueur de la requête contextuelle en unités de texte	Par région prise en charge : 1	Non	Longueur maximale, en unités de texte, de la requête pour la base contextuelle
(Garde-corps) Longueur de la réponse contextuelle de mise à la terre en unités de texte	Chaque région prise en charge : 5	Non	Longueur maximale, en unités de texte, de la réponse pour un ancrage contextuel
(Garde-corps) Longueur de la source contextuelle de mise à la base en unités de texte	us-east-1 : 100 us-west-2 : 100 Chacune des autres régions prises en charge : 50	Non	Longueur maximale, en unités de texte, de la source de mise à la terre pour la mise à la terre contextuelle
(Guardrails) Exemples de phrases par sujet	Chaque région prise en charge : 5	Non	Le nombre maximum d'exemples de sujets pouvant être inclus par sujet
(Rambardes) Rambardes par compte	Chaque région prise en charge : 100	Non	Le nombre maximum de barrières de sécurité sur un compte
(Guardrails) Politique de filtrage On-demand ApplyGuardrail du contenu, unités de texte, taux de rafale (niveau classique)	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 1 000 ap-northeast-2 : 1 000 ap-south-1 : 1 000 ap-southeast-1 : 1 000 ap-southeast-2 : 1 000 eu-central-1 : 1 000 Chacune des autres régions prises en charge : 25	Non	Nombre maximal d'unités de texte par rafale pouvant être traitées pour les filtres de contenu. Bien que cette limite s'applique au niveau classique, nous vous recommandons de migrer vers le niveau standard en raison de sa robustesse supérieure, de ses fonctionnalités supplémentaires et de son support multilingue.
(Guardrails) Politique de filtrage de On-demand ApplyGuardrail contenu, taux de rafale des unités de texte (niveau standard, recommandé)	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 500 ap-northeast-2 : 1 000 ap-south-1 : 500 ap-southeast-1 : 1 000 ap-southeast-2 : 400 eu-central-1 : 500 Chacune des autres régions prises en charge : 25	Non	Nombre maximal d'unités de texte par rafale pouvant être traitées pour les filtres de contenu. Cela s'applique au niveau standard, qui est recommandé.
(Guardrails) Politique de filtrage de On-demand ApplyGuardrail contenu, unités de texte par seconde (niveau classique)	us-east-1 : 200 us-west-2 : 200 Chacune des autres régions prises en charge : 25	Oui	Nombre maximal d'unités de texte par seconde pouvant être traitées pour les filtres de contenu. Bien que cette limite s'applique au niveau classique, nous vous recommandons de migrer vers le niveau standard en raison de sa robustesse supérieure, de ses fonctionnalités supplémentaires et de son support multilingue.
(Guardrails) Politique de filtrage de On-demand ApplyGuardrail contenu, unités de texte par seconde (niveau standard, recommandé)	us-east-1 : 200 us-east-2 : 200 us-west-1 : 200 us-west-2 : 200 ap-northeast-1 : 50 ap-northeast-2 : 100 ap-south-1 : 50 ap-southeast-1 : 100 eu-central-1 : 50 Chacune des autres régions prises en charge : 25	Oui	Nombre maximal d'unités de texte par seconde pouvant être traitées pour les filtres de contenu. Cela s'applique au niveau standard, qui est recommandé.
(Guardrails) Politique relative aux sujets On-demand ApplyGuardrail refusés, taux d'explosion des unités de texte (niveau classique)	us-east-1 : 200 us-west-2 : 200 Chacune des autres régions prises en charge : 25	Non	Nombre maximal d'unités de texte pouvant être traitées par rafale pour les sujets refusés. Bien que cette limite s'applique au niveau classique, nous vous recommandons de migrer vers le niveau standard en raison de sa robustesse supérieure, de ses fonctionnalités supplémentaires et de son support multilingue.
(Guardrails) Taux d'explosion des unités de texte de la politique de On-demand ApplyGuardrail refus (niveau standard - recommandé)	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 500 ap-northeast-2 : 1 000 ap-south-1 : 500 ap-southeast-1 : 1 000 ap-southeast-2 : 400 eu-central-1 : 500 Chacune des autres régions prises en charge : 25	Non	Nombre maximal d'unités de texte pouvant être traitées par rafale pour les sujets refusés. Cela s'applique au niveau standard, qui est recommandé.
(Guardrails) Unités de texte de politique thématique On-demand ApplyGuardrail refusées par seconde (niveau classique)	us-east-1 : 50 us-west-2 : 50 Chacune des autres régions prises en charge : 25	Oui	Nombre maximal d'unités de texte pouvant être traitées par seconde pour les sujets refusés. Bien que cette limite s'applique au niveau classique, nous vous recommandons de migrer vers le niveau standard en raison de sa robustesse supérieure, de ses fonctionnalités supplémentaires et de son support multilingue.
(Guardrails) Unités de texte de politique thématique On-demand ApplyGuardrail refusées par seconde (niveau standard - recommandé)	us-east-1 : 200 us-west-2 : 200 Chacune des autres régions prises en charge : 25	Oui	Nombre maximal d'unités de texte pouvant être traitées par seconde pour les sujets refusés. Cela s'applique au niveau standard, qui est recommandé.
(Guardrails) Politique de filtrage des informations On-demand ApplyGuardrail sensibles, unités de texte, taux de rafale	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 1 000 ap-northeast-2 : 1 000 ap-south-1 : 1 000 ap-southeast-1 : 1 000 ap-southeast-2 : 1 000 eu-central-1 : 1 000 Chacune des autres régions prises en charge : 25	Non	Nombre maximal d'unités de texte pouvant être traitées par rafale pour les filtres d'informations sensibles.
(Guardrails) Politique de filtrage des informations On-demand ApplyGuardrail sensibles, unités de texte par seconde	us-east-1 : 500 us-east-2 : 100 us-west-1 : 50 us-west-2 : 500 ap-northeast-1 : 500 ap-northeast-2 : 100 ap-south-1 : 200 ap-southeast-1 : 100 ca-central-1 : 250 eu-central-1 : 500 Chacune des autres régions prises en charge : 25	Oui	Nombre maximal d'unités de texte par seconde pouvant être traitées pour les filtres d'informations sensibles.
(Guardrails) Politique de filtrage des On-demand ApplyGuardrail mots, unités de texte, taux de rafale	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 1 000 ap-northeast-2 : 1 000 ap-south-1 : 1 000 ap-southeast-1 : 1 000 ap-southeast-2 : 1 000 eu-central-1 : 1 000 Chacune des autres régions prises en charge : 25	Non	Nombre maximal d'unités de texte pouvant être traitées par rafale pour les filtres de texte.
(Guardrails) Politique de filtrage des On-demand ApplyGuardrail mots, unités de texte par seconde	us-east-1 : 500 us-east-2 : 500 us-west-1 : 500 us-west-2 : 500 ap-northeast-1 : 500 ap-northeast-2 : 500 ap-south-1 : 500 ap-southeast-1 : 500 eu-central-1 : 500 Chacune des autres régions prises en charge : 25	Oui	Nombre maximal d'unités de texte par seconde pouvant être traitées pour les filtres de mots.
(Guardrails) politique d'ancrage On-demand ApplyGuardrail contextuel, unités de texte, taux d'éclatement	Chaque région prise en charge : 106	Non	Nombre maximal d'unités de texte pouvant être traitées par rafale à des fins d'ancrage contextuel.
(Guardrails) unités de texte de la politique d'ancrage On-demand ApplyGuardrail contextuelle par seconde	Chaque région prise en charge : 106	Oui	Nombre maximal d'unités de texte par seconde pouvant être traitées à des fins de mise à la base contextuelle.
(Guardrails) On-demand ApplyGuardrail demande un taux de rafale	us-east-1 : 100 us-east-2 : 100 us-west-1 : 100 us-west-2 : 100 ap-northeast-1 : 100 ap-northeast-2 : 100 ap-south-1 : 100 ap-southeast-1 : 100 eu-central-1 : 100 Chacune des autres régions prises en charge : 25	Non	Nombre maximal d'appels d' ApplyGuardrail API que vous pouvez envoyer en une seule rafale.
On-demand ApplyGuardrail Demandes (Guardrails) par seconde	us-east-1 : 100 us-east-2 : 100 us-west-1 : 100 us-west-2 : 100 ap-northeast-1 : 100 ap-northeast-2 : 100 ap-south-1 : 100 ap-southeast-1 : 100 eu-central-1 : 100 Chacune des autres régions prises en charge : 25	Oui	Le nombre maximum d'appels d' ApplyGuardrail API autorisés par seconde
(Guardrails) On-demand InvokeGuardrailChecks demande un taux de rafale	Chaque région prise en charge : 1 500	Non	Le nombre maximum d'appels d' InvokeGuardrailChecks API que vous pouvez envoyer en une seule rafale
(Rambardes) On-demand InvokeGuardrailChecks demandes par minute	Chaque région prise en charge : 1 500	Oui	Le nombre maximum d'appels d' InvokeGuardrailChecks API autorisés par minute
(Guardrails) Entités Regex dans le filtre d'informations sensibles	Chaque Région prise en charge : 30	Non	Le nombre maximum d'expressions régulières du filtre de garde-corps pouvant être incluses dans une politique relative aux informations sensibles
(Guardrails) Longueur de la regex en caractères	Chaque région prise en charge : 500	Non	La longueur maximale, en caractères, d'une expression régulière d'un filtre de garde-corps
(Guardrails) Politique relative aux informations sensibles Taille de saisie maximale en unités de texte	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 1 000 ap-northeast-2 : 1 000 ap-south-1 : 1 000 ap-southeast-1 : 1 000 ap-southeast-2 : 1 000 eu-central-1 : 1 000 Chacune des autres régions prises en charge : 106	Oui	La taille maximale du texte saisi, mesurée en unités de texte, qui peut être traitée par les politiques de filtrage des informations sensibles
(Guardrails) Politique thématique Taille de saisie maximale en unités de texte (niveau classique)	us-east-1 : 200 us-west-2 : 200 ap-southeast-1 : 25 eu-south-1 : 25 eu-west-3 : 25 sa-east-1 : 25 Chacune des autres régions prises en charge : 106	Oui	Taille maximale du texte saisi, mesurée en unités de texte, qui peut être traitée pour les sujets refusés. Bien que cette limite s'applique au niveau classique, nous vous recommandons de migrer vers le niveau standard en raison de sa robustesse supérieure, de ses fonctionnalités supplémentaires et de son support multilingue.
(Guardrails) Politique thématique Taille de saisie maximale en unités de texte (niveau standard - recommandé)	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 500 ap-northeast-2 : 1 000 ap-south-1 : 500 ap-southeast-1 : 1 000 ap-southeast-2 : 400 eu-central-1 : 500 eu-south-1 : 25 eu-west-3 : 25 Chacune des autres régions prises en charge : 106	Oui	Taille maximale du texte saisi, mesurée en unités de texte, qui peut être traitée pour les sujets refusés. Cela s'applique au niveau standard, qui est recommandé.
(Rambardes) Sujets par rambarde	Chaque Région prise en charge : 30	Non	Le nombre maximum de sujets pouvant être définis dans les politiques relatives aux sujets de Guardrail
(Rambardes) Versions par garde-corps	Chaque Région prise en charge : 20	Non	Le nombre maximum de versions qu'un garde-corps peut avoir
(Rambardes) Longueur du mot en caractères	Chaque région prise en charge : 100	Non	Longueur maximale d'un mot, en caractères, dans une liste de mots bloqués
(Guardrails) Politique Word Taille de saisie maximale en unités de texte	us-east-1 : 1 000 us-east-2 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 1 000 ap-northeast-2 : 1 000 ap-south-1 : 1 000 ap-southeast-1 : 1 000 ap-southeast-2 : 1 000 eu-central-1 : 1 000 Chacune des autres régions prises en charge : 106	Oui	La taille maximale du texte saisi, mesurée en unités de texte, qui peut être traitée par les politiques de filtrage de Word
(Guardrails) Politique mot par mot	Chaque région prise en charge : 10 000	Non	Le nombre maximum de mots pouvant être inclus dans une liste de mots bloqués
(Bases de connaissances) Concurrent IngestKnowledgeBaseDocuments et DeleteKnowledgeBaseDocuments demandes par compte	Chaque Région prise en charge : 10	Non	Le nombre maximum IngestKnowledgeBaseDocuments de DeleteKnowledgeBaseDocuments demandes pouvant être exécutées simultanément sur un compte.
(Bases de connaissances) Tâches d'ingestion simultanées par compte	Chaque région prise en charge : 5	Non	Nombre maximal de tâches d'ingestion pouvant être exécutées simultanément sur un compte.
(Bases de connaissances) Tâches d'ingestion simultanées par source de données	Par région prise en charge : 1	Non	Nombre maximal de tâches d'ingestion pouvant être exécutées simultanément pour une source de données.
(Bases de connaissances) Tâches d'ingestion simultanées par base de connaissances	Par région prise en charge : 1	Non	Nombre maximal de tâches d'ingestion pouvant être exécutées simultanément pour une base de connaissances.
CreateDataSource Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' CreateDataSource API par seconde.
CreateKnowledgeBase Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' CreateKnowledgeBase API par seconde.
(Bases de connaissances) Sources de données par base de connaissances	Chaque région prise en charge : 5	Non	Le nombre maximum de sources de données par base de connaissances.
DeleteDataSource Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' DeleteDataSource API par seconde.
DeleteKnowledgeBase Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' DeleteKnowledgeBase API par seconde.
DeleteKnowledgeBaseDocuments Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 5	Non	Le nombre maximum de demandes d' DeleteKnowledgeBaseDocuments API par seconde.
(Bases de connaissances) Fichiers à ajouter ou à mettre à jour par tâche d'ingestion	Chaque région prise en charge : 5 000 000	Non	Nombre maximal de fichiers nouveaux et mis à jour pouvant être ingérés par tâche d'ingestion.
(Bases de connaissances) Fichiers à supprimer par tâche d'ingestion	Chaque région prise en charge : 5 000 000	Non	Nombre maximal de fichiers pouvant être supprimés par tâche d'ingestion.
(Bases de connaissances) Fichiers à ingérer par IngestKnowledgeBaseDocuments tâche.	Chaque région prise en charge : 25	Non	Le nombre maximum de documents pouvant être ingérés par IngestKnowledgeBaseDocuments demande.
GenerateQuery Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' GenerateQuery API par seconde.
GetDataSource Demandes (bases de connaissances) par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' GetDataSource API par seconde.
GetIngestionJob Demandes (bases de connaissances) par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' GetIngestionJob API par seconde.
GetKnowledgeBase Demandes (bases de connaissances) par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' GetKnowledgeBase API par seconde.
GetKnowledgeBaseDocuments Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 5	Non	Le nombre maximum de demandes d' GetKnowledgeBaseDocuments API par seconde.
IngestKnowledgeBaseDocuments Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 5	Non	Le nombre maximum de demandes d' IngestKnowledgeBaseDocuments API par seconde.
(Bases de connaissances) taille IngestKnowledgeBaseDocuments totale de la charge utile	Chaque région prise en charge : 6	Non	La taille maximale (en Mo) de la charge utile totale d'une IngestKnowledgeBaseDocuments demande.
(Bases de connaissances) Taille du fichier de tâche d'ingestion avec contenu texte	Chaque région prise en charge : 50	Non	Taille maximale (en Mo) d'un fichier contenant du texte (tel que des fichiers .txt, .pdf ou .docx) dans une tâche d'ingestion.
(Bases de connaissances) Taille de la tâche d'ingestion	Chaque région prise en charge : 100	Non	Taille maximale (en Go) d'une tâche d'ingestion.
(Bases de connaissances) Bases de connaissances par compte	Chaque région prise en charge : 100	Non	Le nombre maximum de bases de connaissances par compte.
ListDataSources Demandes (bases de connaissances) par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' ListDataSources API par seconde.
ListIngestionJobs Demandes (bases de connaissances) par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' ListIngestionJobs API par seconde.
ListKnowledgeBaseDocuments Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 5	Non	Le nombre maximum de demandes d' ListKnowledgeBaseDocuments API par seconde.
ListKnowledgeBases Demandes (bases de connaissances) par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' ListKnowledgeBases API par seconde.
(Bases de connaissances) Nombre maximum de fichiers pour l'analyseur BDA	Chaque Région prise en charge : 1 000	Non	Le nombre maximum de fichiers pouvant être utilisés avec Amazon Bedrock Data Automation en tant qu'analyseur.
(Bases de connaissances) Nombre maximum de fichiers pour Foundation Models en tant qu'analyseur	Chaque Région prise en charge : 1 000	Non	Nombre maximal de fichiers pouvant être utilisés avec Foundation Models en tant qu'analyseur syntaxique.
(Bases de connaissances) Nombre de demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d'API RDE par seconde.
(Bases de connaissances) Récupérez les demandes par seconde	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes d'API Retrieve par seconde.
RetrieveAndGenerate Demandes (bases de connaissances) par seconde	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes d' RetrieveAndGenerate API par seconde.
RetrieveAndGenerateStream Demandes (bases de connaissances) par seconde	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes d' RetrieveAndGenerateStream API par seconde.
StartIngestionJob Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 0,1	Non	Le nombre maximum de demandes d' StartIngestionJob API par seconde.
UpdateDataSource Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' UpdateDataSource API par seconde.
UpdateKnowledgeBase Demandes (bases de connaissances) par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' UpdateKnowledgeBase API par seconde.
(Bases de connaissances) Taille de la requête utilisateur	Chaque Région prise en charge : 1 000	Non	Taille maximale (en caractères) d'une requête utilisateur.
(bases de connaissances gérées) AgenticRetrieveStream demandes par seconde et par compte	Par région prise en charge : 1	Non	Le nombre maximum de demandes d' AgenticRetrieveStream API par seconde et par compte pour les KB gérés.
Taille de la requête AgenticRetrieveStream utilisateur (bases de connaissances gérées)	Chaque région prise en charge : 10 000	Non	Taille maximale (en caractères) d'une requête utilisateur AgenticRetrieveStream pour des KB gérés.
(Bases de connaissances gérées) Tâches d'ingestion simultanées par base de connaissances	Chaque région prise en charge : 50	Non	Le nombre maximum de tâches d'ingestion simultanées par Ko géré.
(Bases de connaissances gérées) Sources de données par base de connaissances	Chaque région prise en charge : 200	Non	Nombre maximal de sources de données par Ko géré.
(bases de connaissances gérées) DeleteKnowledgeBaseDocuments demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' DeleteKnowledgeBaseDocuments API par seconde pour les KB gérés.
(bases de connaissances gérées) DeleteResourcePolicy demandes par seconde	Chaque région prise en charge : 5	Non	Le nombre maximum de demandes d' DeleteResourcePolicy API par seconde pour les KB gérés.
(Bases de connaissances gérées) Fichiers à ingérer par demande IngestKnowledgeBaseDocuments	Chaque Région prise en charge : 10	Non	Le nombre maximum de fichiers à ingérer par demande d' IngestKnowledgeBaseDocuments API pour Managed KB.
(bases de connaissances gérées) GetDocumentContent demandes par seconde et par compte	Chaque région prise en charge : 100	Non	Le nombre maximum de demandes d' GetDocumentContent API par seconde et par compte.
(bases de connaissances gérées) GetDocumentContent demandes par seconde et par base de connaissances	Chaque région prise en charge : 5	Non	Le nombre maximal de demandes d' GetDocumentContent API par seconde et par Ko géré.
(bases de connaissances gérées) GetResourcePolicy demandes par seconde	Chaque région prise en charge : 5	Non	Le nombre maximum de demandes d' GetResourcePolicy API par seconde pour les KB gérés.
(Bases de connaissances gérées) Taille du texte extrait du fichier individuel (Mo)	Chaque Région prise en charge : 30	Non	Taille maximale (en Mo) du texte extrait d'un seul fichier pour les KB gérés.
(bases de connaissances gérées) IngestKnowledgeBaseDocuments demandes par seconde	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes d' IngestKnowledgeBaseDocuments API par seconde pour les KB gérés.
(Bases de connaissances gérées) Bases de connaissances par compte	Chaque Région prise en charge : 1 000	Non	Le nombre maximum de Ko gérés par compte.
(bases de connaissances gérées) ListKnowledgeBaseDocuments demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' ListKnowledgeBaseDocuments API par seconde pour les KB gérés.
(bases de connaissances gérées) PutResourcePolicy demandes par seconde	Chaque région prise en charge : 5	Non	Le nombre maximum de demandes d' PutResourcePolicy API par seconde pour les KB gérés.
(Bases de connaissances gérées) Récupérez les demandes par seconde et par compte	Chaque région prise en charge : 100	Non	Le nombre maximum de demandes d'API Retrieve par seconde et par compte pour les KB gérés.
(Bases de connaissances gérées) Récupérez les demandes par seconde et par base de connaissances	Chaque région prise en charge : 5	Non	Le nombre maximal de demandes d'API Retrieve par seconde et par Ko géré.
(Bases de connaissances gérées) Récupérer la taille de la requête utilisateur	Chaque région prise en charge : 10 000	Non	Taille maximale (en caractères) d'une requête utilisateur pour Retrieve for Managed KB.
(Bases de connaissances gérées) Taille totale du stockage par base de connaissances (To)	Chaque Région prise en charge : 10	Non	Taille de stockage totale maximale (en To) par Ko géré.
(Personnalisation du modèle) Modèles personnalisés par compte	Chaque région prise en charge : 100	Oui	Le nombre maximum de modèles personnalisés dans un compte.
(Personnalisation du modèle) Déploiements de modèles In-progress personnalisés	Chaque région prise en charge : 2	Oui	Le nombre maximum de déploiements de modèles personnalisés en cours
(Personnalisation du modèle) Taille maximale du fichier d'entrée pour les tâches de personnalisation de distillation	Chaque région prise en charge : 2 gigaoctets	Non	Taille maximale du fichier d'entrée pour les tâches de personnalisation de la distillation.
(Personnalisation du modèle) Longueur de ligne maximale pour les tâches de personnalisation de distillation	Chaque région prise en charge : 16 kilo-octets	Non	Longueur de ligne maximale dans le fichier d'entrée pour les tâches de personnalisation de la distillation.
(Personnalisation du modèle) Nombre maximum d'instructions pour les tâches de personnalisation de distillation	Chaque région prise en charge : 15 000	Non	Le nombre maximum d'instructions requises pour les tâches de personnalisation de la distillation.
(Personnalisation du modèle) Nombre maximum d'enregistrements de formation pour une Fine-tuning tâche Amazon Nova Canvas	Chaque région prise en charge : 10 000	Oui	Le nombre maximum d'enregistrements autorisés pour une Fine-tuning tâche Amazon Nova Canvas.
(Personnalisation du modèle) Longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Amazon Nova Micro V1	Chaque région prise en charge : 32 000	Non	Longueur maximale du contexte de réglage précis du modèle étudiant pour les tâches de personnalisation de distillation Amazon Nova Micro V1.
(Personnalisation du modèle) Longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Amazon Nova V1	Chaque région prise en charge : 32 000	Non	Longueur maximale du contexte de réglage précis du modèle étudiant pour les tâches de personnalisation de distillation Amazon Nova V1.
(Personnalisation du modèle) Longueur maximale du contexte de réglage du modèle étudiant pour les tâches de personnalisation de distillation Anthropic Claude 3 haiku 20240307 V1	Chaque région prise en charge : 32 000	Non	La longueur maximale du contexte de réglage du modèle étudiant pour les tâches de personnalisation de distillation d'Anthropic Claude 3 haiku 20240307 V1.
(Personnalisation du modèle) Longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Llama 3.1 70B Instruct V1	Chaque région prise en charge : 16 000	Non	La longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Llama 3.1 70B Instruct V1.
(Personnalisation du modèle) Longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Llama 3.1 8B Instruct V1	Chaque région prise en charge : 32 000	Non	La longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Llama 3.1 8B Instruct V1.
(Personnalisation du modèle) Nombre minimal de demandes pour les tâches de personnalisation de distillation	Chaque région prise en charge : 100	Non	Le nombre minimum d'invites requis pour les tâches de personnalisation de la distillation.
(Personnalisation du modèle) Tâches de personnalisation planifiées	Chaque Région prise en charge : 10	Non	Le nombre maximum de tâches de personnalisation planifiées.
(Personnalisation du modèle) Somme des demandes de déploiement de modèles personnalisés à la demande par minute pour Amazon Nova 2 Lite	Chaque Région prise en charge : 2 000	Non	La somme des demandes de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumises à Converse ConverseStream, InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova 2 Lite
(Personnalisation du modèle) Somme des demandes de déploiement de modèles personnalisés à la demande par minute pour Amazon Nova Lite	Chaque Région prise en charge : 2 000	Non	La somme des demandes de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumises à Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova Lite
(Personnalisation du modèle) Somme des demandes de déploiement de modèles personnalisés à la demande par minute pour Amazon Nova Micro	Chaque Région prise en charge : 2 000	Non	La somme des demandes de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumises à Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova Micro
(Personnalisation du modèle) Somme des demandes de déploiement de modèles personnalisés à la demande par minute pour Amazon Nova Pro	Chaque région prise en charge : 200	Non	La somme des demandes de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumises à Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova Pro
(Personnalisation du modèle) Somme des demandes de déploiement de modèles personnalisés à la demande par minute pour Meta Llama 3.3 70B Instruct	Chaque région prise en charge : 400	Non	La somme des demandes de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumises à Converse, ConverseStream InvokeModel, et des InvokeModelWithResponseStream actions pour Meta Llama 3.3 70B Instruct
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par jour pour Amazon Nova 2 Lite	Chaque région prise en charge : 5 760 000 000	Non	La somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie envoyés par jour à Converse ConverseStream, InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova 2 Lite
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par jour pour Amazon Nova Lite	Chaque région prise en charge : 5 760 000 000	Non	La somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie envoyés par jour à Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova Lite
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par jour pour Amazon Nova Micro	Chaque région prise en charge : 5 760 000 000	Non	La somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie envoyés par jour à Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova Micro
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par jour pour Amazon Nova Pro	Chaque région prise en charge : 1 152 000 000	Non	La somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie envoyés par jour à Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova Pro
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par jour pour Meta Llama 3.3 70B Instruct	Chaque région prise en charge : 432 000 000	Non	La somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie par jour soumis à Converse, ConverseStream InvokeModel, et les InvokeModelWithResponseStream actions pour Meta Llama 3.3 70B Instruct
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par minute pour Amazon Nova 2 Lite	Chaque région prise en charge : 4 000 000	Non	La somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumis à Converse ConverseStream, InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova 2 Lite
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par minute pour Amazon Nova Lite	Chaque région prise en charge : 4 000 000	Non	La somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumis à Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova Lite
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par minute pour Amazon Nova Micro	Chaque région prise en charge : 4 000 000	Non	Somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumis à Converse ConverseStream, InvokeModel, et InvokeModelWithResponseStream actions pour Amazon Nova Micro
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par minute pour Amazon Nova Pro	Chaque région prise en charge : 800 000	Non	La somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumis à Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream les actions pour Amazon Nova Pro
(Personnalisation du modèle) Somme des jetons de déploiement de modèles personnalisés à la demande par minute pour Meta Llama 3.3 70B Instruct	Chaque région prise en charge : 300 000	Non	La somme des jetons de déploiement de modèles personnalisés à la demande en entrée et en sortie par minute soumis à Converse, ConverseStream InvokeModel, et des InvokeModelWithResponseStream actions pour Meta Llama 3.3 70B Instruct
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une Fine-tuning tâche Amazon Nova 2 Lite	Chaque Région prise en charge : 20 000	Oui	Nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Fine-tuning tâche Amazon Nova 2 Lite.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une Fine-tuning tâche Amazon Nova Lite	Chaque Région prise en charge : 20 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Fine-tuning tâche Amazon Nova Lite.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une Fine-tuning tâche Amazon Nova Micro	Chaque Région prise en charge : 20 000	Oui	Nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Fine-tuning tâche Amazon Nova Micro.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une Fine-tuning tâche Amazon Nova Pro	Chaque Région prise en charge : 20 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Fine-tuning tâche Amazon Nova Pro.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Claude 3 Haiku v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné de dossiers de formation et de validation autorisés pour un Fine-tuning travail de haïku Claude 3.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Claude 3-5-Haiku v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximum combiné de dossiers de formation et de validation autorisés pour un travail de type Claude 3-5-Haiku Fine-tuning .
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Meta Llama 2 13B v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche Meta Llama 2 13B Fine-tuning .
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Meta Llama 2 70B v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche Meta Llama 2 70B Fine-tuning .
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Meta Llama 3.1 70B Instruct v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche Meta Llama 3.1 70B Fine-tuning Instruct.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Meta Llama 3.1 8B Instruct v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche Meta Llama 3.1 8B Fine-tuning Instruct.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Meta Llama 3.2 11B Instruct v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche Meta Llama 3.2 11B Fine-tuning Instruct.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Meta Llama 3.2 1B Instruct v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche Meta Llama 3.2 1B Instruct. Fine-tuning
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Meta Llama 3.2 3B Instruct v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche Meta Llama 3.2 3B Instruct. Fine-tuning
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Meta Llama 3.2 90B Instruct v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche Meta Llama 3.2 90B Fine-tuning Instruct.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Meta Llama 3.3 70B Instruct v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche Meta Llama 3.3 70B Fine-tuning Instruct.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Titan Image Generator G1 Fine-tuning V1	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Fine-tuning tâche Titan Image Generator.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Titan Image Generator G1 V2 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Fine-tuning tâche Titan Image Generator V2.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Titan Multimodal Embeddings G1 v1 Fine-tuning	Chaque région prise en charge : 50 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de Titan Multimodal Embeddings Fine-tuning .
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour un Titan Text G1 - Express v1 Travail continu Pre-Training	Chaque région prise en charge : 100 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Pre-Training tâche Titan Text Express Continued.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Titan Text G1 - Express v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Fine-tuning tâche Titan Text Express.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour un Titan Text G1 - Lite v1 Travail continu Pre-Training	Chaque région prise en charge : 100 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Pre-Training tâche Titan Text Lite Continued.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche Titan Text G1 - Lite v1 Fine-tuning	Chaque région prise en charge : 10 000	Oui	Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une Fine-tuning tâche Titan Text Lite.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche Titan Text G1 - Premier v1 Fine-tuning	Chaque Région prise en charge : 20 000	Oui	Le nombre maximal combiné de dossiers de formation et de validation autorisés pour une Fine-tuning tâche dans Titan Text Premier.
(Personnalisation du modèle) Nombre total de déploiements de modèles personnalisés	Par région prise en charge : 10	Oui	Nombre total de déploiements de modèles personnalisés
(Gestion rapide) CreatePrompt demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de CreatePrompt demandes par seconde.
(Gestion rapide) CreatePromptVersion demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de CreatePromptVersion demandes par seconde.
(Gestion rapide) DeletePrompt demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de DeletePrompt demandes par seconde.
(Gestion rapide) GetPrompt demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de GetPrompt demandes par seconde.
(Gestion rapide) ListPrompts demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de ListPrompts demandes par seconde.
(Gestion rapide) Invites par compte	Chaque région prise en charge : 500	Oui	Le nombre maximum d'invites.
(Gestion rapide) UpdatePrompt demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de UpdatePrompt demandes par seconde.
(Gestion rapide) Versions par invite	Chaque Région prise en charge : 10	Non	Le nombre maximum de versions par invite.
API par agent	Chaque région prise en charge : 11	Oui	Le nombre maximum d'API que vous pouvez ajouter à un agent.
Groupes d’actions par agent	Chaque région prise en charge : 20	Oui	Nombre maximal de groupes d'actions que vous pouvez ajouter à un agent.
Agents collaborateurs par agent	Chaque Région prise en charge : 1 000	Oui	Le nombre maximum d'agents collaborateurs que vous pouvez ajouter à un agent.
Agents par compte	Chaque Région prise en charge : 1 000	Oui	Le nombre maximum d'agents dans un compte.
AssociateAgentKnowledgeBase demandes par seconde	Chaque région prise en charge : 6	Non	Le nombre maximum de demandes d' AssociateAgentKnowledgeBase API par seconde.
Alias associés par agent	Chaque Région prise en charge : 10	Non	Le nombre maximum d'alias que vous pouvez associer à un agent.
Bases de connaissances associées par agent	Chaque région prise en charge : 2	Oui	Le nombre maximum de bases de connaissances que vous pouvez associer à un agent.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Amazon Nova 2 Multimodal Embeddings V1	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Amazon Nova 2 Multimodal Embeddings V1.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Amazon Nova Premier	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Amazon Nova Premier.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3 Haiku	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Claude 3 Haiku.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3 Opus	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude 3 Opus.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3 Sonnet	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude 3 Sonnet.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3.5 Haiku	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Claude 3.5 Haiku.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3.5 Sonnet	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude 3.5 Sonnet.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3.5 Sonnet v2	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude 3.5 Sonnet v2.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3.7 Sonnet	Par région prise en charge : 1	Oui	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude 3.7 Sonnet.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude Haiku 4.5	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude Haiku 4.5.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude Opus 4.5	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude Opus 4.5.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude Opus 4.6	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude Opus 4.6.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude Sonnet 4	Par région prise en charge : 1	Oui	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude Sonnet 4.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude Sonnet 4.5	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude Sonnet 4.5.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude Sonnet 4.6	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude Sonnet 4.6.
Taille du fichier d'entrée d'inférence par lots (en Go) pour DeepSeek V3.2	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour DeepSeek V3.2.
Taille du fichier d'entrée d'inférence par lots (en Go) pour v3 DeepSeek	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour la DeepSeek version 3.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Devstral 2 123B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Devstral 2 123B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour GLM 4.7	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour GLM 4.7.
Taille du fichier d'entrée d'inférence par lots (en Go) pour GLM 4.7 Flash	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour GLM 4.7 Flash.
Taille du fichier d'entrée d'inférence par lots (en Go) pour GLM 5	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour GLM 5.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Gemma 3 12B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Gemma 3 12B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Gemma 3 27B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Gemma 3 27B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Gemma 3 4B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Gemma 3 4B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Kimi K2 Thinking	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Kimi K2 Thinking.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Kimi K2.5	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Kimi K2.5.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.1 405B Instruct	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.1 405B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.1 70B Instruct	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.1 70B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.1 8B Instruct	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.1 8B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.2 11B Instruct	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.2 11B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.2 1B Instruct	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots Llama 3.2 1B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.2 3B Instruct	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.2 3B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.2 90B Instruct	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.2 90B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.3 70B Instruct	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.3 70B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 4 Maverick	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 4 Maverick.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 4 Scout	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Llama 4 Scout.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Magistral Small 2509	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Magistral Small 2509.
Taille du fichier d'entrée d'inférence par lots (en Go) pour M2 MiniMax	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour MiniMax M2.
Taille du fichier d'entrée d'inférence par lots (en Go) pour MiniMax M2.1	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour MiniMax M2.1.
Taille du fichier d'entrée d'inférence par lots (en Go) pour MiniMax M2.5	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour MiniMax M2.5.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Ministral 3 14B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Ministral 3 14B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Ministral 3 8B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Ministral 3 8B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Ministral 3B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Ministral 3B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Mistral Large 2 (24.07)	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Mistral Large 2 (24,07).
Taille du fichier d'entrée d'inférence par lots (en Go) pour Mistral Large 3	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Mistral Large 3.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Mistral Small	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Mistral Small.
Taille du fichier d'entrée d'inférence par lots (en Go) pour NVIDIA Nemotron 3 Super 120B A12B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour NVIDIA Nemotron 3 Super 120B A12B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour NVIDIA Nemotron Nano 12B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour NVIDIA Nemotron Nano 12B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour NVIDIA Nemotron Nano 3 30B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour NVIDIA Nemotron Nano 3 30B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour NVIDIA Nemotron Nano 9B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour NVIDIA Nemotron Nano 9B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Nova 2 Lite	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Nova 2 Lite.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Nova Lite V1	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Nova Lite V1.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Nova Micro V1	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Nova Micro V1.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Nova Pro V1	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Nova Pro V1.
Taille du fichier d'entrée d'inférence par lots (en Go) pour OpenAI GPT OSS 120b	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour OpenAI GPT OSS 120b.
Taille du fichier d'entrée d'inférence par lots (en Go) pour OpenAI GPT OSS 20b	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour OpenAI GPT OSS 20b.
Taille du fichier d'entrée d'inférence par lots (en Go) pour OpenAI GPT OSS Safeguard 120b	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour OpenAI GPT OSS Safeguard 120b.
Taille du fichier d'entrée d'inférence par lots (en Go) pour OpenAI GPT OSS Safeguard 20b	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour OpenAI GPT OSS Safeguard 20b.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Qwen3 235B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Qwen3 235B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Qwen3 32B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Qwen3 32B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Qwen3 Coder 30B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Qwen3 Coder 30B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Qwen3 Coder 480B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Qwen3 Coder 480B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Qwen3 Coder Next	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Qwen3 Coder Next.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Qwen3 Next 80B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Qwen3 Next 80B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Qwen3 VL 235B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Qwen3 VL 235B.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Titan Multimodal Embeddings G1	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Titan Multimodal Embeddings G1.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Titan Text Embeddings V2	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Titan Text Embeddings V2.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Voxtral Mini 3B 2507	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour le Voxtral Mini 3B 2507.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Voxtral Small 24B 2507	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Voxtral Small 24B 2507.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Writer Palmyra Vision 7B	Par région prise en charge : 1	Non	Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Writer Palmyra Vision 7B.
Taille de la tâche d'inférence par lots (en Go) pour Qwen3 Next 80B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Qwen3 Next 80B.
Taille de la tâche d'inférence par lots (en Go) pour Amazon Nova 2 Multimodal Embeddings V1	Chaque région prise en charge : 100	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Amazon Nova 2 Multimodal Embeddings V1.
Taille de la tâche d'inférence par lots (en Go) pour Amazon Nova Premier	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Amazon Nova Premier.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3 Haiku	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3 Haiku.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3 Opus	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3 Opus.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3 Sonnet	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3 Sonnet.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3.5 Haiku	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3.5 Haiku.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3.5 Sonnet	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3.5 Sonnet.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3.5 Sonnet v2	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3.5 Sonnet v2.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3.7 Sonnet	Chaque Région prise en charge : 5	Oui	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3.7 Sonnet.
Taille de la tâche d'inférence par lots (en Go) pour Claude Haiku 4.5	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude Haiku 4.5.
Taille de la tâche d'inférence par lots (en Go) pour Claude Opus 4.5	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude Opus 4.5.
Taille de la tâche d'inférence par lots (en Go) pour Claude Opus 4.6	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude Opus 4.6.
Taille de la tâche d'inférence par lots (en Go) pour Claude Sonnet 4	Chaque Région prise en charge : 5	Oui	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude Sonnet 4.
Taille de la tâche d'inférence par lots (en Go) pour Claude Sonnet 4.5	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude Sonnet 4.5.
Taille de la tâche d'inférence par lots (en Go) pour Claude Sonnet 4.6	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude Sonnet 4.6.
Taille de la tâche d'inférence par lots (en Go) pour DeepSeek V3.2	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour DeepSeek V3.2.
Taille de la tâche d'inférence par lots (en Go) pour la version 3 DeepSeek	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour la DeepSeek version 3.
Taille de la tâche d'inférence par lots (en Go) pour Devstral 2 123B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Devstral 2 123B.
Taille de la tâche d'inférence par lots (en Go) pour GLM 4.7	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour GLM 4.7.
Taille de la tâche d'inférence par lots (en Go) pour GLM 4.7 Flash	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour GLM 4.7 Flash.
Taille de la tâche d'inférence par lots (en Go) pour GLM 5	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour GLM 5.
Taille de la tâche d'inférence par lots (en Go) pour Gemma 3 12B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Gemma 3 12B.
Taille de la tâche d'inférence par lots (en Go) pour Gemma 3 27B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Gemma 3 27B.
Taille de la tâche d'inférence par lots (en Go) pour Gemma 3 4B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Gemma 3 4B.
Taille de la tâche d'inférence par lots (en Go) pour Kimi K2 Thinking	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Kimi K2 Thinking.
Taille de la tâche d'inférence par lots (en Go) pour Kimi K2.5	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Kimi K2.5.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.1 405B Instruct	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.1 405B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.1 70B Instruct	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.1 70B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.1 8B Instruct	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.1 8B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.2 11B Instruct	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.2 11B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.2 1B Instruct	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.2 1B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.2 3B Instruct	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.2 3B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.2 90B Instruct	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.2 90B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.3 70B Instruct	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.3 70B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 4 Maverick	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 4 Maverick.
Taille de la tâche d'inférence par lots (en Go) pour Llama 4 Scout	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 4 Scout.
Taille de la tâche d'inférence par lots (en Go) pour Magistral Small 2509	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Magistral Small 2509.
Taille de la tâche d'inférence par lots (en Go) pour M2 MiniMax	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour MiniMax M2.
Taille de la tâche d'inférence par lots (en Go) pour MiniMax M2.1	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour MiniMax M2.1.
Taille de la tâche d'inférence par lots (en Go) pour MiniMax M2.5	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour MiniMax M2.5.
Taille de la tâche d'inférence par lots (en Go) pour Ministral 3 14B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Ministral 3 14B.
Taille de la tâche d'inférence par lots (en Go) pour Ministral 3 8B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Ministral 3 8B.
Taille de la tâche d'inférence par lots (en Go) pour Ministral 3B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Ministral 3B.
Taille de la tâche d'inférence par lots (en Go) pour Mistral Large 2 (24,07)	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Mistral Large 2 (24,07).
Taille de la tâche d'inférence par lots (en Go) pour Mistral Large 3	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Mistral Large 3.
Taille de la tâche d'inférence par lots (en Go) pour Mistral Small	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Mistral Small.
Taille de la tâche d'inférence par lots (en Go) pour NVIDIA Nemotron 3 Super 120B A12B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour NVIDIA Nemotron 3 Super 120B A12B.
Taille de la tâche d'inférence par lots (en Go) pour NVIDIA Nemotron Nano 12B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour NVIDIA Nemotron Nano 12B.
Taille de la tâche d'inférence par lots (en Go) pour NVIDIA Nemotron Nano 3 30B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour NVIDIA Nemotron Nano 3 30B.
Taille de la tâche d'inférence par lots (en Go) pour NVIDIA Nemotron Nano 9B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour NVIDIA Nemotron Nano 9B.
Taille de la tâche d'inférence par lots (en Go) pour Nova Lite V1	Chaque région prise en charge : 100	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Nova Lite V1.
Taille de la tâche d'inférence par lots (en Go) pour Nova Micro V1	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Nova Micro V1.
Taille de la tâche d'inférence par lots (en Go) pour Nova Pro V1	Chaque région prise en charge : 100	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Nova Pro V1.
Taille de la tâche d'inférence par lots (en Go) pour OpenAI GPT OSS 120b	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour OpenAI GPT OSS 120b.
Taille de la tâche d'inférence par lots (en Go) pour OpenAI GPT OSS 20b	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour OpenAI GPT OSS 20b.
Taille de la tâche d'inférence par lots (en Go) pour OpenAI GPT OSS Safeguard 120b	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 120b.
Taille de la tâche d'inférence par lots (en Go) pour OpenAI GPT OSS Safeguard 20b	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 20b.
Taille de la tâche d'inférence par lots (en Go) pour Qwen3 235B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Qwen3 235B.
Taille de la tâche d'inférence par lots (en Go) pour Qwen3 32B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Qwen3 32B.
Taille de la tâche d'inférence par lots (en Go) pour Qwen3 Coder 30B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Qwen3 Coder 30B.
Taille de la tâche d'inférence par lots (en Go) pour Qwen3 Coder 480B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Qwen3 Coder 480B.
Taille de la tâche d'inférence par lots (en Go) pour Qwen3 Coder Next	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Qwen3 Coder Next.
Taille de la tâche d'inférence par lots (en Go) pour Qwen3 VL 235B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Qwen3 VL 235B.
Taille de la tâche d'inférence par lots (en Go) pour Titan Multimodal Embeddings G1	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Titan Multimodal Embeddings G1.
Taille de la tâche d'inférence par lots (en Go) pour Titan Text Embeddings V2	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Titan Text Embeddings V2.
Taille de la tâche d'inférence par lots (en Go) pour Voxtral Mini 3B 2507	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Voxtral Mini 3B 2507.
Taille de la tâche d'inférence par lots (en Go) pour Voxtral Small 24B 2507	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Voxtral Small 24B 2507.
Taille de la tâche d'inférence par lots (en Go) pour Writer Palmyra Vision 7B	Chaque région prise en charge : 5	Non	Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Writer Palmyra Vision 7B.
Caractères dans les instructions des agents	Chaque Région prise en charge : 20 000	Non	Le nombre maximum de caractères dans les instructions destinées à un agent.
Tâches d'importation de modèles simultanées	Par région prise en charge : 1	Non	Nombre maximal de tâches d'importation de modèles en cours simultanément.
CreateAgent demandes par seconde	Chaque région prise en charge : 6	Non	Le nombre maximum de demandes d' CreateAgent API par seconde.
CreateAgentActionGroup demandes par seconde	Chaque région prise en charge : 12	Non	Le nombre maximum de demandes d' CreateAgentActionGroup API par seconde.
CreateAgentAlias demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' CreateAgentAlias API par seconde.
Cross-Region modèle de demandes d'inférence par minute pour Anthropic Claude 3.5 Haiku	Chaque Région prise en charge : 2 000	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel et InvokeModelWithResponseStream en une minute. Le quota prend en compte la somme combinée de InvokeModel et de InvokeModelWithResponseStream jetons pour Anthropic Claude 3.5 Haiku.
Cross-Region demandes d'inférence de modèles par minute pour Anthropic Claude 3.5 Sonnet V2	us-west-2 : 500 Chacune des autres régions prises en charge : 100	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Anthropic Claude 3.5 Sonnet V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-Region modéliser des jetons d'inférence par minute pour Anthropic Claude 3.5 Haiku	Chaque région prise en charge : 4 000 000	Oui	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Anthropic Claude 3.5 Haiku. ConverseStream
Cross-Region modèles de jetons d'inférence par minute pour Anthropic Claude 3.5 Sonnet V2	us-west-2 : 4 000 000 Chacune des autres régions prises en charge : 800 000	Oui	Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Sonnet V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region demandes d'inférence de modèles par minute pour Amazon Nova 2 Lite	Chaque Région prise en charge : 2 000	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Lite. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Amazon Nova 2 Omni	Chaque Région prise en charge : 2 000	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Omni. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Amazon Nova 2 Pro Preview	Chaque région prise en charge : 100	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Pro Preview. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Amazon Nova Lite	us-east-1 : 4 000 us-east-2 : 4 000 us-west-1 : 4 000 us-west-2 : 4 000 Chacune des autres régions prises en charge : 400	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Lite. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Amazon Nova Micro	us-east-1 : 4 000 us-east-2 : 4 000 us-west-2 : 4 000 Chacune des autres régions prises en charge : 400	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Micro. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Amazon Nova Premier V1	Chaque région prise en charge : 500	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Premier V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Amazon Nova Pro	Chaque région prise en charge : 500	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Pro. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region modèle de demandes d'inférence par minute pour Anthropic Claude 3 Haiku	us-east-1 : 2 000 us-west-2 : 2 000 ap-northeast-1 : 400 ap-southeast-1 : 400 Chacune des autres régions prises en charge : 800	Non	Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et InvokeModelWithResponseStream de Anthropic Claude 3 Haiku. ConverseStream
Cross-region modèles de demandes d'inférence par minute pour Anthropic Claude 3 Opus	Chaque région prise en charge : 100	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude 3 Opus. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region modèles de demandes d'inférence par minute pour Anthropic Claude 3 Sonnet	us-east-1 : 1 000 us-west-2 : 1 000 Chacune des autres régions prises en charge : 200	Non	Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Anthropic Claude 3, Sonnet.
Cross-region modèles de demandes d'inférence par minute pour Anthropic Claude 3.5 Sonnet	us-west-2 : 500 ap-northeast-1 : 40 ap-southeast-1 : 40 eu-central-1 : 40 eu-west-1 : 40 eu-west-3 : 40 Chacune des autres régions prises en charge : 100	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Anthropic Claude 3.5 Sonnet. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region demandes d'inférence de modèles par minute pour Anthropic Claude 3.7 Sonnet V1	us-east-1 : 250 us-east-2 : 250 us-west-2 : 250 eu-central-1 : 100 eu-north-1 : 100 eu-west-1 : 100 eu-west-3 : 100 Chacune des autres régions prises en charge : 50	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude 3.7 Sonnet V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region modèles de demandes d'inférence par minute pour Anthropic Claude Haiku 4.5	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Haiku 4.5. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Anthropic Claude Opus 4 V1	Chaque région prise en charge : 200	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Opus 4 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region modéliser les demandes d'inférence par minute pour Anthropic Claude Opus 4.1	Chaque région prise en charge : 50	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Opus 4.1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region modèles de demandes d'inférence par minute pour Anthropic Claude Opus 4.5	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Opus 4.5. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Anthropic Claude Opus 4.6 V1	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Opus 4.6 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Anthropic Claude Sonnet 4 V1	Chaque région prise en charge : 200	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Anthropic Claude Sonnet 4 V1 1 M de longueur de contexte	Chaque Région prise en charge : 5	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4 V1 1 M de longueur de contexte. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Anthropic Claude Sonnet 4.5 V1	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4.5 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Anthropic Claude Sonnet 4.5 V1 M Context Length	Chaque Région prise en charge : 1 000	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4.5 V1 1 m de longueur de contexte. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region modéliser les demandes d'inférence par minute pour Anthropic Claude Sonnet 4.6	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4.6. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Cohere Embed V4	Chaque Région prise en charge : 2 000	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Cohere Embed V4. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour DeepSeek R1 V1	Chaque région prise en charge : 200	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour DeepSeek R1 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Meta Llama 3.1 405B Instruct	Chaque région prise en charge : 400	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 405B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Meta Llama 3.1 70B Instruct	Chaque région prise en charge : 800	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 70B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Meta Llama 3.1 8B Instruct	Chaque région prise en charge : 1 600	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 8B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Meta Llama 3.2 1B Instruct	Chaque région prise en charge : 1 600	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.2 1B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Meta Llama 3.2 3B Instruct	Chaque région prise en charge : 1 600	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Meta Llama 3.2 3B Instruct. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Cross-region demandes d'inférence de modèles par minute pour Meta Llama 3.3 70B Instruct	Chaque région prise en charge : 800	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.3 70B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Meta Llama 4 Maverick V1	Chaque région prise en charge : 800	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 4 Maverick V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Meta Llama 4 Scout V1	Chaque région prise en charge : 800	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 4 Scout V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Mistral Pixtral Large 25.02 V1	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Mistral Pixtral Large 25.02 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Stable Image Conservative Upscale	Chaque Région prise en charge : 4	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Conservative Upscale. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Stable Image Control Sketch	Chaque Région prise en charge : 20	Non	Nombre maximal de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Control Sketch. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour une structure de contrôle d'image stable	Chaque Région prise en charge : 20	Non	Nombre maximal de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour une structure de contrôle d'image stable. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Stable Image Creative Upscale	Chaque Région prise en charge : 4	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Creative Upscale. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour un objet d'effacement d'image stable	Chaque Région prise en charge : 20	Non	Nombre maximal de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour un objet d'effacement d'image stable. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Stable Image Fast Upscale	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Fast Upscale. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Stable Image Inpaint	Chaque Région prise en charge : 20	Non	Nombre maximal de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Inpaint. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Stable Image Outpaint	Chaque Région prise en charge : 4	Non	Nombre maximal de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Outpaint. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour une image stable Supprimer l'arrière-plan	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Remove Background. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Stable Image Search and Recolor	Chaque Région prise en charge : 20	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Stable Image Search and Recolor. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour la recherche et le remplacement d'images stables	Chaque Région prise en charge : 20	Non	Nombre maximal de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour la recherche et le remplacement d'images stables. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Stable Image Style Guide	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Style Guide. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour un transfert de style d'image stable	Chaque Région prise en charge : 20	Non	Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour un transfert de style d'image stable. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Twelve Labs Marengo	Chaque région prise en charge : 200	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Twelve Labs Marengo. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Twelve Labs Pegasus	Chaque région prise en charge : 120	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Twelve Labs Pegasus. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region demandes d'inférence de modèles par minute pour TwelveLabs Marengo Embed 3.0	Chaque Région prise en charge : 1 000	Oui	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour TwelveLabs Marengo Embed 3.0. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Writer AI Palmyra X4 V1	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Writer AI Palmyra X4 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region demandes d'inférence de modèles par minute pour Writer AI Palmyra X5 V1	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Writer AI Palmyra X5 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Cross-region modèles de jetons d'inférence par minute pour Amazon Nova 2 Lite	Chaque région prise en charge : 8 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Lite. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Amazon Nova 2 Omni	Chaque région prise en charge : 8 000 000	Oui	Nombre maximal de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Omni. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Amazon Nova 2 Pro Preview	Chaque Région prise en charge : 1 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Pro Preview. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Amazon Nova Lite	us-east-1 : 8 000 000 us-east-2 : 8 000 000 us-west-1 : 8 000 000 us-west-2 : 8 000 000 Chacune des autres régions prises en charge : 400 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Lite. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Amazon Nova Micro	us-east-1 : 8 000 000 us-east-2 : 8 000 000 us-west-2 : 8 000 000 Chacune des autres régions prises en charge : 400 000	Oui	Nombre maximal de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Micro. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Amazon Nova Premier V1	Chaque région prise en charge : 2 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Premier V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Amazon Nova Pro	Chaque région prise en charge : 2 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Pro. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude 3 Haiku	us-east-1 : 4 000 000 us-west-2 : 4 000 000 ap-northeast-1 : 400 000 ap-southeast-1 : 400 000 Chacune des autres régions prises en charge : 600 000	Oui	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Anthropic Claude 3 Haiku. ConverseStream
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude 3 Opus	Chaque région prise en charge : 800 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3 Opus. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude 3 Sonnet	us-east-1 : 2 000 000 us-west-2 : 2 000 000 Chacune des autres régions prises en charge : 400 000	Oui	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Anthropic Claude 3 Sonnet. ConverseStream
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude 3.5 Sonnet	us-west-2 : 4 000 000 ap-northeast-1 : 400 000 ap-southeast-1 : 400 000 eu-central-1 : 400 000 eu-west-1 : 400 000 eu-west-3 : 400 000 Chacune des autres régions prises en charge : 800 000	Oui	Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Sonnet. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude 3.7 Sonnet V1	us-east-1 : 1 000 000 us-east-2 : 1 000 000 us-west-2 : 1 000 000 eu-central-1 : 100 000 eu-north-1 : 100 000 eu-west-1 : 100 000 eu-west-3 : 100 000 Chacune des autres régions prises en charge : 50 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.7 Sonnet V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Fable 5	Chaque région prise en charge : 200 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Fable 5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Haiku 4.5	Chaque région prise en charge : 5 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Haiku 4.5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Anthropic Claude Opus 4 V1	Chaque région prise en charge : 200 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Opus 4.1	Chaque région prise en charge : 500 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Opus 4.5	Chaque région prise en charge : 2 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Anthropic Claude Opus 4.6 V1	Chaque région prise en charge : 3 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.6 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Opus 4.7	Chaque région prise en charge : 10 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.7. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Opus 4.8	Chaque région prise en charge : 30 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.8. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Sonnet 4 V1	Chaque région prise en charge : 200 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Sonnet 4 V1 M de longueur de contexte	Chaque Région prise en charge : 1 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4 V1 1 M de longueur de contexte. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Sonnet 4.5 V1	Chaque région prise en charge : 5 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4.5 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Sonnet 4.5 V1 M de longueur de contexte	Chaque Région prise en charge : 1 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4.5 V1 1 m de longueur de contexte. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Sonnet 4.6	Chaque région prise en charge : 6 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4.6. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Anthropic Claude Sonnet 5	Chaque région prise en charge : 6 000 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modéliser des jetons d'inférence par minute pour Cohere Embed V4	Chaque région prise en charge : 300 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Cohere Embed V4. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour DeepSeek R1 V1	Chaque région prise en charge : 200 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour DeepSeek R1 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Meta Llama 3.1 405B Instruct	Chaque région prise en charge : 800 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Meta Llama 3.1 70B Instruct	Chaque région prise en charge : 600 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Meta Llama 3.1 8B Instruct	Chaque région prise en charge : 600 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 8B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Meta Llama 3.2 1B Instruct	Chaque région prise en charge : 600 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 1B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Meta Llama 3.2 3B Instruct	Chaque région prise en charge : 600 000	Oui	Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 3B Instruct. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Cross-region modèles de jetons d'inférence par minute pour Meta Llama 3.3 70B Instruct	Chaque région prise en charge : 600 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.3 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Meta Llama 4 Maverick V1	Chaque région prise en charge : 600 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 4 Maverick V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Meta Llama 4 Scout V1	Chaque région prise en charge : 600 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 4 Scout V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Mistral Pixtral Large 25.02 V1	Chaque région prise en charge : 80 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Mistral Pixtral Large 25.02 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Writer AI Palmyra X4 V1	Chaque région prise en charge : 150 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Writer AI Palmyra X4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Cross-region modèles de jetons d'inférence par minute pour Writer AI Palmyra X5 V1	Chaque région prise en charge : 150 000	Oui	Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence de modèles en une minute pour Writer AI Palmyra X5 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèles personnalisés avec un statut de création par compte	Chaque région prise en charge : 2	Oui	Le nombre maximum de modèles personnalisés dotés d'un statut de création.
DeleteAgent demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' DeleteAgent API par seconde.
DeleteAgentActionGroup demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' DeleteAgentActionGroup API par seconde.
DeleteAgentAlias demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' DeleteAgentAlias API par seconde.
DeleteAgentVersion demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' DeleteAgentVersion API par seconde.
DisassociateAgentKnowledgeBase demandes par seconde	Chaque Région prise en charge : 4	Non	Le nombre maximum de demandes d' DisassociateAgentKnowledgeBase API par seconde.
Groupes d'actions activés par agent	Chaque région prise en charge : 15	Oui	Nombre maximal de groupes d'actions que vous pouvez activer dans un agent.
Points de terminaison par profil d'inférence	Chaque région prise en charge : 5	Non	Nombre maximal de points de terminaison dans un profil d'inférence. Un point de terminaison est défini par un modèle et par la région vers laquelle les demandes d'invocation adressées au modèle sont envoyées.
GetAgent demandes par seconde	Chaque région prise en charge : 15	Non	Le nombre maximum de demandes d' GetAgent API par seconde.
GetAgentActionGroup demandes par seconde	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes d' GetAgentActionGroup API par seconde.
GetAgentAlias demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' GetAgentAlias API par seconde.
GetAgentKnowledgeBase demandes par seconde	Chaque région prise en charge : 15	Non	Le nombre maximum de demandes d' GetAgentKnowledgeBase API par seconde.
GetAgentVersion demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' GetAgentVersion API par seconde.
Demandes d'inférence de modèles interrégionales par minute pour Amazon Nova 2 Lite	Chaque Région prise en charge : 2 000	Oui	Nombre maximal de demandes interrégionales mondiales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Lite. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionales par minute pour Amazon Nova 2 Omni	Chaque Région prise en charge : 2 000	Oui	Nombre maximal de demandes interrégionales mondiales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Omni. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionales par minute pour Amazon Nova 2 Pro Preview	Chaque région prise en charge : 100	Oui	Le nombre maximum de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Pro Preview. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionaux par minute pour Anthropic Claude Haiku 4.5	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales mondiales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Haiku 4.5. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionaux par minute pour Anthropic Claude Opus 4.5	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales mondiales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Opus 4.5. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionaux par minute pour Anthropic Claude Opus 4.6 V1	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales mondiales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Opus 4.6 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionaux par minute pour Anthropic Claude Sonnet 4 V1	Chaque région prise en charge : 200	Oui	Le nombre maximum de demandes interrégionales mondiales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionaux par minute pour Anthropic Claude Sonnet 4.5 V1	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales mondiales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4.5 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionaux par minute pour Anthropic Claude Sonnet 4.5 V1 1 M de longueur de contexte	Chaque Région prise en charge : 1 000	Oui	Le nombre maximum de demandes interrégionales mondiales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4.5 V1 1 m de longueur de contexte. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionaux par minute pour Anthropic Claude Sonnet 4.6	Chaque région prise en charge : 10 000	Oui	Le nombre maximum de demandes interrégionales mondiales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4.6. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Demandes d'inférence de modèles interrégionaux par minute pour Cohere Embed V4	Chaque Région prise en charge : 2 000	Oui	Le nombre maximum de demandes interrégionales globales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Cohere Embed V4. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Amazon Nova 2 Lite	Chaque région prise en charge : 11 520 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez envoyer pour l'inférence de modèles en une journée pour Amazon Nova 2 Lite. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Amazon Nova 2 Omni	Chaque région prise en charge : 11 520 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez envoyer pour l'inférence de modèles en une journée pour Amazon Nova 2 Omni. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Amazon Nova 2 Pro Preview	Chaque région prise en charge : 1 440 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez envoyer pour l'inférence de modèles en une journée pour Amazon Nova 2 Pro Preview. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Fable 5	Chaque région prise en charge : 720 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Fable 5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Haiku 4.5	Chaque région prise en charge : 7 200 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Haiku 4.5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Opus 4.5	Chaque région prise en charge : 2 880 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Opus 4.5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Opus 4.6 V1	Chaque région prise en charge : 4 320 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Opus 4.6 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Opus 4.7	Chaque région prise en charge : 14 400 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Opus 4.7. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Opus 4.8	Chaque région prise en charge : 43 200 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Opus 4.8. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Sonnet 4 V1	Chaque région prise en charge : 288 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Sonnet 4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Sonnet 4.5 V1	Chaque région prise en charge : 7 200 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Sonnet 4.5 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Sonnet 4.5 V1 M de longueur de contexte	Chaque région prise en charge : 1 440 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une journée pour Anthropic Claude Sonnet 4.5 V1 1 m de longueur de contexte. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Sonnet 4.6	Chaque région prise en charge : 8 640 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Sonnet 4.6. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Anthropic Claude Sonnet 5	Chaque région prise en charge : 8 640 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Sonnet 5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par jour pour Cohere Embed V4	Chaque région prise en charge : 432 000 000	Non	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence de modèles en une journée pour Cohere Embed V4. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Amazon Nova 2 Lite	Chaque région prise en charge : 8 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Lite. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Amazon Nova 2 Omni	Chaque région prise en charge : 8 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Omni. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Amazon Nova 2 Pro Preview	Chaque Région prise en charge : 1 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Pro Preview. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Fable 5	Chaque région prise en charge : 500 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Fable 5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Haiku 4.5	Chaque région prise en charge : 5 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Haiku 4.5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Opus 4.5	Chaque région prise en charge : 2 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Opus 4.6 V1	Chaque région prise en charge : 3 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.6 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Opus 4.7	Chaque région prise en charge : 10 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.7. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Opus 4.8	Chaque région prise en charge : 30 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.8. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Sonnet 4 V1	Chaque région prise en charge : 200 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Sonnet 4.5 V1	Chaque région prise en charge : 5 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4.5 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Sonnet 4.5 V1 M de longueur de contexte	Chaque Région prise en charge : 1 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4.5 V1 1 m de longueur de contexte. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Sonnet 4.6	Chaque région prise en charge : 6 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4.6. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Anthropic Claude Sonnet 5	Chaque région prise en charge : 6 000 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux mondiaux par minute pour Cohere Embed V4	Chaque région prise en charge : 300 000	Oui	Le nombre maximum de jetons interrégionaux mondiaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Cohere Embed V4. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèles importés par compte	Chaque région prise en charge : 3	Oui	Le nombre maximum de modèles importés dans un compte.
Profils d'inférence par compte	Chaque Région prise en charge : 1 000	Oui	Le nombre maximum de profils d'inférence dans un compte.
ListAgentActionGroups demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' ListAgentActionGroups API par seconde.
ListAgentAliases demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' ListAgentAliases API par seconde.
ListAgentKnowledgeBases demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' ListAgentKnowledgeBases API par seconde.
ListAgentVersions demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' ListAgentVersions API par seconde.
ListAgents demandes par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d' ListAgents API par seconde.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Amazon Nova 2 Multimodal Embeddings V1	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour Amazon Nova 2 Multimodal Embeddings V1.
Nombre minimum d'enregistrements par tâche d'inférence par lot pour Amazon Nova Premier	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour Amazon Nova Premier.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3 Haiku	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Haiku.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3 Opus	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Opus.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3 Sonnet	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Sonnet.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3.5 Haiku	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Haiku.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3.5 Sonnet	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3.5 Sonnet v2	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet v2.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3.7 Sonnet	Chaque région prise en charge : 100	Oui	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.7 Sonnet.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude Haiku 4.5	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Haiku 4.5.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude Opus 4.5	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Opus 4.5.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude Opus 4.6	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Opus 4.6.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude Sonnet 4	Chaque région prise en charge : 100	Oui	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Sonnet 4.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude Sonnet 4.5.	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Sonnet 4.5.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude Sonnet 4.6	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Sonnet 4.6.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour DeepSeek V3.2	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée d'une tâche d'inférence par lots pour DeepSeek V3.2.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour DeepSeek la version 3	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour la DeepSeek version 3.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Devstral 2 123B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Devstral 2 123B.
Nombre minimal d'enregistrements par tâche d'inférence par lots pour GLM 4.7	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour GLM 4.7.
Nombre minimal d'enregistrements par tâche d'inférence par lots pour GLM 4.7 Flash	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour GLM 4.7 Flash.
Nombre minimal d'enregistrements par tâche d'inférence par lots pour GLM 5	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour GLM 5.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Gemma 3 12B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Gemma 3 12B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Gemma 3 27B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Gemma 3 27B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Gemma 3 4B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Gemma 3 4B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Kimi K2 Thinking	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour Kimi K2 Thinking.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Kimi K2.5	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Kimi K2.5.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.1 405B Instruct	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 405B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.1 70B Instruct	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 70B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.1 8B Instruct	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 8B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.2 11B Instruct	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 11B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.2 1B Instruct	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée d'une tâche d'inférence par lots Llama 3.2 1B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.2 3B Instruct	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 3B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.2 90B Instruct	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 90B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.3 70B Instruct	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.3 70B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 4 Maverick	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 4 Maverick.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 4 Scout	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 4 Scout.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Magistral Small 2509	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Magistral Small 2509.
Nombre minimal d'enregistrements par tâche d'inférence par lots pour M2 MiniMax	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour MiniMax M2.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour MiniMax M2.1	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée d'une tâche d'inférence par lots pour MiniMax M2.1.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour MiniMax M2.5	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée d'une tâche d'inférence par lots pour MiniMax M2.5.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Ministral 3 14B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Ministral 3 14B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Ministral 3 8B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Ministral 3 8B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Ministral 3B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Ministral 3B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Mistral Large 2 (24,07)	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Large 2 (24,07).
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Mistral Large 3	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Large 3.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Mistral Small	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Small.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour NVIDIA Nemotron 3 Super 120B A12B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron 3 Super 120B A12B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour NVIDIA Nemotron Nano 12B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron Nano 12B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour NVIDIA Nemotron Nano 3 30B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron Nano 3 30B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour NVIDIA Nemotron Nano 9B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron Nano 9B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Nova 2 Lite	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova 2 Lite.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Nova Lite V1	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Lite V1.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Nova Micro V1	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Micro V1.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Nova Pro V1	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Pro V1.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour OpenAI GPT OSS 120b	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS 120b.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour OpenAI GPT OSS 20b	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS 20b.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 120b	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 120b.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 20b	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 20b.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Qwen3 235B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 235B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Qwen3 32B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 32B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Qwen3 Coder 30B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 Coder 30B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Qwen3 Coder 480B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 Coder 480B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Qwen3 Coder Next	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 Coder Next.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Qwen3 Next 80B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 Next 80B.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Qwen3 VL 235B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 VL 235B.
Nombre minimum d'enregistrements par tâche d'inférence par lot pour Titan Multimodal Embeddings G1	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Titan Multimodal Embeddings G1.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Titan Text Embeddings V2	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Titan Text Embeddings V2.
Nombre minimum d'enregistrements par tâche d'inférence par lot pour Voxtral Mini 3B 2507	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Voxtral Mini 3B 2507.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Voxtral Small 24B 2507	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Voxtral Small 24B 2507.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Writer Palmyra Vision 7B	Chaque région prise en charge : 100	Non	Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Writer Palmyra Vision 7B.
Modèle d'invocation (nombre maximal de jetons optimisés en termes de latence par jour) pour Amazon Nova Pro V1	Chaque région prise en charge : 57 600 000	Non	Nombre maximal de jetons que vous pouvez soumettre pour une inférence de modèle optimisée en fonction de la latence en une journée pour Amazon Nova Pro V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèle d'invocation, nombre maximum de jetons par jour pour AI21 Labs Jamba 1.5 Large (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour AI21 Labs Jamba 1.5 Large. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation, nombre maximum de jetons par jour pour AI21 Labs Jamba 1.5 Mini (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour AI21 Labs Jamba 1.5 Mini. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximal de jetons par jour) pour Amazon Nova 2 Lite (doublé pour les appels interrégionaux)	Chaque région prise en charge : 5 760 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Amazon Nova 2 Lite. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximal de jetons par jour) pour Amazon Nova 2 Omni (doublé pour les appels interrégionaux)	Chaque région prise en charge : 5 760 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Amazon Nova 2 Omni. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Nombre maximal de jetons d'invocation par jour pour Amazon Nova 2 Pro Preview (doublé pour les appels interrégionaux)	Chaque région prise en charge : 720 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Amazon Nova 2 Pro Preview. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximal de jetons par jour) pour Amazon Nova Lite (doublé pour les appels interrégionaux)	Chaque région prise en charge : 5 760 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Amazon Nova Lite. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximal de jetons par jour) pour Amazon Nova Micro (doublé pour les appels interrégionaux)	Chaque région prise en charge : 5 760 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Amazon Nova Micro. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximal de jetons par jour) pour Amazon Nova Premier V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 1 440 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Amazon Nova Premier V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximal de jetons par jour) pour Amazon Nova Pro (doublé pour les appels interrégionaux)	Chaque région prise en charge : 1 440 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Amazon Nova Pro. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude 3 Haiku (doublé pour les appels interrégionaux)	us-east-1 : 2 880 000 000 us-west-2 : 2 880 000 000 ap-northeast-1 : 288 000 000 ap-southeast-1 : 288 000 000 Chacune des autres régions prises en charge : 432 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Anthropic Claude 3 Haiku. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude 3.5 Haiku (doublé pour les appels interrégionaux)	Chaque région prise en charge : 2 880 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Anthropic Claude 3.5 Haiku. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude 3.5 Sonnet V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 2 880 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Anthropic Claude 3.5 Sonnet V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude 3.5 Sonnet V2 (doublé pour les appels interrégionaux)	us-east-1 : 2 880 000 000 us-west-2 : 2 880 000 000 Chacune des autres régions prises en charge : 576 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Anthropic Claude 3.5 Sonnet V2. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude 3.7 Sonnet V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 720 000 000	Non	Maximum quotidien de jetons pour l'inférence du modèle pour Anthropic Claude 3.7 Sonnet V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Fable 5 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000	Non	Maximum quotidien de jetons pour l'inférence du modèle pour Anthropic Claude Fable 5. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Haiku 4.5 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 3 600 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Anthropic Claude Haiku 4.5. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Opus 4 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Anthropic Claude Opus 4 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Opus 4.1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 360 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Anthropic Claude Opus 4.1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Opus 4.5 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 1 440 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Anthropic Claude Opus 4.5. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Opus 4.6 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 2 160 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Anthropic Claude Opus 4.6 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Opus 4.7 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 7 200 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Anthropic Claude Opus 4.7. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Opus 4.8 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 21 600 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Anthropic Claude Opus 4.8. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Sonnet 4 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000	Non	Maximum quotidien de jetons pour l'inférence du modèle pour Anthropic Claude Sonnet 4 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximal de jetons d'invocation par jour pour Anthropic Claude Sonnet 4 V1, longueur de contexte de 1 m (doublé pour les appels interrégionaux)	Chaque région prise en charge : 720 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Anthropic Claude Sonnet 4 V1 M de longueur de contexte. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Sonnet 4.5 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 3 600 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Anthropic Claude Sonnet 4.5 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximal de jetons d'invocation par jour pour Anthropic Claude Sonnet 4,5 V1 m de longueur de contexte (doublé pour les appels interrégionaux)	Chaque région prise en charge : 720 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Anthropic Claude Sonnet 4.5 V1 1 m de longueur de contexte. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Sonnet 4.6 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 4 320 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Anthropic Claude Sonnet 4.6. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Anthropic Claude Sonnet 5 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 4 320 000 000	Non	Maximum quotidien de jetons pour l'inférence du modèle pour Anthropic Claude Sonnet 5. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Cohere Embed V4 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 216 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Cohere Embed V4. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation, nombre maximum de jetons par jour pour le DeepSeek R1 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour DeepSeek R1 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour la DeepSeek V3 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour la DeepSeek V3 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Nombre maximal de jetons d'invocation par jour pour le modèle DeepSeek V3.2 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour DeepSeek V3.2. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour GPT OSS Safeguard 120B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour GPT OSS Safeguard 120B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour GPT OSS Safeguard 20B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour GPT OSS Safeguard 20B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation, nombre maximum de jetons par jour pour Gemma 3 12B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Maximum quotidien de jetons pour l'inférence du modèle pour Gemma 3 12B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation, nombre maximum de jetons par jour pour Gemma 3 27B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Maximum quotidien de jetons pour l'inférence du modèle pour Gemma 3 27B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation, nombre maximum de jetons par jour pour Gemma 3 4B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Maximum quotidien de jetons pour l'inférence de modèles pour Gemma 3 4B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximum de jetons par jour) pour Kimi K2 Thinking (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Maximum quotidien de jetons pour l'inférence de modèles pour Kimi K2 Thinking. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation, nombre maximum de jetons par jour pour Magistral Small 1.2 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Magistral Small 1.2. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Meta Llama 3.2 11B Instruct (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Meta Llama 3.2 11B Instruct. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Meta Llama 3.2 1B Instruct (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Maximum quotidien de jetons pour l'inférence de modèles pour Meta Llama 3.2 1B Instruct. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Meta Llama 3.2 3B Instruct (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Maximum quotidien de jetons pour l'inférence de modèles pour Meta Llama 3.2 3B Instruct. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Meta Llama 3.2 90B Instruct (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Meta Llama 3.2 90B Instruct. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Meta Llama 4 Maverick V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Maximum quotidien de jetons pour l'inférence de modèles pour Meta Llama 4 Maverick V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Meta Llama 4 Scout V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Maximum quotidien de jetons pour l'inférence de modèles pour Meta Llama 4 Scout V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Nombre maximal de jetons d'invocation par jour pour le modèle MiniMax M2.5 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour MiniMax M2.5. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour le Minimax M2 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Minimax M2. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation : nombre maximum de jetons par jour pour Minimax M2.1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour M2.1 Minimax. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Ministral 14B 3.0 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Ministral 14B 3.0. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Ministral 3B 3.0 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Ministral 3B 3.0. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Ministral 8B 3.0 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Ministral 8B 3.0. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Mistral AI Mistral 7B Instruct (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Mistral AI Mistral 7B Instruct. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Mistral AI Mistral Large (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Mistral AI Mistral Large. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Mistral AI Mistral Small (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Mistral AI Mistral Small. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Mistral AI Mixtral 8X7B Instruct (doublé pour les appels interrégionaux)	Chaque région prise en charge : 432 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Mistral AI Mixtral 8X7B Instruct. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximum de jetons par jour) pour Mistral Devstral 2 123b (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Mistral Devstral 2 123b. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximum de jetons par jour) pour Mistral Large 3 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Maximum quotidien de jetons pour l'inférence de modèles pour Mistral Large 3. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Mistral Pixtral Large 25.02 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 57 600 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Mistral Pixtral Large 25.02 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Moonshot AI Kimi K2.5 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Maximum quotidien de jetons pour l'inférence de modèles pour Moonshot AI Kimi. K2.5 Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour le NVIDIA Nemotron 3 Super 120B A12B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour NVIDIA Nemotron 3 Super 120B A12B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour NVIDIA Nemotron Nano 2 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour NVIDIA Nemotron Nano 2. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour NVIDIA Nemotron Nano 2 VL (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour NVIDIA Nemotron Nano 2 VL. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour le Nemotron Nano 3 30B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour le Nemotron Nano 3 30B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximum de jetons par jour) pour OpenAI GPT OSS 120B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour OpenAI GPT OSS 120B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour OpenAI GPT OSS 20B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour OpenAI GPT OSS 20B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation, nombre maximum de jetons par jour pour le Qwen3 235B a22b 2507 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Qwen3 235B a22b 2507 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour le Qwen3 32B V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Qwen3 32B V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Qwen3 Coder 30B a3b V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Qwen3 Coder 30B a3b V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour le Qwen3 Coder 480B a35b V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour le Qwen3 Coder 480B a35b V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Qwen3 Coder Next (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Qwen3 Coder Next. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximum de jetons par jour) pour le Qwen3 Next 80B A3B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Qwen3 Next 80B A3B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation (nombre maximum de jetons par jour) pour le Qwen3 VL 235B A22B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Qwen3 VL 235B A22B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Voxtral Mini 1.0 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Voxtral Mini 1.0. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Voxtral Small 1.0 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Voxtral Small 1.0. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Writer AI Palmyra X4 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 108 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Writer AI Palmyra X4 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Writer AI Palmyra X5 V1 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 108 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Writer AI Palmyra X5 V1. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle : nombre maximum de jetons d'invocation par jour pour Writer Palmyra Vision 7B (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Writer Palmyra Vision 7B. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Modèle d'invocation, nombre maximum de jetons par jour pour Z.ai GLM 5 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Z.ai GLM 5. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Nombre maximal de jetons d'invocation par jour pour le modèle Z.ai GLM-4.7 (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence du modèle pour Z.ai GLM-4.7. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Nombre maximal de jetons d'invocation par jour pour Z.ai GLM-4.7 Flash (doublé pour les appels interrégionaux)	Chaque région prise en charge : 144 000 000 000	Non	Nombre maximal de jetons quotidiens pour l'inférence de modèles pour Z.ai GLM-4.7 Flash. Combine la somme des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream. Doublé pour les appels interrégionaux ; non applicable en cas d'augmentation approuvée du TPM.
Unités de modèle Débits provisionnés sans engagement sur l'ensemble des modèles de base	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être distribuées sur des débits provisionnés sans engagement pour les modèles de base
Unités de modèles Débits provisionnés sans engagement sur des modèles personnalisés	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être distribuées sur des débits provisionnés sans engagement pour les modèles personnalisés
Unités de modèle par modèle provisionné pour AI21 Labs Mid Jurassic-2	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour AI21 Labs Mid. Jurassic-2
Unités de modèle par modèle provisionné pour AI21 Labs Ultra Jurassic-2	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour AI21 Labs Ultra. Jurassic-2
Unités de modèle par modèle provisionné pour Amazon Nova 2 Lite 256K V1.0	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Nova 2 Lite V1.0 256K.
Unités de modèle par modèle provisionné pour Amazon Nova Canvas	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Nova Canvas.
Unités de modèle par modèle provisionné pour Amazon Titan Embeddings G1 - Texte	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Embeddings G1 - Text.
Unités de modèle par modèle provisionné pour Amazon Titan Image Generator G1	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Image Generator G1.
Unités de modèle par modèle provisionné pour Amazon Titan Image Generator G2	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Image Generator G2.
Unités de modèle par modèle provisionné pour Amazon Titan Lite V1 4K	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Text Lite V1 4K.
Unités de modèle par modèle provisionné pour Amazon Titan Multimodal Embeddings G1	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Multimodal Embeddings G1.
Unités de modèle par modèle provisionné pour Amazon Titan Text Embeddings V2	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Text Embeddings V2.
Unités de modèle par modèle provisionné pour Amazon Titan Text G1 - Express 8K	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Text G1 - Express 8K.
Unités de modèle par modèle provisionné pour Amazon Titan Text Premier V1 32K	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Text Premier V1 32K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3 Haiku 200K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3 Haiku 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3 Haiku 48K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Anthropic Claude 3 Haiku 48K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3 Sonnet 200K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Anthropic Claude 3 Sonnet 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3 Sonnet 28K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3 Sonnet 28K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Haiku 16K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Anthropic Claude 3.5 Haiku 16K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Haiku 200K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Haiku 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Haiku 64K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Haiku 64K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet 18K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet 18K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet 200K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet 51K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet 51K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 18K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 18K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 200K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 51K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 51K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 18K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 18K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 200K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 51K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 51K.
Unités de modèle par modèle provisionné pour Anthropic Claude Instant V1 100K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude Instant V1 100K.
Unités de modèle par modèle provisionné pour Anthropic Claude V2 100K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude V2 100K.
Unités de modèle par modèle provisionné pour Anthropic Claude V2 18K	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude V2 18K.
Unités de modèle par modèle provisionné pour Anthropic Claude 18K V2.1	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 18K. V2.1
Unités de modèle par modèle provisionné pour Anthropic Claude 200K V2.1	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 200K. V2.1
Unités de modèle par modèle provisionné pour Cohere Command	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Cohere Command.
Unités de modèle par modèle provisionné pour Cohere Command Light	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Cohere Command Light.
Unités de modèle par modèle provisionné pour Cohere Command R	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Cohere Command R 128k.
Unités de modèle par modèle provisionné pour Cohere Command R Plus	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Cohere Command R Plus 128k.
Unités de modèle par modèle provisionné pour Cohere Embed English	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Cohere Embed English.
Unités de modèle par modèle provisionné pour Cohere Embed Multilingual	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Cohere Embed Multilingual.
Unités de modèle par modèle provisionné pour Meta Llama 2 13B	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 2 13B.
Unités de modèle par modèle provisionné pour Meta Llama 2 70B	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 2 70B.
Unités de modèle par modèle provisionné pour Meta Llama 2 Chat 13B	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 2 Chat 13B.
Unités de modèle par modèle provisionné pour Meta Llama 2 Chat 70B	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 2 Chat 70B.
Unités de modèle par modèle provisionné pour Meta Llama 3 70B Instruct	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3 70B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3 8B Instruct	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3 8B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.1 70B Instruct	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.1 70B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.1 8B Instruct	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.1 8B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.2 11B Instruct	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.2 11B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.2 1B Instruct	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.2 1B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.2 3B Instruct	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.2 3B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.2 90B Instruct	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.2 90B Instruct.
Unités de modèle par modèle provisionné pour Mistral Large 2407	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Mistral Large 2407.
Unités de modèle par modèle provisionné pour Mistral Small	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Mistral Small.
Unités de modèle par modèle provisionné pour Stability.ai Stable Diffusion XL 0.8	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Stability.ai Stable Diffusion XL 0.8
Unités de modèle par modèle provisionné pour Stability.ai Stable Diffusion XL 1.0	Chaque région prise en charge : 0	Oui	Nombre maximal d'unités de modèle pouvant être allouées à un modèle provisionné pour Stability.ai Stable Diffusion XL 1.0.
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 128 000 caractères pour Amazon Nova Micro	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 128 000 pour Amazon Nova Micro
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Lite	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Lite
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Micro	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Micro
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Pro	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Pro
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 300 000 unités pour Amazon Nova Lite	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 300 000 pour Amazon Nova Lite
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 300 000 pour Amazon Nova Pro	Chaque région prise en charge : 0	Oui	Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 300 000 pour Amazon Nova Pro.
Unités modèles, avec engagement, pour Provisioned Through créées pour Meta Llama 4 Scout 17B Instruct 10M	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour Meta Llama 4 Scout 17B Instruct 10M, avec engagement.
Unités modèles, avec engagement, pour Provisioned Through créées pour Meta Llama 4 Scout 17B Instruct 128K	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour Meta Llama 4 Scout 17B Instruct 128K, avec engagement.
Unités modèles, avec engagement, pour Provisioned Through créées pour Meta Maverick 4 Scout 17B Instruct 128K	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour Meta Llama 4 Maverick 17B Instruct 128K, avec engagement.
Unités de modèle, avec engagement, pour Provisioned Through créées pour Meta Maverick 4 Scout 17B Instruct 1M	Chaque région prise en charge : 0	Oui	Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour Meta Llama 4 Maverick 17B Instruct 1M, avec engagement.
No-commitment unités de modèle pour le débit provisionné créées pour le modèle de base Amazon Nova 2 Lite 256K V1.0	Chaque région prise en charge : 0	Non	Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour le modèle de base Amazon Nova 2 Lite V1.0 256 Ko, sans engagement
No-commitment unités de modèle pour le débit provisionné créées pour le modèle personnalisé Amazon Nova 2 Lite 256K V1.0	Chaque région prise en charge : 0	Non	Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour le modèle personnalisé Amazon Nova 2 Lite V1.0 256K, sans engagement.
Nombre de routeurs d'invite personnalisés par compte	Chaque région prise en charge : 500	Non	Le nombre maximum de routeurs d'invite personnalisés que vous pouvez créer par compte et par région.
On-Demand, demandes d'inférence de modèles optimisées en termes de latence par minute pour Amazon Nova Pro V1	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande optimisées pour la latence que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Pro V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-Demand, demandes d'inférence de modèle optimisées en termes de latence par minute pour Meta Llama 3.1 405B Instruct	Chaque région prise en charge : 100	Non	Le nombre maximum de demandes à la demande et optimisées pour la latence que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-Demand, demandes d'inférence de modèle optimisées pour la latence par minute pour Meta Llama 3.1 70B Instruct	Chaque région prise en charge : 100	Non	Le nombre maximum de demandes à la demande et optimisées pour la latence que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-Demand, jetons d'inférence de modèles optimisés pour la latence par minute pour Amazon Nova Pro V1	Chaque région prise en charge : 40 000	Non	Nombre maximal de jetons à la demande et optimisés pour la latence que vous pouvez soumettre pour l'inférence de modèles en une minute pour Amazon Nova Pro V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-Demand, jetons d'inférence de modèle optimisés pour la latence par minute pour Meta Llama 3.1 405B Instruct	Chaque région prise en charge : 40 000	Non	Le nombre maximum de jetons à la demande et optimisés pour la latence que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-Demand, jetons d'inférence de modèle optimisés pour la latence par minute pour Meta Llama 3.1 70B Instruct	Chaque région prise en charge : 40 000	Non	Le nombre maximum de jetons à la demande et optimisés pour la latence que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand InvokeModel requêtes simultanées asynchrones pour Amazon Nova 2 Multimodal Embeddings V1	Chaque Région prise en charge : 30	Non	Nombre maximal de demandes d'inférence de modèles asynchrones simultanées que vous pouvez envoyer pour Amazon Nova 2 Multimodal Embeddings V1. Le quota prend en compte la somme combinée de Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream.
On-demand InvokeModel requêtes simultanées asynchrones pour TwelveLabs Marengo Embed 3.0	Par région prise en charge : 10	Oui	Le nombre maximum de demandes d'inférence de modèles asynchrones simultanées que vous pouvez soumettre pour TwelveLabs Marengo Embed 3.0. Le quota prend en compte la somme combinée de Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream.
On-demand InvokeModel requêtes simultanées pour Amazon Nova 2 Sonic	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes d'inférence de modèle simultanées que vous pouvez soumettre pour Amazon Nova 2 Sonic. Le quota prend en compte la somme combinée de Converse, ConverseStream InvokeModel, et InvokeModelWithResponseStream.
On-demand InvokeModel demandes simultanées pour Amazon Nova Reel1.0	Chaque Région prise en charge : 10	Non	Le nombre maximum de demandes d'inférence de modèle simultanées que vous pouvez soumettre pour Amazon Nova Reel 1.0. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand InvokeModel demandes simultanées pour Amazon Nova Reel1.1	Chaque région prise en charge : 3	Non	Le nombre maximum de demandes d'inférence de modèle simultanées que vous pouvez soumettre pour Amazon Nova Reel 1.1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand InvokeModel demandes simultanées pour Amazon Nova Sonic	Chaque Région prise en charge : 20	Non	Le nombre maximum de demandes simultanées que vous pouvez envoyer pour l'inférence de modèles pour Amazon Nova Sonic.
On-demand InvokeModel demandes simultanées pour Twelve Labs Marengo	Chaque Région prise en charge : 30	Non	Le nombre maximum de InvokeModel demandes simultanées que vous pouvez soumettre pour l'inférence de modèles pour Twelve Labs Marengo.
On-demand InvokeModel demandes simultanées pour Twelve Labs Pegasus	Chaque Région prise en charge : 30	Oui	Le nombre maximum de InvokeModel demandes simultanées que vous pouvez soumettre pour l'inférence de modèles pour Twelve Labs Pegasus.
On-demand demandes d'inférence de modèles optimisées en termes de latence par minute pour Anthropic Claude 3.5 Haiku	Chaque région prise en charge : 100	Non	Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Anthropic Claude 3.5 Haiku, si l'optimisation de la latence est configurée.
On-demand jetons d'inférence de modèle optimisés en latence par minute pour Anthropic Claude 3.5 Haiku	Chaque région prise en charge : 500 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream pour Anthropic Claude 3.5 Haiku, si l'optimisation de la latence est configurée.
On-demand demandes simultanées d'inférence de modèles pour Luma Ray V2	Par région prise en charge : 1	Non	Le nombre maximum de demandes simultanées que vous pouvez soumettre pour l'inférence de modèle pour Luma Ray V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand demandes d'inférence de modèles par minute pour AI21 Labs Jamba 1.5 Large	Chaque région prise en charge : 100	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour AI21 Labs Jamba 1.5 Large. Le quota prend en compte la somme combinée des demandes pour Converse et InvokeModel
On-demand demandes d'inférence de modèles par minute pour AI21 Labs Jamba 1.5 Mini	Chaque région prise en charge : 100	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour AI21 Labs Jamba 1.5 Mini. Le quota prend en compte la somme combinée des demandes pour Converse et InvokeModel
On-demand demandes d'inférence de modèles par minute pour Amazon Nova 2 Multimodal Embeddings V1	Chaque Région prise en charge : 2 000	Non	Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova 2 Multimodal Embeddings V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Amazon Nova Canvas	Chaque région prise en charge : 100	Non	Nombre maximal de demandes que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Canvas. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand demandes d'inférence de modèles par minute pour Amazon Nova Lite	us-east-1 : 2 000 eu-west-2 : 2 000 Chacune des autres régions prises en charge : 200	Non	Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Lite. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Amazon Nova Micro	us-east-1 : 2 000 eu-west-2 : 2 000 Chacune des autres régions prises en charge : 200	Non	Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Micro. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Amazon Nova Pro	Chaque région prise en charge : 250	Non	Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Pro. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Amazon R	Chaque région prise en charge : 200	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon R 1.0.
On-demand demandes d'inférence de modèles par minute pour Amazon Titan Image Generator G1	Chaque région prise en charge : 60	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon Titan Image Generator G1.
On-demand demandes d'inférence de modèles par minute pour Amazon Titan Image Generator G1 V2	Chaque région prise en charge : 60	Non	Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Titan Image Generator G1 V2. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Amazon Titan Multimodal Embeddings G1	Chaque Région prise en charge : 2 000	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon Titan Multimodal Embeddings G1.
On-demand demandes d'inférence de modèles par minute pour Amazon Titan Text Embeddings	Chaque Région prise en charge : 2 000	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon Titan Text Embeddings
On-demand demandes d'inférence de modèles par minute pour Amazon Titan Text Embeddings V2	Chaque région prise en charge : 6 000	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon Titan Text Embeddings V2
On-demand demandes d'inférence de modèles par minute pour Amazon Titan Text Express	Chaque région prise en charge : 400	Non	Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Amazon, Titan Text Express
On-demand demandes d'inférence de modèles par minute pour Amazon Titan Text Premier	Chaque région prise en charge : 100	Non	Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Amazon, Titan Text Premier
On-demand modèle de demandes d'inférence par minute pour Anthropic Claude 3 Haiku	us-east-1 : 1 000 us-west-2 : 1 000 ap-northeast-1 : 200 ap-southeast-1 : 200 Chacune des autres régions prises en charge : 400	Non	Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et InvokeModelWithResponseStream de Anthropic Claude 3 Haiku. ConverseStream
On-demand modèles de demandes d'inférence par minute pour Anthropic Claude 3 Opus	Chaque région prise en charge : 50	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude 3 Opus. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modèles de demandes d'inférence par minute pour Anthropic Claude 3 Sonnet	us-east-1 : 500 us-west-2 : 500 Chacune des autres régions prises en charge : 100	Non	Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Anthropic Claude 3, Sonnet.
On-demand modèle de demandes d'inférence par minute pour Anthropic Claude 3.5 Haiku	us-west-1 : 400 Chacune des autres régions prises en charge : 1 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude 3.5 Haiku. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modèles de demandes d'inférence par minute pour Anthropic Claude 3.5 Sonnet	us-west-2 : 250 ap-northeast-1 : 20 ap-southeast-1 : 20 eu-central-1 : 20 eu-west-1 : 20 eu-west-3 : 20 Chacune des autres régions prises en charge : 50	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Anthropic Claude 3.5 Sonnet. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand demandes d'inférence de modèles par minute pour Anthropic Claude 3.5 Sonnet V2	us-west-2 : 250 Chacune des autres régions prises en charge : 50	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Anthropic Claude 3.5 Sonnet V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand demandes d'inférence de modèles par minute pour Anthropic Claude 3.7 Sonnet V1	Chaque région prise en charge : 125	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude 3.7 Sonnet V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Anthropic Claude Opus 4.6 V1	Chaque région prise en charge : 5 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Opus 4.6 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modéliser les demandes d'inférence par minute pour Anthropic Claude Sonnet 4.6	Chaque région prise en charge : 5 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4.6. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modéliser les demandes d'inférence par minute pour Cohere Command R	Chaque région prise en charge : 400	Non	Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream pour Cohere Command R 128k.
On-demand demandes d'inférence de modèles par minute pour Cohere Command R Plus	Chaque région prise en charge : 400	Non	Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et de ConverseStream 128 000 InvokeModelWithResponseStream pour Cohere Command R Plus.
On-demand modèles de demandes d'inférence par minute pour Cohere Embed English	Chaque Région prise en charge : 2 000	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Cohere Embed English.
On-demand modéliser les demandes d'inférence par minute pour Cohere Embed Multilingual	Chaque Région prise en charge : 2 000	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Cohere Embed Multilingual.
On-demand demandes d'inférence de modèles par minute pour Cohere Embed V4	Chaque Région prise en charge : 1 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Cohere Embed V4. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modéliser les demandes d'inférence par minute pour Cohere R 3.5	Chaque région prise en charge : 250	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Cohere R 3.5.
On-demand demandes d'inférence de modèles par minute pour DeepSeek V3 V1	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour la DeepSeek V3 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour DeepSeek V3.2	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande pour lesquelles vous pouvez soumettre pour l'inférence de modèles en une minute. DeepSeek V3.2 Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour GPT OSS Safeguard 120B	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour GPT OSS Safeguard 120B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour GPT OSS Safeguard 20B	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour GPT OSS Safeguard 20B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Gemma 3 12B	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Gemma 3 12B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Gemma 3 27B	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Gemma 3 27B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Gemma 3 4B	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Gemma 3 4B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Kimi K2 Thinking	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Kimi K2 Thinking. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modèle de demandes d'inférence par minute pour Magistral Small 1.2	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Magistral Small 1.2. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3 70B Instruct	Chaque région prise en charge : 400	Non	Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3 70B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3 8B Instruct	Chaque région prise en charge : 800	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3 8B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3.1 405B Instruct	Chaque région prise en charge : 200	Non	Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 405B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3.1 70B Instruct	Chaque région prise en charge : 400	Non	Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 70B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3.1 8B Instruct	Chaque région prise en charge : 800	Non	Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 8B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3.2 11B Instruct	Chaque région prise en charge : 400	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Meta Llama 3.2 11B Instruct. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3.2 1B Instruct	Chaque région prise en charge : 800	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.2 1B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3.2 3B Instruct	Chaque région prise en charge : 800	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Meta Llama 3.2 3B Instruct. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3.2 90B Instruct	Chaque région prise en charge : 400	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Meta Llama 3.2 90B Instruct. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
On-demand demandes d'inférence de modèles par minute pour Meta Llama 3.3 70B Instruct	Chaque région prise en charge : 400	Non	Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.3 70B Instruct. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour MiniMax M2.5	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande pour lesquelles vous pouvez soumettre pour l'inférence de modèles en une minute. MiniMax M2.5 Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Minimax M2	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Minimax M2. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Minimax M2.1	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour M2.1 Minimax. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modéliser les demandes d'inférence par minute pour Ministral 14B 3.0	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Ministral 14B 3.0. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modéliser les demandes d'inférence par minute pour Ministral 3B 3.0	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Ministral 3B 3.0. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modéliser les demandes d'inférence par minute pour Ministral 8B 3.0	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Ministral 8B 3.0. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modéliser les demandes d'inférence par minute pour Mistral 7B Instruct	Chaque région prise en charge : 800	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Mistral mistral-7b-instruct-v0
On-demand demandes d'inférence de modèles par minute pour Mistral AI Mistral Small	Chaque région prise en charge : 400	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel et InvokeModelWithResponseStream en une minute pour Mistral AI Mistral Small
On-demand modéliser les demandes d'inférence par minute pour Mistral Devstral 2 123b	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Mistral Devstral 2 123b. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modéliser les demandes d'inférence par minute pour Mistral Large	Chaque région prise en charge : 400	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel et InvokeModelWithResponseStream en une minute pour Mistral mistral-large-2402-v1
On-demand demandes d'inférence de modèles par minute pour Mistral Large 2407	Chaque région prise en charge : 400	Non	Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Mistral Large 2407. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream
On-demand modéliser les demandes d'inférence par minute pour Mistral Large 3	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Mistral Large 3. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Mistral Mixtral 8x7b Instruct	Chaque région prise en charge : 400	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Mistral mixtral-8x7b-v0
On-demand demandes d'inférence de modèles par minute pour Moonshot AI Kimi K2.5	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Moonshot AI Kimi. K2.5 Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour NVIDIA Nemotron 3 Super 120B A12B	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour NVIDIA Nemotron 3 Super 120B A12B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour NVIDIA Nemotron Nano 2	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèle en une minute pour NVIDIA Nemotron Nano 2. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour NVIDIA Nemotron Nano 2 VL	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèle en une minute pour NVIDIA Nemotron Nano 2 VL. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Nemotron Nano 3 30B	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour le Nemotron Nano 3 30B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour OpenAI GPT OSS 120B	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour OpenAI GPT OSS 120B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour OpenAI GPT OSS 20B	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour OpenAI GPT OSS 20B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Qwen3 235B a22b 2507 V1	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 235B a22b 2507 V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Qwen3 32B V1	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 32B V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Qwen3 Coder 30B a3b V1	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 Coder 30B a3b V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Qwen3 Coder 480B a35b V1	Chaque région prise en charge : 10 000	Non	Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 Coder 480B a35b V1. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Qwen3 Coder Next	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Qwen3 Coder Next. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Qwen3 Next 80B A3B	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 Next 80B A3B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Qwen3 VL 235B A22B	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 VL 235B A22B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modéliser les demandes d'inférence par minute pour Stability.ai Stable Diffusion 3 Large	Chaque région prise en charge : 15	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Diffusion 3 Large.
On-demand modèles de demandes d'inférence par minute pour Stability.ai Stable Diffusion 3 Medium	Chaque région prise en charge : 60	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Diffusion 3 Medium
On-demand demandes d'inférence de modèles par minute pour Stability.ai Stable Diffusion 3.5 Large	Chaque région prise en charge : 15	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Diffusion 3.5 Large.
On-demand demandes d'inférence de modèles par minute pour Stability.ai Stable Image Core	Chaque région prise en charge : 90	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Image Core.
On-demand demandes d'inférence de modèles par minute pour Stability.ai Stable Image Ultra	Chaque Région prise en charge : 10	Non	Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Image Ultra.
On-demand demandes d'inférence de modèles par minute pour Stable Image Conservative Upscale	Chaque région prise en charge : 2	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Conservative Upscale. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Stable Image Control Sketch	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Control Sketch. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour une structure de contrôle d'image stable	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour une structure de contrôle d'image stable. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Stable Image Creative Upscale	Chaque région prise en charge : 2	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Creative Upscale. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour un objet d'effacement d'image stable	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour un objet d'effacement d'image stable. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Stable Image Fast Upscale	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Fast Upscale. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Stable Image Inpaint	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Inpaint. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Stable Image Outpaint	Chaque région prise en charge : 2	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Outpaint. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour une image stable Supprimer l'arrière-plan	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Remove Background. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Stable Image Search and Recolor	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Search and Recolor. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour la recherche et le remplacement d'images stables	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Search and Replace. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Stable Image Style Guide	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Stable Image Style Guide. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour un transfert de style d'image stable	Chaque Région prise en charge : 10	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour un transfert de style d'image stable. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Twelve Labs Marengo	Chaque région prise en charge : 100	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Twelve Labs Marengo. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Twelve Labs Pegasus	Chaque région prise en charge : 60	Oui	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Twelve Labs Pegasus. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand demandes d'inférence de modèles par minute pour TwelveLabs Marengo Embed 3.0	Chaque région prise en charge : 500	Oui	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour TwelveLabs Marengo Embed 3.0. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Voxtral Mini 1.0	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Voxtral Mini 1.0. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Voxtral Small 1.0	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Voxtral Small 1.0. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Writer Palmyra Vision 7B	Chaque région prise en charge : 10 000	Non	Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Writer Palmyra Vision 7B. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Z.ai GLM 5	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Z.ai GLM 5. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Z.ai GLM-4.7	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande pour lesquelles vous pouvez soumettre pour l'inférence de modèles en une minute. Z.ai GLM-4.7 Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand demandes d'inférence de modèles par minute pour Flash Z.ai GLM-4.7	Chaque région prise en charge : 10 000	Non	Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Z.ai GLM-4.7 Flash. Ce quota représente le nombre total de demandes adressées aux Converse ConverseStream, InvokeModel et d' InvokeModelWithResponseStream actions.
On-demand modèles de jetons d'inférence par minute pour AI21 Labs Jamba 1.5 Large	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez soumettre pour inférence de modèle en une minute pour AI21 Labs Jamba 1.5 Large. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse et InvokeModel.
On-demand modèles de jetons d'inférence par minute pour AI21 Labs Jamba 1.5 Mini	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez soumettre pour inférence de modèle en une minute pour AI21 Labs Jamba 1.5 Mini. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse et InvokeModel.
On-demand modèles de jetons d'inférence par minute pour Amazon Nova Lite	us-east-1 : 4 000 000 eu-west-2 : 4 000 000 Chacune des autres régions prises en charge : 200 000	Non	Le nombre maximum de jetons à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Lite. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Amazon Nova Micro	us-east-1 : 4 000 000 eu-west-2 : 4 000 000 Chacune des autres régions prises en charge : 200 000	Non	Nombre maximal de jetons à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Micro. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Amazon Nova Pro	Chaque région prise en charge : 1 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Pro. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Amazon Titan Image Generator G1 V2	Chaque Région prise en charge : 2 000	Non	Le nombre maximum de jetons à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Titan Image Generator G1 V2. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Amazon Titan Multimodal Embeddings G1	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Amazon Titan Multimodal Embeddings G1.
On-demand modèles de jetons d'inférence par minute pour Amazon Titan Text Embeddings	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Amazon Titan Text Embeddings.
On-demand modèles de jetons d'inférence par minute pour Amazon Titan Text Embeddings V2	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Amazon Titan Text Embeddings V2.
On-demand modèles de jetons d'inférence par minute pour Amazon Titan Text Express	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Amazon Titan Text Express. ConverseStream
On-demand modèles de jetons d'inférence par minute pour Amazon Titan Text Premier	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Amazon Titan Text Premier. ConverseStream
On-demand modéliser des jetons d'inférence par minute pour Anthropic Claude 3 Haiku	us-east-1 : 2 000 000 us-west-2 : 2 000 000 ap-northeast-1 : 200 000 ap-southeast-1 : 200 000 Chacune des autres régions prises en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Anthropic Claude 3 Haiku. ConverseStream
On-demand modéliser des jetons d'inférence par minute pour Anthropic Claude 3 Opus	Chaque région prise en charge : 400 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3 Opus. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Anthropic Claude 3 Sonnet	us-east-1 : 1 000 000 us-west-2 : 1 000 000 Chacune des autres régions prises en charge : 200 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Anthropic Claude 3 Sonnet. ConverseStream
On-demand modéliser des jetons d'inférence par minute pour Anthropic Claude 3.5 Haiku	us-west-1 : 300 000 Chacune des autres régions prises en charge : 2 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Haiku. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Anthropic Claude 3.5 Sonnet	us-west-2 : 2 000 000 ap-northeast-1 : 200 000 ap-southeast-1 : 200 000 eu-central-1 : 200 000 eu-west-1 : 200 000 eu-west-3 : 200 000 Chacune des autres régions prises en charge : 400 000	Non	Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Sonnet. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Anthropic Claude 3.5 Sonnet V2	us-west-2 : 2 000 000 Chacune des autres régions prises en charge : 400 000	Non	Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Sonnet V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Anthropic Claude 3.7 Sonnet V1	Chaque région prise en charge : 500 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.7 Sonnet V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Anthropic Claude Opus 4.6 V1	Chaque région prise en charge : 1 500 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4.6 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Anthropic Claude Sonnet 4.6	Chaque région prise en charge : 3 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4.6. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Cohere Command R	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Cohere Command R 128k. ConverseStream
On-demand modéliser des jetons d'inférence par minute pour Cohere Command R Plus	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream pour Cohere Command R Plus 128k.
On-demand modèles de jetons d'inférence par minute pour Cohere Embed English	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Cohere Embed English.
On-demand modéliser des jetons d'inférence par minute pour Cohere Embed Multilingual	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Cohere Embed Multilingual.
On-demand modéliser des jetons d'inférence par minute pour Cohere Embed V4	Chaque région prise en charge : 150 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Cohere Embed V4. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour DeepSeek V3 V1	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour la DeepSeek V3 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour DeepSeek V3.2	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande pour lesquels vous pouvez soumettre pour l'inférence du modèle en une minute. DeepSeek V3.2 Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour GPT OSS Safeguard 120B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour GPT OSS Safeguard 120B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour GPT OSS Safeguard 20B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour GPT OSS Safeguard 20B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Gemma 3 12B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Gemma 3 12B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Gemma 3 27B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Gemma 3 27B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Gemma 3 4B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Gemma 3 4B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Kimi K2 Thinking	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Kimi K2 Thinking. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Magistral Small 1.2	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Magistral Small 1.2. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3 70B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3 8B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3 8B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3.1 405B Instruct	Chaque région prise en charge : 400 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3.1 70B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3.1 8B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 8B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3.2 11B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 11B Instruct. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3.2 1B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 1B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3.2 3B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 3B Instruct. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3.2 90B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 90B Instruct. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
On-demand modèles de jetons d'inférence par minute pour Meta Llama 3.3 70B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.3 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour MiniMax M2.5	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande pour lesquels vous pouvez soumettre pour l'inférence du modèle en une minute. MiniMax M2.5 Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Minimax M2	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Minimax M2. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Minimax M2.1	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour M2.1 Minimax. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Ministral 14B 3.0	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Ministral 14B 3.0. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Ministral 3B 3.0	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Ministral 3B 3.0. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Ministral 8B 3.0	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Ministral 8B 3.0. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Mistral AI Mistral 7B Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Mistral AI Mistral 7B Instruct. ConverseStream
On-demand modèles de jetons d'inférence par minute pour Mistral AI Mistral Large	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Mistral AI Mistral Large. ConverseStream
On-demand modèles de jetons d'inférence par minute pour Mistral AI Mistral Small	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Mistral AI Mistral Small. ConverseStream
On-demand modèles de jetons d'inférence par minute pour Mistral AI Mixtral 8X7BB Instruct	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Mistral AI Mixtral 8X7B Instruct. ConverseStream
On-demand modèles de jetons d'inférence par minute pour Mistral Devstral 2 123b	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Mistral Devstral 2 123b. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Mistral Large 2407	Chaque région prise en charge : 300 000	Non	Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Mistral Large 2407. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream
On-demand modéliser des jetons d'inférence par minute pour Mistral Large 3	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Mistral Large 3. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Moonshot AI Kimi K2.5	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Moonshot AI Kimi. K2.5 Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour NVIDIA Nemotron 3 Super 120B A12B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour NVIDIA Nemotron 3 Super 120B A12B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour NVIDIA Nemotron Nano 2	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez envoyer pour l'inférence de modèle en une minute pour NVIDIA Nemotron Nano 2. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour NVIDIA Nemotron Nano 2 VL	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour NVIDIA Nemotron Nano 2 VL. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Nemotron Nano 3 30B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour le Nemotron Nano 3 30B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour OpenAI GPT OSS 120B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour OpenAI GPT OSS 120B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour OpenAI GPT OSS 20B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour OpenAI GPT OSS 20B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèle de jetons d'inférence par minute pour Qwen3 235B a22b 2507 V1	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Qwen3 235B a22b 2507 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Qwen3 32B V1	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 32B V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Qwen3 Coder 30B a3b V1	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 Coder 30B a3b V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Qwen3 Coder 480B a35b V1	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 Coder 480B a35b V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Qwen3 Coder Next	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Qwen3 Coder Next. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Qwen3 Next 80B A3B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 Next 80B A3B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Qwen3 VL 235B A22B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèle en une minute pour Qwen3 VL 235B A22B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Voxtral Mini 1.0	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Voxtral Mini 1.0. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Voxtral Small 1.0	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Voxtral Small 1.0. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modèles de jetons d'inférence par minute pour Writer Palmyra Vision 7B	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Writer Palmyra Vision 7B. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Z.ai GLM 5	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Z.ai GLM 5. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Z.ai GLM-4.7	Chaque région prise en charge : 100 000 000	Non	Le nombre maximum de jetons à la demande pour lesquels vous pouvez soumettre pour l'inférence du modèle en une minute. Z.ai GLM-4.7 Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
On-demand modéliser des jetons d'inférence par minute pour Flash Z.ai GLM-4.7	Chaque région prise en charge : 100 000 000	Non	Nombre maximal de jetons à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Z.ai GLM-4.7 Flash. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Paramètres par fonction	Chaque Région prise en charge : 5	Oui	Le nombre maximum de paramètres que vous pouvez avoir dans une fonction de groupe d'actions.
PrepareAgent demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' PrepareAgent API par seconde.
Tâche d'inférence d'enregistrements par lot pour Amazon Nova 2 Multimodal Embeddings V1	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour Amazon Nova 2 Multimodal Embeddings V1.
Tâche d'inférence d'enregistrements par lot pour Amazon Nova Premier	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour Amazon Nova Premier.
Nombre d'enregistrements par lot, tâche d'inférence pour Claude 3 Haiku	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Haiku.
Nombre d'enregistrements par lot (tâche d'inférence) pour Claude 3 Opus	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Opus.
Nombre d'enregistrements par lot : tâche d'inférence pour Claude 3 Sonnet	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Sonnet.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude 3.5 Haiku	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Haiku.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude 3.5 Sonnet	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude 3.5 Sonnet v2	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet v2.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude 3.7 Sonnet	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.7 Sonnet.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude Haiku 4.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Haiku 4.5.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude Opus 4.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Opus 4.5.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude Opus 4.6	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Opus 4.6.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude Sonnet 4	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Sonnet 4.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude Sonnet 4.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Sonnet 4.5.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude Sonnet 4.6	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude Sonnet 4.6.
Nombre d'enregistrements par tâche d'inférence par lot pour DeepSeek V3.2	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour DeepSeek V3.2.
Nombre d'enregistrements par tâche d'inférence par lot pour DeepSeek la v3	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour la DeepSeek version 3.
Nombre d'enregistrements par tâche d'inférence par lot pour Devstral 2 123B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Devstral 2 123B.
Nombre d'enregistrements par tâche d'inférence par lot pour GLM 4.7	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour GLM 4.7.
Nombre d'enregistrements par tâche d'inférence par lot pour GLM 4.7 Flash	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour GLM 4.7 Flash.
Nombre d'enregistrements par tâche d'inférence par lot pour GLM 5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour GLM 5.
Nombre d'enregistrements par tâche d'inférence par lot pour Gemma 3 12B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Gemma 3 12B.
Nombre d'enregistrements par tâche d'inférence par lot pour Gemma 3 27B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Gemma 3 27B.
Nombre d'enregistrements par tâche d'inférence par lot pour Gemma 3 4B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Gemma 3 4B.
Nombre d'enregistrements par tâche d'inférence par lot pour Kimi K2 Thinking	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Kimi K2 Thinking.
Nombre d'enregistrements par tâche d'inférence par lot pour Kimi K2.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Kimi K2.5.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.1 405B Instruct	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 405B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.1 70B Instruct	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 70B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.1 8B Instruct	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 8B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.2 11B Instruct	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 11B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.2 1B Instruct	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée d'une tâche d'inférence par lots Llama 3.2 1B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.2 3B Instruct	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 3B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.2 90B Instruct	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 90B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.3 70B Instruct	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.3 70B Instruct.
Nombre d'enregistrements par lot, tâche d'inférence pour Llama 4 Maverick	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 4 Maverick.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 4 Scout	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 4 Scout.
Nombre d'enregistrements par tâche d'inférence par lot pour Magistral Small 2509	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Magistral Small 2509.
Nombre d'enregistrements par tâche d'inférence par lot pour M2 MiniMax	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour MiniMax M2.
Nombre d'enregistrements par tâche d'inférence par lot pour MiniMax M2.1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour MiniMax M2.1.
Nombre d'enregistrements par tâche d'inférence par lot pour MiniMax M2.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour MiniMax M2.5.
Nombre d'enregistrements par tâche d'inférence par lot pour Ministral 3 14B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Ministral 3 14B.
Nombre d'enregistrements par tâche d'inférence par lot pour Ministral 3 8B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Ministral 3 8B.
Nombre d'enregistrements par tâche d'inférence par lot pour Ministral 3B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Ministral 3B.
Nombre d'enregistrements par tâche d'inférence par lot pour Mistral Large 2 (24.07)	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Large 2 (24,07).
Nombre d'enregistrements par tâche d'inférence par lot pour Mistral Large 3	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Large 3.
Nombre d'enregistrements par tâche d'inférence par lot pour Mistral Small	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Small.
Nombre d'enregistrements par tâche d'inférence par lot pour NVIDIA Nemotron 3 Super 120B A12B	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron 3 Super 120B A12B.
Nombre d'enregistrements par tâche d'inférence par lot pour NVIDIA Nemotron Nano 12B	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron Nano 12B.
Nombre d'enregistrements par tâche d'inférence par lot pour NVIDIA Nemotron Nano 3 30B	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron Nano 3 30B.
Nombre d'enregistrements par tâche d'inférence par lot pour NVIDIA Nemotron Nano 9B	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron Nano 9B.
Nombre d'enregistrements par tâche d'inférence par lot pour Nova 2 Lite	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova 2 Lite.
Nombre d'enregistrements par tâche d'inférence par lot pour Nova Lite V1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Lite V1.
Nombre d'enregistrements par tâche d'inférence par lot pour Nova Micro V1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Micro V1.
Nombre d'enregistrements par tâche d'inférence par lot pour Nova Pro V1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Pro V1.
Nombre d'enregistrements par tâche d'inférence par lot pour OpenAI GPT OSS 120b	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS 120b.
Nombre d'enregistrements par tâche d'inférence par lot pour OpenAI GPT OSS 20b	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS 20b.
Nombre d'enregistrements par tâche d'inférence par lot pour OpenAI GPT OSS Safeguard 120b	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 120b.
Nombre d'enregistrements par tâche d'inférence par lot pour OpenAI GPT OSS Safeguard 20b	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements pour tous les fichiers d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 20b.
Nombre d'enregistrements par tâche d'inférence par lot pour Qwen3 235B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 235B.
Nombre d'enregistrements par tâche d'inférence par lot pour Qwen3 32B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 32B.
Nombre d'enregistrements par tâche d'inférence par lot pour Qwen3 Coder 30B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 Coder 30B.
Nombre d'enregistrements par tâche d'inférence par lot pour Qwen3 Coder 480B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 Coder 480B.
Nombre d'enregistrements par tâche d'inférence par lot pour Qwen3 Coder Next	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 Coder Next.
Nombre d'enregistrements par tâche d'inférence par lot pour Qwen3 Next 80B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 Next 80B.
Nombre d'enregistrements par tâche d'inférence par lot pour Qwen3 VL 235B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Qwen3 VL 235B.
Nombre d'enregistrements par tâche d'inférence par lot pour Titan Multimodal Embeddings G1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Titan Multimodal Embeddings G1.
Nombre d'enregistrements par tâche d'inférence par lot pour Titan Text Embeddings V2	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Titan Text Embeddings V2.
Nombre d'enregistrements par tâche d'inférence par lot pour Voxtral Mini 3B 2507	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Voxtral Mini 3B 2507.
Nombre d'enregistrements par tâche d'inférence par lot pour Voxtral Small 24B 2507	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Voxtral Small 24B 2507.
Nombre d'enregistrements par tâche d'inférence par lot pour Writer Palmyra Vision 7B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Writer Palmyra Vision 7B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Amazon Nova 2 Multimodal Embeddings V1	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Amazon Nova 2 Multimodal Embeddings V1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Amazon Nova Premier	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Amazon Nova Premier.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3 Haiku	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3 Haiku.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3 Opus	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3 Opus.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3 Sonnet	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3 Sonnet.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3.5 Haiku	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Haiku.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3.5 Sonnet	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3.5 Sonnet v2	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet v2.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3.7 Sonnet	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3.7 Sonnet.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude Haiku 4.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude Haiku 4.5.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude Opus 4.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude Opus 4.5.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude Opus 4.6	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude Opus 4.6.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude Sonnet 4	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude Sonnet 4.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude Sonnet 4.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude Sonnet 4.5.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude Sonnet 4.6	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude Sonnet 4.6.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour DeepSeek V3.2	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour DeepSeek V3.2.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour la version 3 DeepSeek	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour la DeepSeek version 3.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Devstral 2 123B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Devstral 2 123B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour GLM 4.7	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour GLM 4.7.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour GLM 4.7 Flash	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour GLM 4.7 Flash.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour GLM 5	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour GLM 5.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Gemma 3 12B	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Gemma 3 12B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Gemma 3 27B	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Gemma 3 27B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Gemma 3 4B	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Gemma 3 4B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Kimi K2 Thinking	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Kimi K2 Thinking.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Kimi K2.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Kimi K2.5.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.1 405B Instruct	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.1 405B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.1 70B Instruct	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.1 70B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.1 8B Instruct	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.1 8B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.2 11B Instruct	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.2 11B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.2 1B Instruct	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots Llama 3.2 1B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.2 3B Instruct	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.2 3B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.2 90B Instruct	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.2 90B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.3 70B Instruct	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.3 70B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 4 Maverick	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 4 Maverick.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 4 Scout	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 4 Scout.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Magistral Small 2509	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Magistral Small 2509.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour M2 MiniMax	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour MiniMax M2.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour MiniMax M2.1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour MiniMax M2.1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour MiniMax M2.5	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour MiniMax M2.5.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Ministral 3 14B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Ministral 3 14B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Ministral 3 8B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Ministral 3 8B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Ministral 3B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Ministral 3B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Mistral Large 2 (24.07)	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Mistral Large 2 (24,07).
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Mistral Large 3	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Mistral Large 3.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Mistral Small	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Mistral Small.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour NVIDIA Nemotron 3 Super 120B A12B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron 3 Super 120B A12B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour NVIDIA Nemotron Nano 12B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron Nano 12B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour NVIDIA Nemotron Nano 3 30B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron Nano 3 30B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour NVIDIA Nemotron Nano 9B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour NVIDIA Nemotron Nano 9B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Nova 2 Lite	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Nova 2 Lite.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Nova Lite V1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Nova Lite V1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Nova Micro V1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Nova Micro V1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Nova Pro V1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Nova Pro V1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour OpenAI GPT OSS 120b	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS 120b.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour OpenAI GPT OSS 20b	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS 20b.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 120b	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 120b.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 20b	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour OpenAI GPT OSS Safeguard 20b.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Qwen3 235B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Qwen3 235B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Qwen3 32B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Qwen3 32B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Qwen3 Coder 30B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Qwen3 Coder 30B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Qwen3 Coder 480B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Qwen3 Coder 480B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Qwen3 Coder Next	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Qwen3 Coder Next.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Qwen3 Next 80B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Qwen3 Next 80B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Qwen3 VL 235B	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Qwen3 VL 235B.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Titan Multimodal Embeddings G1	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Titan Multimodal Embeddings G1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Titan Text Embeddings V2	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Titan Text Embeddings V2.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Voxtral Mini 3B 2507	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Voxtral Mini 3B 2507.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Voxtral Small 24B 2507	Chaque région prise en charge : 100 000	Oui	Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Voxtral Small 24B 2507.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Writer Palmyra Vision 7B	Chaque région prise en charge : 100 000	Oui	Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Writer Palmyra Vision 7B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Amazon Nova 2 Multimodal Embeddings V1	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Amazon Nova 2 Multimodal Embeddings V1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Amazon Nova Premier	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Amazon Nova Premier.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Haiku	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Haiku.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Opus	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Opus.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Sonnet	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Sonnet.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Haiku	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Haiku.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Sonnet	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Sonnet.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Sonnet v2	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Sonnet v2.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.7 Sonnet	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.7 Sonnet.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Haiku 4.5	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Haiku 4.5.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Opus 4.5	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Opus 4.5.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Opus 4.6	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Opus 4.6.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Sonnet 4	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Sonnet 4.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Sonnet 4.5.	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Sonnet 4.5.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Sonnet 4.6	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude Sonnet 4.6.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour DeepSeek V3.2	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour. DeepSeek V3.2
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour la version 3 DeepSeek	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour DeepSeek la version 3.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Devstral 2 123B	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Devstral 2 123B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour GLM 4.7	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour GLM 4.7.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour GLM 4.7 Flash	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour GLM 4.7 Flash.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour GLM 5	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour GLM 5.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Gemma 3 12B	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Gemma 3 12B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Gemma 3 27B	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Gemma 3 27B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Gemma 3 4B	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Gemma 3 4B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Kimi K2 Thinking	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Kimi K2 Thinking.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Kimi K2.5	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Kimi. K2.5
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 405B Instruct	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 405B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 70B Instruct	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 70B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 8B Instruct	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 8B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 11B Instruct	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 11B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 1B Instruct	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 1B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 3B Instruct	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 3B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 90B Instruct	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 90B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.3 70B Instruct	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.3 70B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 4 Maverick	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 4 Maverick.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 4 Scout	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 4 Scout.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Magistral Small 2509	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Magistral Small 2509.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour M2 MiniMax	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour MiniMax M2.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour MiniMax M2.1	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour. MiniMax M2.1
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour MiniMax M2.5	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour. MiniMax M2.5
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Ministral 3 14B	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Ministral 3 14B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Ministral 3 8B	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Ministral 3 8B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Ministral 3B	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Ministral 3B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Large 2 (24.07)	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Large 2 (24,07).
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Large 3	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Large 3.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Small	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Small.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour NVIDIA Nemotron 3 Super 120B A12B	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour NVIDIA Nemotron 3 Super 120B A12B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour NVIDIA Nemotron Nano 12B	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour NVIDIA Nemotron Nano 12B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour NVIDIA Nemotron Nano 3 30B	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour NVIDIA Nemotron Nano 3 30B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour NVIDIA Nemotron Nano 9B	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour NVIDIA Nemotron Nano 9B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova 2 Lite	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova 2 Lite.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Lite V1	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Lite V1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Micro V1	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Micro V1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Pro V1	Chaque région prise en charge : 100	Oui	Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Pro V1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour OpenAI GPT OSS 120b	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour OpenAI GPT OSS 120b.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour OpenAI GPT OSS 20b	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour OpenAI GPT OSS 20b.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour OpenAI GPT OSS Safeguard 120b	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour OpenAI GPT OSS Safeguard 120b.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour OpenAI GPT OSS Safeguard 20b	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour OpenAI GPT OSS Safeguard 20b.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 235B	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 235B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 32B	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 32B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 Coder 30B	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 Coder 30B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 Coder 480B	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 Coder 480B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 Coder Next	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 Coder Next.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 Next 80B	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 Next 80B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 VL 235B	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Qwen3 VL 235B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Titan Multimodal Embeddings G1	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Titan Multimodal Embeddings G1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Titan Text Embeddings V2	Chaque région prise en charge : 100	Oui	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Titan Text Embeddings V2.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Voxtral Mini 3B 2507	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Voxtral Mini 3B 2507.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Voxtral Small 24B 2507	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Voxtral Small 24B 2507.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Writer Palmyra Vision 7B	Chaque région prise en charge : 100	Oui	Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Writer Palmyra Vision 7B.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle personnalisé pour Titan Multimodal Embeddings G1	Chaque région prise en charge : 3	Non	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle personnalisé pour Titan Multimodal Embeddings G1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle personnalisé pour Titan Text Embeddings V2	Chaque région prise en charge : 3	Non	Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle personnalisé pour Titan Text Embeddings V2
Limite de fréquence d'accélération pour Bedrock Data Automation Runtime : ListTagsForResource	Chaque région prise en charge : 25 par seconde	Non	Le nombre maximum de Bedrock Data Automation Runtime : ListTagsForResource demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de fréquence d'accélération pour Bedrock Data Automation Runtime : TagResource	Chaque région prise en charge : 25 par seconde	Non	Le nombre maximum de Bedrock Data Automation Runtime : TagResource demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de fréquence d'accélération pour Bedrock Data Automation Runtime : UntagResource	Chaque région prise en charge : 25 par seconde	Non	Le nombre maximum de Bedrock Data Automation Runtime : UntagResource demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélération pour Bedrock Data Automation : ListTagsForResource	Chaque région prise en charge : 25 par seconde	Non	Le nombre maximum de Bedrock Data Automation : ListTagsForResource demandes que vous pouvez faire par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélération pour Bedrock Data Automation : TagResource	Chaque région prise en charge : 25 par seconde	Non	Le nombre maximum de Bedrock Data Automation : TagResource demandes que vous pouvez faire par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélération pour Bedrock Data Automation : UntagResource	Chaque région prise en charge : 25 par seconde	Non	Le nombre maximum de Bedrock Data Automation : UntagResource demandes que vous pouvez faire par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour CreateBlueprint	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de CreateBlueprint demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour CreateBlueprintVersion	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de CreateBlueprintVersion demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour CreateDataAutomationLibrary	Chaque région prise en charge : 3 par seconde	Non	Le nombre maximum de CreateDataAutomationLibrary demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour CreateDataAutomationProject	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de CreateDataAutomationProject demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour DeleteBlueprint	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de DeleteBlueprint demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour DeleteDataAutomationLibrary	Chaque région prise en charge : 3 par seconde	Non	Le nombre maximum de DeleteDataAutomationLibrary demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour DeleteDataAutomationProject	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de DeleteDataAutomationProject demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour GetBlueprint	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de GetBlueprint demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour GetDataAutomationLibrary	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de GetDataAutomationLibrary demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour GetDataAutomationLibraryEntity	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de GetDataAutomationLibraryEntity demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour GetDataAutomationLibraryIngestionJob	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de GetDataAutomationLibraryIngestionJob demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour GetDataAutomationProject	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de GetDataAutomationProject demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour GetDataAutomationStatus	Chaque Région prise en charge : 10 par seconde	Non	Le nombre maximum de GetDataAutomationStatus demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour InvokeDataAutomationAsync	Chaque Région prise en charge : 10 par seconde	Non	Le nombre maximum de InvokeDataAutomationAsync demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour InvokeDataAutomationLibraryIngestionJob	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de InvokeDataAutomationLibraryIngestionJob demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour ListBlueprints	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de ListBlueprints demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour ListDataAutomationLibraries	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de ListDataAutomationLibraries demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour ListDataAutomationLibraryEntities	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de ListDataAutomationLibraryEntities demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour ListDataAutomationLibraryIngestionJobs	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de ListDataAutomationLibraryIngestionJobs demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour ListDataAutomationProjects	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de ListDataAutomationProjects demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour UpdateBlueprint	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de UpdateBlueprint demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour UpdateDataAutomationLibrary	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de UpdateDataAutomationLibrary demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour UpdateDataAutomationProject	Chaque région prise en charge : 5 par seconde	Non	Le nombre maximum de UpdateDataAutomationProject demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
UpdateAgent demandes par seconde	Chaque Région prise en charge : 4	Non	Le nombre maximum de demandes d' UpdateAgent API par seconde.
UpdateAgentActionGroup demandes par seconde	Chaque région prise en charge : 6	Non	Le nombre maximum de demandes d' UpdateAgentActionGroup API par seconde.
UpdateAgentAlias demandes par seconde	Chaque région prise en charge : 2	Non	Le nombre maximum de demandes d' UpdateAgentAlias API par seconde.
UpdateAgentKnowledgeBase demandes par seconde	Chaque Région prise en charge : 4	Non	Le nombre maximum de demandes d' UpdateAgentKnowledgeBase API par seconde.
[point de terminaison bedrock-mantle] Entrez des jetons par minute pour Claude Opus 4.7	Chaque région prise en charge : 20 000 000	Oui	[bedrock-mantle endpoint] Le nombre maximum de jetons d'entrée par minute que votre compte peut envoyer à Claude Opus 4.7 dans cette région. Partagé entre toutes les API de ce modèle.
[point de terminaison bedrock-mantle] Entrez des jetons par minute pour Claude Opus 4.8	Chaque région prise en charge : 20 000 000	Oui	[bedrock-mantle endpoint] Le nombre maximum de jetons d'entrée par minute que votre compte peut envoyer à Claude Opus 4.8 dans cette région. Partagé entre toutes les API de ce modèle.
[point de terminaison bedrock-mantle] Entrez des jetons par minute pour GPT-5.4	Chaque région prise en charge : 20 000 000	Oui	[bedrock-mantle endpoint] Le nombre maximum de jetons d'entrée par minute auxquels votre compte peut envoyer des données dans cette région. GPT-5.4 Partagé entre toutes les API de ce modèle.
[point de terminaison bedrock-mantle] Entrez des jetons par minute pour GPT-5.5	Chaque région prise en charge : 10 000 000	Oui	[bedrock-mantle endpoint] Le nombre maximum de jetons d'entrée par minute auxquels votre compte peut envoyer des données dans cette région. GPT-5.5 Partagé entre toutes les API de ce modèle.
[point de terminaison bedrock-mantle] Jetons de sortie par minute pour Claude Opus 4.7	Chaque région prise en charge : 2 000 000	Oui	[point de terminaison bedrock-mantle] Le nombre maximum de jetons de sortie par minute que Claude Opus 4.7 peut générer pour votre compte dans cette région. Partagé entre toutes les API de ce modèle.
[point de terminaison bedrock-mantle] Jetons de sortie par minute pour Claude Opus 4.8	Chaque région prise en charge : 2 000 000	Oui	[point de terminaison bedrock-mantle] Le nombre maximum de jetons de sortie par minute que Claude Opus 4.8 peut générer pour votre compte dans cette région. Partagé entre toutes les API de ce modèle.
[point de terminaison bedrock-mantle] Jetons de sortie par minute pour GPT-5.4	Chaque région prise en charge : 2 000 000	Oui	[point de terminaison bedrock-mantle] Le nombre maximum de jetons de sortie par minute que GPT-5.4 vous pouvez générer pour votre compte dans cette région. Partagé entre toutes les API de ce modèle.
[point de terminaison bedrock-mantle] Jetons de sortie par minute pour GPT-5.5	Chaque Région prise en charge : 1 000 000	Oui	[point de terminaison bedrock-mantle] Le nombre maximum de jetons de sortie par minute que GPT-5.5 vous pouvez générer pour votre compte dans cette région. Partagé entre toutes les API de ce modèle.

Note

Vous pouvez demander une augmentation du quota de votre compte en suivant les étapes ci-dessous :

Si un quota est marqué Oui, vous pouvez l’ajuster en suivant les étapes décrites dans Demande d’augmentation de quota dans le Guide d’utilisation de Service Quotas.
Si un quota est marqué comme Non, vous pouvez soumettre une demande par le biais du formulaire d'augmentation des limites pour qu'une augmentation soit prise en compte.
Pour tout modèle, vous pouvez demander une augmentation pour les quotas suivants ensemble :
- Cross-Region InvokeModel jetons par minute pour ${model}
- Cross-Region InvokeModel demandes par minute pour ${model}
- On-demand InvokeModel jetons par minute pour ${model}
- On-demand InvokeModel demandes par minute pour ${model}
Pour demander une augmentation pour n'importe quelle combinaison de ces quotas, demandez une augmentation du nombre de Cross-Region InvokeModel jetons par minute pour le ${model} quota en suivant les étapes décrites dans la section Demander une augmentation de quota dans le Guide de l'utilisateur du Service Quotas. Une fois cela fait, l'équipe d'assistance vous contactera et vous proposera la possibilité d'augmenter également les trois autres quotas. En raison de la forte demande, la priorité sera accordée aux clients dont le trafic consomme le quota qui leur est alloué. Votre demande peut être refusée si vous ne remplissez pas cette condition.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

AWS Batch

Amazon Bedrock AgentCore