Points de terminaison et quotas Amazon Bedrock - AWS Référence générale

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Points de terminaison et quotas Amazon Bedrock

Pour vous connecter par programmation à un AWS service, vous utilisez un point de terminaison. AWS les services proposent les types de terminaux suivants dans certaines ou toutes les AWS régions prises en charge par le service : points de terminaison, IPv4 points de terminaison à double pile et points de terminaison FIPS. Certains services fournissent des points de terminaison mondiaux. Pour de plus amples informations, veuillez consulter AWS points de terminaison de service.

Les quotas de service, également appelés limites, correspondent au nombre maximal de ressources ou d'opérations de service pour votre AWS compte. Pour de plus amples informations, veuillez consulter AWS quotas de service.

Vous trouverez ci-dessous les points de terminaison et les quotas de service pour ce service.

Points de terminaison du service Amazon Bedrock

Plan de contrôle Amazon Bedrock APIs

Le tableau suivant fournit une liste des points de terminaison spécifiques à une région pris en charge par Amazon Bedrock pour la gestion, la formation et le déploiement de modèles. Utilisez ces points de terminaison pour les opérations de l'API Amazon Bedrock.

Nom de la région Région Point de terminaison Protocole
US East (Ohio) us-east-2

bedrock.us-east-2.amazonaws.com

bedrock-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

US East (N. Virginia) us-east-1

bedrock.us-east-1.amazonaws.com

bedrock-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

USA Ouest (Oregon) us-west-2

bedrock.us-west-2.amazonaws.com

bedrock-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

Asie-Pacifique (Hyderabad) ap-south-2 bedrock.ap-south-2.amazonaws.com HTTPS
Asia Pacific (Mumbai) ap-south-1 bedrock.ap-south-1.amazonaws.com HTTPS
Asie-Pacifique (Osaka) ap-northeast-3 bedrock.ap-northeast-3.amazonaws.com HTTPS
Asia Pacific (Seoul) ap-northeast-2 bedrock.ap-northeast-2.amazonaws.com HTTPS
Asie-Pacifique (Singapour) ap-southeast-1 bedrock.ap-southeast-1.amazonaws.com HTTPS
Asie-Pacifique (Sydney) ap-southeast-2 bedrock.ap-southeast-2.amazonaws.com HTTPS
Asie-Pacifique (Tokyo) ap-northeast-1 bedrock.ap-northeast-1.amazonaws.com HTTPS
Canada (Centre) ca-central-1

bedrock.ca-central-1.amazonaws.com

bedrock-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

Europe (Francfort) eu-central-1 bedrock.eu-central-1.amazonaws.com HTTPS
Europe (Irlande) eu-west-1 bedrock.eu-west-1.amazonaws.com HTTPS
Europe (Londres) eu-west-2 bedrock.eu-west-2.amazonaws.com HTTPS
Europe (Milan) eu-south-1 bedrock.eu-south-1.amazonaws.com HTTPS
Europe (Paris) eu-west-3 bedrock.eu-west-3.amazonaws.com HTTPS
Europe (Espagne) eu-south-2 bedrock.eu-south-2.amazonaws.com HTTPS
Europe (Stockholm) eu-north-1 bedrock.eu-north-1.amazonaws.com HTTPS
Europe (Zurich) eu-central-2 bedrock.eu-central-2.amazonaws.com HTTPS
Amérique du Sud (São Paulo) sa-east-1 bedrock.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (USA Est) us-gov-east-1

bedrock.us-gov-east-1.amazonaws.com

bedrock-fips.us-gov-east-1.amazonaws.com

HTTPS

HTTPS

AWS GovCloud (US-Ouest) us-gov-west-1

bedrock.us-gov-west-1.amazonaws.com

bedrock-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

Temps d'exécution d'Amazon Bedrock APIs

Le tableau suivant fournit une liste des points de terminaison spécifiques à une région pris en charge par Amazon Bedrock pour effectuer des demandes d'inférence pour les modèles hébergés dans Amazon Bedrock. Utilisez ces points de terminaison pour les opérations de l'API Amazon Bedrock Runtime.

Nom de la région Région Point de terminaison Protocole
US East (Ohio) us-east-2

bedrock-runtime.us-east-2.amazonaws.com

bedrock-runtime-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

US East (N. Virginia) us-east-1

bedrock-runtime.us-east-1.amazonaws.com

bedrock-runtime-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

USA Ouest (Oregon) us-west-2

bedrock-runtime.us-west-2.amazonaws.com

bedrock-runtime-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

Asie-Pacifique (Hyderabad) ap-south-2 bedrock-runtime.ap-south-2.amazonaws.com HTTPS
Asia Pacific (Mumbai) ap-south-1 bedrock-runtime.ap-south-1.amazonaws.com HTTPS
Asie-Pacifique (Osaka) ap-northeast-3 bedrock-runtime.ap-northeast-3.amazonaws.com HTTPS
Asia Pacific (Seoul) ap-northeast-2 bedrock-runtime.ap-northeast-2.amazonaws.com HTTPS
Asie-Pacifique (Singapour) ap-southeast-1 bedrock-runtime.ap-southeast-1.amazonaws.com HTTPS
Asie-Pacifique (Sydney) ap-southeast-2 bedrock-runtime.ap-southeast-2.amazonaws.com HTTPS
Asie-Pacifique (Tokyo) ap-northeast-1 bedrock-runtime.ap-northeast-1.amazonaws.com HTTPS
Canada (Centre) ca-central-1

bedrock-runtime.ca-central-1.amazonaws.com

bedrock-runtime-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

Europe (Francfort) eu-central-1 bedrock-runtime.eu-central-1.amazonaws.com HTTPS
Europe (Irlande) eu-west-1 bedrock-runtime.eu-west-1.amazonaws.com HTTPS
Europe (Londres) eu-west-2 bedrock-runtime.eu-west-2.amazonaws.com HTTPS
Europe (Milan) eu-south-1 bedrock-runtime.eu-south-1.amazonaws.com HTTPS
Europe (Paris) eu-west-3 bedrock-runtime.eu-west-3.amazonaws.com HTTPS
Europe (Espagne) eu-south-2 bedrock-runtime.eu-south-2.amazonaws.com HTTPS
Europe (Stockholm) eu-north-1 bedrock-runtime.eu-north-1.amazonaws.com HTTPS
Europe (Zurich) eu-central-2 bedrock-runtime.eu-central-2.amazonaws.com HTTPS
Amérique du Sud (São Paulo) sa-east-1 bedrock-runtime.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (USA Est) us-gov-east-1

bedrock-runtime.us-gov-east-1.amazonaws.com

bedrock-runtime-fips.us-gov-east-1.amazonaws.com

HTTPS

HTTPS

AWS GovCloud (US-Ouest) us-gov-west-1

bedrock-runtime.us-gov-west-1.amazonaws.com

bedrock-runtime-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

Agents pour Amazon Bedrock Build-time APIs

Le tableau suivant fournit une liste des points de terminaison spécifiques à une région pris en charge par Agents for Amazon Bedrock pour créer et gérer des agents et des bases de connaissances. Utilisez ces points de terminaison pour les opérations de l'API Agents for Amazon Bedrock.

Nom de la région Région Point de terminaison Protocole
USA Est (Virginie du Nord) us-east-1 bedrock-agent.us-east-1.amazonaws.com HTTPS
bedrock-agent-fips.us-east-1.amazonaws.com HTTPS
USA Ouest (Oregon) us-west-2 bedrock-agent.us-west-2.amazonaws.com HTTPS
bedrock-agent-fips.us-west-2.amazonaws.com HTTPS
Asie-Pacifique (Singapour) ap-southeast-1 bedrock-agent.ap-southeast-1.amazonaws.com HTTPS
Asie-Pacifique (Sydney) ap-southeast-2 bedrock-agent.ap-southeast-2.amazonaws.com HTTPS
Asie-Pacifique (Tokyo) ap-northeast-1 bedrock-agent.ap-northeast-1.amazonaws.com HTTPS
Canada (Centre) ca-central-1 bedrock-agent.ca-central-1.amazonaws.com HTTPS
Europe (Francfort) eu-central-1 bedrock-agent.eu-central-1.amazonaws.com HTTPS
Europe (Irlande) eu-west-1 bedrock-agent.eu-west-1.amazonaws.com HTTPS
Europe (Londres) eu-west-2 bedrock-agent.eu-west-2.amazonaws.com HTTPS
Europe (Paris) eu-west-3 bedrock-agent.eu-west-3.amazonaws.com HTTPS
Asie-Pacifique (Mumbai) ap-south-1 bedrock-agent.ap-south-1.amazonaws.com HTTPS
Amérique du Sud (São Paulo) sa-east-1 bedrock-agent.sa-east-1.amazonaws.com HTTPS

Agents pour Amazon Bedrock Runtime APIs

Le tableau suivant fournit une liste des points de terminaison spécifiques à une région pris en charge par Agents for Amazon Bedrock pour appeler des agents et interroger des bases de connaissances. Utilisez ces points de terminaison pour les opérations de l'API Agents for Amazon Bedrock Runtime.

Nom de la région Région Point de terminaison Protocole
USA Est (Virginie du Nord) us-east-1 bedrock-agent-runtime.us-east-1.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-east-1.amazonaws.com HTTPS
USA Ouest (Oregon) us-west-2 bedrock-agent-runtime.us-west-2.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-west-2.amazonaws.com HTTPS
Asie-Pacifique (Singapour) ap-southeast-1 bedrock-agent-runtime.ap-southeast-1.amazonaws.com HTTPS
Asie-Pacifique (Sydney) ap-southeast-2 bedrock-agent-runtime.ap-southeast-2.amazonaws.com HTTPS
Asie-Pacifique (Tokyo) ap-northeast-1 bedrock-agent-runtime.ap-northeast-1.amazonaws.com HTTPS
Canada (Centre) ca-central-1 bedrock-agent-runtime.ca-central-1.amazonaws.com HTTPS
Europe (Francfort) eu-central-1 bedrock-agent-runtime.eu-central-1.amazonaws.com HTTPS
Europe (Paris) eu-west-3 bedrock-agent-runtime.eu-west-3.amazonaws.com HTTPS
Europe (Irlande) eu-west-1 bedrock-agent-runtime.eu-west-1.amazonaws.com HTTPS
Europe (Londres) eu-west-2 bedrock-agent-runtime.eu-west-2.amazonaws.com HTTPS
Asie-Pacifique (Mumbai) ap-south-1 bedrock-agent-runtime.ap-south-1.amazonaws.com HTTPS
Amérique du Sud (São Paulo) sa-east-1 bedrock-agent-runtime.sa-east-1.amazonaws.com HTTPS

Automatisation des données Amazon Bedrock APIs

Le tableau suivant fournit une liste des points de terminaison spécifiques à une région pris en charge par Data Automation for Amazon Bedrock. Les points de terminaison qui utilisent le mot runtime invoquent des plans et des projets pour extraire des informations des fichiers. Utilisez ces points de terminaison pour les opérations de l'API Amazon Bedrock Data Automation Runtime. Les points de terminaison runtime non utilisés sont utilisés pour créer des plans et des projets fournissant des conseils d'extraction. Utilisez ces points de terminaison pour les opérations de création de l'API Amazon Bedrock Data Automation

Nom de la région Région Point de terminaison Protocole
USA Est (Virginie du Nord) us-east-1

bedrock-data-automation.us-east-1.amazonaws.com

bedrock-data-automation-runtime.us-east-1.amazonaws.com

bedrock-data-automation-fips.us-east-1.amazonaws.com

bedrock-data-automation-runtime-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

HTTPS

HTTPS

USA Ouest (Oregon) us-west-2

bedrock-data-automation.us-west-2.amazonaws.com

bedrock-data-automation-runtime.us-west-2.amazonaws.com

bedrock-data-automation-fips.us-west-2.amazonaws.com

bedrock-data-automation-runtime-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

HTTPS

HTTPS

Quotas de service Amazon Bedrock

Astuce

Amazon Bedrock disposant d'un grand nombre de quotas, nous vous recommandons de consulter les quotas de service à l'aide de la console plutôt que d'utiliser le tableau ci-dessous. Ouvrez Amazon Bedrock quotas. Utilisez le champ de recherche pour trouver des quotas spécifiques. Utilisez l'icône en forme de roue dentée pour contrôler le nombre de quotas affichés sur une page.

Nom Par défaut Ajustable Description
(Automatisation des données) (Console) Taille maximale du fichier de document (Mo) Chaque région prise en charge : 200 Non Taille de fichier maximale pour la console
(Automatisation des données) (Console) Nombre maximal de pages par fichier de document Chaque Région prise en charge : 20 Non Le nombre maximum de pages par document dans la console
(Automatisation des données) CreateBlueprint - Nombre maximum de plans par compte Chaque région prise en charge : 350 Oui Le nombre maximum de plans par compte
(Automatisation des données) CreateBlueprintVersion - Nombre maximal de versions de Blueprint par Blueprint Par région prise en charge : 10 Oui Le nombre maximum de versions par plan
(Automatisation des données) Longueur de la description des champs (caractères) Chaque région prise en charge : 300 Non Longueur maximale de description pour les champs en caractères
(Automatisation des données) InvokeDataAutomationAsync - Audio - Nombre maximal de tâches simultanées Chaque région prise en charge : 20 Oui Le nombre maximum de tâches ouvertes Invoke Data Automation Async pour les fichiers audio
(Automatisation des données) InvokeDataAutomationAsync - Document - Nombre maximal de tâches simultanées Chaque région prise en charge : 25 Oui Le nombre maximum de tâches ouvertes Invoke Data Automation Async pour les documents
(Automatisation des données) InvokeDataAutomationAsync - Image - Nombre maximal de tâches simultanées Chaque région prise en charge : 20 Oui Le nombre maximum de tâches ouvertes Invoke Data Automation Async pour les images
(Automatisation des données) InvokeDataAutomationAsync - Nombre maximum de postes vacants Chaque région prise en charge : 1 800 Non Le nombre maximum de tâches ouvertes Invoke Data Automation Async pour les images
(Automatisation des données) InvokeDataAutomationAsync - Vidéo - Nombre maximal de tâches simultanées Chaque région prise en charge : 20 Oui Le nombre maximum de jobs ouverts par Invoke Data Automation Async pour les vidéos
(Automatisation des données) Fréquence d'échantillonnage audio maximale (Hz) Chaque région prise en charge : 48 000 Non Fréquence d'échantillonnage audio maximale
(Automatisation des données) Nombre maximum de plans par projet (Audios) Par région prise en charge : 1 Non Le nombre maximum de plans par projet pour les fichiers audio
(Automatisation des données) Nombre maximal de plans par projet (documents) Chaque Région prise en charge : 40 Non Le nombre maximum de plans par projet pour les documents
(Automatisation des données) Nombre maximal de plans par projet (images) Par région prise en charge : 1 Non Le nombre maximum de plans par projet pour les images
(Automatisation des données) Nombre maximum de plans par projet (vidéos) Par région prise en charge : 1 Non Le nombre maximum de plans par projet pour les vidéos
(Automatisation des données) Taille maximale du plan JSON (caractères) Chaque région prise en charge : 100 000 Non La taille maximale du JSON en caractères
(Automatisation des données) Niveaux maximaux de hiérarchie des champs Par région prise en charge : 1 Non Le niveau de nombre maximal de la hiérarchie des champs
(Automatisation des données) Nombre maximum de pages par document Chaque Région prise en charge : 3 000 Non Le nombre maximum de pages par document
(Automatisation des données) Résolution maximale Chaque région prise en charge : 8 000 Non La résolution maximale pour les images
(Automatisation des données) Taille maximale du fichier audio (Mo) Chaque région prise en charge : 2 048 Non Taille de fichier maximale pour l'audio
(Automatisation des données) Durée audio maximale (minutes) Chaque région prise en charge : 240 Non Durée maximale de l'audio en minutes
(Automatisation des données) Taille maximale du fichier de document (Mo) Chaque région prise en charge : 500 Non La taille maximale du fichier
(Automatisation des données) Taille maximale du fichier image (Mo) Chaque région prise en charge : 5 Non La taille de fichier maximale pour les images
(Automatisation des données) Nombre maximal de plans par demande d'inférence de démarrage (Audios) Par région prise en charge : 1 Non Le nombre maximum de plans intégrés dans la demande d'inférence Start
(Automatisation des données) Nombre maximal de plans par demande d'inférence de démarrage (documents) Chaque Région prise en charge : 10 Non Le nombre maximum de plans intégrés dans la demande d'inférence Start
(Automatisation des données) Nombre maximal de plans par demande d'inférence de démarrage (images) Par région prise en charge : 1 Non Le nombre maximum de plans intégrés dans la demande d'inférence Start
(Automatisation des données) Nombre maximal de plans par demande d'inférence de démarrage (vidéos) Par région prise en charge : 1 Non Le nombre maximum de plans intégrés dans la demande d'inférence Start
(Automatisation des données) Nombre maximal de champs de liste par plan Chaque région prise en charge : 15 Non Le nombre maximum de champs de liste par Blueprint
(Automatisation des données) Taille maximale du fichier vidéo (Mo) Chaque région prise en charge : 10 240 Non La taille de fichier maximale pour les vidéos
(Automatisation des données) Durée maximale de la vidéo (minutes) Chaque région prise en charge : 240 Non Durée maximale des vidéos en minutes
(Automatisation des données) Fréquence d'échantillonnage audio minimale (Hz) Chaque région prise en charge : 8 000 Non Le taux d'échantillonnage audio minimal
(Automatisation des données) Durée audio minimale (millisecondes) Chaque région prise en charge : 500 Non Durée minimale du son en millisecondes
(Évaluation) Nombre de tâches d'évaluation automatique de modèles simultanées Chaque Région prise en charge : 20 Non Nombre maximal de tâches d'évaluation automatique de modèles que vous pouvez spécifier simultanément dans ce compte dans la région actuelle.
(Évaluation) Nombre de tâches d'évaluation de modèles simultanées faisant appel à des travailleurs humains Chaque Région prise en charge : 10 Non Le nombre maximum de tâches d'évaluation de modèles faisant appel à des travailleurs humains peut être spécifié à la fois dans ce compte dans la région actuelle.
(Évaluation) Nombre de métriques personnalisées Chaque Région prise en charge : 10 Non Nombre maximal de mesures personnalisées que vous pouvez spécifier dans une tâche d'évaluation de modèle faisant appel à des travailleurs humains.
(Évaluation) Nombre d'ensembles de données instantanés personnalisés dans le cadre d'une tâche d'évaluation de modèles basée sur l'homme Par région prise en charge : 1 Non Le nombre maximum de jeux de données d'invite personnalisés que vous pouvez spécifier dans une tâche d'évaluation de modèle basée sur l'homme dans ce compte dans la région actuelle.
(Évaluation) Nombre de jeux de données par tâche Chaque région prise en charge : 5 Non Nombre maximal de jeux de données que vous pouvez spécifier dans une tâche d'évaluation de modèle automatisée. Cela inclut les ensembles de données d'invite personnalisés et intégrés.
(Évaluation) Nombre de postes d'évaluation Chaque région prise en charge : 5 000 Non Le nombre maximum de tâches d'évaluation de modèles que vous pouvez créer dans ce compte dans la région actuelle.
(Évaluation) Nombre de mesures par ensemble de données Chaque région prise en charge : 3 Non Le nombre maximal de mesures que vous pouvez spécifier par ensemble de données dans une tâche d'évaluation automatique de modèle. Cela inclut les métriques personnalisées et intégrées.
(Évaluation) Nombre de modèles dans un travail d'évaluation de modèles faisant appel à des travailleurs humains Chaque région prise en charge : 2 Non Nombre maximal de modèles que vous pouvez spécifier dans une tâche d'évaluation de modèles faisant appel à des travailleurs humains.
(Évaluation) Nombre de modèles dans le travail d'évaluation automatique de modèles Par région prise en charge : 1 Non Nombre maximal de modèles que vous pouvez spécifier dans une tâche d'évaluation automatique de modèles.
(Évaluation) Nombre d'invites dans un ensemble de données d'instructions personnalisé Chaque Région prise en charge : 1 000 Non Le nombre maximum d'invites qu'un jeu de données d'invite personnalisé peut contenir.
(Évaluation) Taille de l'invite Chaque Région prise en charge : 4 Non Taille maximale (en Ko) d'une invite individuelle dans un jeu de données d'invite personnalisé.
(Évaluation) Temps de travail pour les travailleurs Chaque Région prise en charge : 30 Non Durée maximale (en jours) dont un travailleur peut disposer pour effectuer des tâches.
(Flux) Nœuds d'agent par flux Chaque Région prise en charge : 20 Non Le nombre maximum de nœuds d'agent.
(Flux) Nœuds collecteurs par flux Par région prise en charge : 1 Non Le nombre maximum de nœuds collecteurs.
(Flux) Conditionnez les nœuds par flux Chaque région prise en charge : 5 Non Le nombre maximum de nœuds de condition.
(Flux) Conditions par nœud de condition Chaque région prise en charge : 5 Non Le nombre maximum de conditions par nœud de condition.
(Flux) de CreateFlow demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de CreateFlow demandes par seconde.
(Flux) de CreateFlowAlias demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de CreateFlowAlias demandes par seconde.
(Flux) de CreateFlowVersion demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de CreateFlowVersion demandes par seconde.
(Flux) de DeleteFlow demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de DeleteFlow demandes par seconde.
(Flux) de DeleteFlowAlias demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de DeleteFlowAlias demandes par seconde.
(Flux) de DeleteFlowVersion demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de DeleteFlowVersion demandes par seconde.
(Flux) Alias de flux par flux Chaque Région prise en charge : 10 Non Le nombre maximum d'alias de flux.
(Flux) Exécutions de flux par compte Chaque Région prise en charge : 1 000 Oui Le nombre maximum d'exécutions de flux par compte.
(Flux) Versions de flux par flux Chaque Région prise en charge : 10 Non Le nombre maximum de versions de flux.
(Flux) Flux par compte Chaque Région prise en charge : 100 Oui Le nombre maximum de flux par compte.
(Flux) de GetFlow demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de GetFlow demandes par seconde.
(Flux) de GetFlowAlias demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de GetFlowAlias demandes par seconde.
(Flux) de GetFlowVersion demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de GetFlowVersion demandes par seconde.
(Flux) Nœuds de code en ligne par flux Chaque région prise en charge : 5 Non Le nombre maximum de nœuds de code en ligne par flux.
(Flux) Nœuds d'entrée par flux Par région prise en charge : 1 Non Le nombre maximal de nœuds d'entrée de flux.
(Flux) Nœuds d'itérateur par flux Par région prise en charge : 1 Non Le nombre maximum de nœuds itérateurs.
(Flux) Nœuds de base de connaissances par flux Chaque Région prise en charge : 20 Non Nombre maximal de nœuds de base de connaissances.
(Flux) Nœuds de fonction Lambda par flux Chaque Région prise en charge : 20 Non Nombre maximal de nœuds de fonction Lambda.
(Flux) Nœuds Lex par flux Chaque région prise en charge : 5 Non Le nombre maximum de nœuds Lex.
(Flux) de ListFlowAliases demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de ListFlowAliases demandes par seconde.
(Flux) de ListFlowVersions demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de ListFlowVersions demandes par seconde.
(Flux) de ListFlows demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de ListFlows demandes par seconde.
(Flux) Nœuds de sortie par flux Chaque Région prise en charge : 20 Non Le nombre maximum de nœuds de sortie de flux.
(Flux) de PrepareFlow demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de PrepareFlow demandes par seconde.
(Flux) Nœuds d'invite par flux Chaque région prise en charge : 20 Oui Le nombre maximum de nœuds d'invite.
(Flux) Nœuds de récupération S3 par flux Chaque Région prise en charge : 10 Non Le nombre maximum de nœuds de récupération S3.
(Flux) Nœuds de stockage S3 par flux Chaque Région prise en charge : 10 Non Nombre maximal de nœuds de stockage S3.
(Flux) Nombre total de nœuds par flux Chaque Région prise en charge : 40 Non Nombre maximal de nœuds dans un flux.
(Flux) de UpdateFlow demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de UpdateFlow demandes par seconde.
(Flux) de UpdateFlowAlias demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de UpdateFlowAlias demandes par seconde.
(Flux) de ValidateFlowDefinition demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de ValidateFlowDefinition demandes par seconde.
(Guardrails) Longueur de la requête contextuelle en unités de texte Par région prise en charge : 1 Non Longueur maximale, en unités de texte, de la requête pour la base contextuelle
(Garde-corps) Longueur de la réponse contextuelle de mise à la terre en unités de texte Chaque région prise en charge : 5 Non Longueur maximale, en unités de texte, de la réponse pour un ancrage contextuel
(Garde-corps) Longueur de la source contextuelle de mise à la base en unités de texte

us-east-1 : 100

us-west-2 : 100

Chacune des autres régions prises en charge : 50

Non Longueur maximale, en unités de texte, de la source de mise à la terre pour la mise à la terre contextuelle
(Guardrails) Exemples de phrases par sujet Chaque région prise en charge : 5 Non Le nombre maximum d'exemples de sujets pouvant être inclus par sujet
(Rambardes) Rambardes par compte Chaque Région prise en charge : 100 Non Le nombre maximum de barrières de sécurité sur un compte
(Guardrails) Politique de filtrage ApplyGuardrail du contenu à la demande, unités de texte par seconde

us-east-1 : 200

us-west-2 : 200

Chacune des autres régions prises en charge : 25

Oui Nombre maximal d'unités de texte pouvant être traitées pour les politiques de filtrage de contenu par seconde
(Guardrails) Unités de texte de politique de sujets ApplyGuardrail refusés à la demande par seconde

us-east-1 : 50

us-west-2 : 50

Chacune des autres régions prises en charge : 25

Oui Nombre maximal d'unités de texte pouvant être traitées pour les politiques relatives aux sujets refusés par seconde
(Guardrails) Politique de filtrage des informations ApplyGuardrail sensibles à la demande, unités de texte par seconde

us-east-1 : 200

us-west-2 : 200

Chacune des autres régions prises en charge : 25

Oui Nombre maximal d'unités de texte pouvant être traitées pour les politiques de filtrage des informations sensibles par seconde
(Guardrails) Politique de filtrage ApplyGuardrail Word à la demande, unités de texte par seconde

us-east-1 : 200

us-west-2 : 200

Chacune des autres régions prises en charge : 25

Oui Nombre maximal d'unités de texte pouvant être traitées pour les politiques de filtrage de Word par seconde
(Guardrails) Unités de texte de politique d'ancrage ApplyGuardrail contextuelles à la demande par seconde Chaque région prise en charge : 106 Oui Nombre maximal d'unités de texte pouvant être traitées pour les politiques de base contextuelles par seconde
(Guardrails) ApplyGuardrail Demandes à la demande par seconde

us-east-1 : 50

us-west-2 : 50

Chacune des autres régions prises en charge : 25

Oui Le nombre maximum d'appels d' ApplyGuardrail API autorisés par seconde
(Guardrails) Entités Regex dans le filtre d'informations sensibles Chaque Région prise en charge : 10 Non Le nombre maximum d'expressions régulières du filtre de garde-corps pouvant être incluses dans une politique relative aux informations sensibles
(Guardrails) Longueur de la regex en caractères Chaque région prise en charge : 500 Non La longueur maximale, en caractères, d'une expression régulière d'un filtre de garde-corps
(Rambardes) Sujets par rambarde Chaque Région prise en charge : 30 Non Le nombre maximum de sujets pouvant être définis dans les politiques relatives aux sujets de Guardrail
(Rambardes) Versions par garde-corps Chaque Région prise en charge : 20 Non Le nombre maximum de versions qu'un garde-corps peut avoir
(Rambardes) Longueur du mot en caractères Chaque Région prise en charge : 100 Non Longueur maximale d'un mot, en caractères, dans une liste de mots bloqués
(Guardrails) Politique mot par mot Chaque région prise en charge : 10 000 Non Le nombre maximum de mots pouvant être inclus dans une liste de mots bloqués
(Bases de connaissances) Concurrent IngestKnowledgeBaseDocuments et DeleteKnowledgeBaseDocuments demandes par compte Chaque Région prise en charge : 10 Non Le nombre maximum IngestKnowledgeBaseDocuments de DeleteKnowledgeBaseDocuments demandes pouvant être exécutées simultanément sur un compte.
(Bases de connaissances) Tâches d'ingestion simultanées par compte Chaque région prise en charge : 5 Non Nombre maximal de tâches d'ingestion pouvant être exécutées simultanément sur un compte.
(Bases de connaissances) Tâches d'ingestion simultanées par source de données Par région prise en charge : 1 Non Nombre maximal de tâches d'ingestion pouvant être exécutées simultanément pour une source de données.
(Bases de connaissances) Tâches d'ingestion simultanées par base de connaissances Par région prise en charge : 1 Non Nombre maximal de tâches d'ingestion pouvant être exécutées simultanément pour une base de connaissances.
CreateDataSource Demandes (bases de connaissances) par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' CreateDataSource API par seconde.
CreateKnowledgeBase Demandes (bases de connaissances) par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' CreateKnowledgeBase API par seconde.
(Bases de connaissances) Sources de données par base de connaissances Chaque région prise en charge : 5 Non Le nombre maximum de sources de données par base de connaissances.
DeleteDataSource Demandes (bases de connaissances) par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' DeleteDataSource API par seconde.
DeleteKnowledgeBase Demandes (bases de connaissances) par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' DeleteKnowledgeBase API par seconde.
DeleteKnowledgeBaseDocuments Demandes (bases de connaissances) par seconde Chaque région prise en charge : 5 Non Le nombre maximum de demandes d' DeleteKnowledgeBaseDocuments API par seconde.
(Bases de connaissances) Fichiers à ajouter ou à mettre à jour par tâche d'ingestion Chaque région prise en charge : 5 000 000 Non Nombre maximal de fichiers nouveaux et mis à jour pouvant être ingérés par tâche d'ingestion.
(Bases de connaissances) Fichiers à supprimer par tâche d'ingestion Chaque région prise en charge : 5 000 000 Non Nombre maximal de fichiers pouvant être supprimés par tâche d'ingestion.
(Bases de connaissances) Fichiers à ingérer par IngestKnowledgeBaseDocuments tâche. Chaque région prise en charge : 25 Non Le nombre maximum de documents pouvant être ingérés par IngestKnowledgeBaseDocuments demande.
GenerateQuery Demandes (bases de connaissances) par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' GenerateQuery API par seconde.
GetDataSource Demandes (bases de connaissances) par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' GetDataSource API par seconde.
GetIngestionJob Demandes (bases de connaissances) par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' GetIngestionJob API par seconde.
GetKnowledgeBase Demandes (bases de connaissances) par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' GetKnowledgeBase API par seconde.
GetKnowledgeBaseDocuments Demandes (bases de connaissances) par seconde Chaque région prise en charge : 5 Non Le nombre maximum de demandes d' GetKnowledgeBaseDocuments API par seconde.
IngestKnowledgeBaseDocuments Demandes (bases de connaissances) par seconde Chaque région prise en charge : 5 Non Le nombre maximum de demandes d' IngestKnowledgeBaseDocuments API par seconde.
(Bases de connaissances) taille IngestKnowledgeBaseDocuments totale de la charge utile Chaque région prise en charge : 6 Non La taille maximale (en Mo) de la charge utile totale d'une IngestKnowledgeBaseDocuments demande.
(Bases de connaissances) Taille du fichier de tâche d'ingestion Chaque région prise en charge : 50 Non Taille maximale (en Mo) d'un fichier dans une tâche d'ingestion.
(Bases de connaissances) Taille de la tâche d'ingestion Chaque Région prise en charge : 100 Non Taille maximale (en Go) d'une tâche d'ingestion.
(Bases de connaissances) Bases de connaissances par compte Chaque Région prise en charge : 100 Non Le nombre maximum de bases de connaissances par compte.
ListDataSources Demandes (bases de connaissances) par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' ListDataSources API par seconde.
ListIngestionJobs Demandes (bases de connaissances) par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' ListIngestionJobs API par seconde.
ListKnowledgeBaseDocuments Demandes (bases de connaissances) par seconde Chaque région prise en charge : 5 Non Le nombre maximum de demandes d' ListKnowledgeBaseDocuments API par seconde.
ListKnowledgeBases Demandes (bases de connaissances) par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' ListKnowledgeBases API par seconde.
(Bases de connaissances) Nombre maximum de fichiers pour l'analyseur BDA Chaque Région prise en charge : 1 000 Non Nombre maximal de fichiers pouvant être utilisés avec Amazon Bedrock Data Automation en tant qu'analyseur.
(Bases de connaissances) Nombre maximum de fichiers pour Foundation Models en tant qu'analyseur Chaque Région prise en charge : 1 000 Non Nombre maximal de fichiers pouvant être utilisés avec Foundation Models en tant qu'analyseur syntaxique.
(Bases de connaissances) Nombre de demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d'API RDE par seconde.
(Bases de connaissances) Récupérez les demandes par seconde Chaque Région prise en charge : 20 Non Le nombre maximum de demandes d'API Retrieve par seconde.
RetrieveAndGenerate Demandes (bases de connaissances) par seconde Chaque Région prise en charge : 20 Non Le nombre maximum de demandes d' RetrieveAndGenerate API par seconde.
RetrieveAndGenerateStream Demandes (bases de connaissances) par seconde Chaque Région prise en charge : 20 Non Le nombre maximum de demandes d' RetrieveAndGenerateStream API par seconde.
StartIngestionJob Demandes (bases de connaissances) par seconde Chaque région prise en charge : 0,1 Non Le nombre maximum de demandes d' StartIngestionJob API par seconde.
UpdateDataSource Demandes (bases de connaissances) par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' UpdateDataSource API par seconde.
UpdateKnowledgeBase Demandes (bases de connaissances) par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' UpdateKnowledgeBase API par seconde.
(Bases de connaissances) Taille de la requête utilisateur Chaque Région prise en charge : 1 000 Non Taille maximale (en caractères) d'une requête utilisateur.
(Personnalisation du modèle) Modèles personnalisés par compte Chaque Région prise en charge : 100 Oui Le nombre maximum de modèles personnalisés dans un compte.
(Personnalisation du modèle) Taille maximale du fichier d'entrée pour les tâches de personnalisation de distillation Chaque région prise en charge : 2 gigaoctets Non Taille maximale du fichier d'entrée pour les tâches de personnalisation de la distillation.
(Personnalisation du modèle) Longueur de ligne maximale pour les tâches de personnalisation de distillation Chaque région prise en charge : 16 kilo-octets Non Longueur de ligne maximale dans le fichier d'entrée pour les tâches de personnalisation de la distillation.
(Personnalisation du modèle) Nombre maximum d'instructions pour les tâches de personnalisation de distillation Chaque région prise en charge : 15 000 Non Le nombre maximum d'instructions requises pour les tâches de personnalisation de la distillation.
(Personnalisation du modèle) Longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Amazon Nova Micro V1 Chaque région prise en charge : 32 000 Non Longueur maximale du contexte de réglage précis du modèle étudiant pour les tâches de personnalisation de distillation Amazon Nova Micro V1.
(Personnalisation du modèle) Longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Amazon Nova V1 Chaque région prise en charge : 32 000 Non Longueur maximale du contexte de réglage précis du modèle étudiant pour les tâches de personnalisation de distillation Amazon Nova V1.
(Personnalisation du modèle) Longueur maximale du contexte de réglage du modèle étudiant pour les tâches de personnalisation de distillation Anthropic Claude 3 haiku 20240307 V1 Chaque région prise en charge : 32 000 Non La longueur maximale du contexte de réglage du modèle étudiant pour les tâches de personnalisation de distillation d'Anthropic Claude 3 haiku 20240307 V1.
(Personnalisation du modèle) Longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Llama 3.1 70B Instruct V1 Chaque région prise en charge : 16 000 Non La longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Llama 3.1 70B Instruct V1.
(Personnalisation du modèle) Longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Llama 3.1 8B Instruct V1 Chaque région prise en charge : 32 000 Non La longueur maximale du contexte de réglage fin du modèle étudiant pour les tâches de personnalisation de distillation Llama 3.1 8B Instruct V1.
(Personnalisation du modèle) Nombre minimal de demandes pour les tâches de personnalisation de distillation Chaque Région prise en charge : 100 Non Le nombre minimum d'invites requis pour les tâches de personnalisation de la distillation.
(Personnalisation du modèle) Tâches de personnalisation planifiées Chaque région prise en charge : 2 Non Le nombre maximum de tâches de personnalisation planifiées.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche de réglage précis sur Amazon Nova Lite Chaque Région prise en charge : 20 000 Oui Nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage précis sur Amazon Nova Lite.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche de réglage précis d'Amazon Nova Micro Chaque Région prise en charge : 20 000 Oui Nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage précis d'Amazon Nova Micro.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche de réglage précis sur Amazon Nova Pro Chaque région prise en charge : 10 000 Oui Nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage précis sur Amazon Nova Pro.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour un travail de réglage précis de Claude 3 Haiku v1 Chaque région prise en charge : 10 000 Oui Le nombre maximum combiné d'enregistrements de formation et de validation autorisés pour une tâche de peaufinage du haïku Claude 3.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour un travail de réglage précis de Claude 3-5-Haiku v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour un travail de mise au point de Claude 3-5-Haiku.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Meta Llama 2 13B v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage fin de Meta Llama 2 13B.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Meta Llama 2 70B v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage fin de Meta Llama 2 70B.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Meta Llama 3.1 70B Instruct v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage fin de Meta Llama 3.1 70B Instruct.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Meta Llama 3.1 8B Instruct v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage fin de Meta Llama 3.1 8B Instruct.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Meta Llama 3.2 11B Instruct v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage fin de Meta Llama 3.2 11B Instruct.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Meta Llama 3.2 1B Instruct v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage fin de Meta Llama 3.2 1B Instruct.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Meta Llama 3.2 3B Instruct v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage fin de Meta Llama 3.2 3B Instruct.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Meta Llama 3.2 90B Instruct v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage fin de Meta Llama 3.2 90B Instruct.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin du Titan Image Generator G1 V1 V1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage précis de Titan Image Generator.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin du Titan Image Generator G1 V2 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage précis de Titan Image Generator V2.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche de réglage fin de Titan Multimodal Embeddings G1 v1 Chaque région prise en charge : 50 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage précis de Titan Multimodal Embeddings.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche de pré-formation continue sur Titan Text G1 - Express v1 Chaque région prise en charge : 100 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour un poste de pré-formation continue sur Titan Text Express.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Titan Text G1 - Express v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage précis de Titan Text Express.
(Personnalisation du modèle) Somme des enregistrements de formation et de validation pour une tâche de pré-formation continue sur Titan Text G1 - Lite v1 Chaque région prise en charge : 100 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour un travail de pré-formation continue sur Titan Text Lite.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Titan Text G1 - Lite v1 Chaque région prise en charge : 10 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage précis de Titan Text Lite.
(Personnalisation du modèle) Somme des enregistrements d'entraînement et de validation pour une tâche de réglage fin de Titan Text G1 - Premier v1 Chaque Région prise en charge : 20 000 Oui Le nombre maximal combiné d'enregistrements de formation et de validation autorisés pour une tâche de réglage fin de Titan Text Premier.
(Gestion rapide) CreatePrompt demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de CreatePrompt demandes par seconde.
(Gestion rapide) CreatePromptVersion demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de CreatePromptVersion demandes par seconde.
(Gestion rapide) DeletePrompt demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de DeletePrompt demandes par seconde.
(Gestion rapide) GetPrompt demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de GetPrompt demandes par seconde.
(Gestion rapide) ListPrompts demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de ListPrompts demandes par seconde.
(Gestion rapide) Invites par compte Chaque région prise en charge : 500 Oui Le nombre maximum d'invites.
(Gestion rapide) UpdatePrompt demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de UpdatePrompt demandes par seconde.
(Gestion rapide) Versions par invite Chaque Région prise en charge : 10 Non Le nombre maximum de versions par invite.
APIs par Agent Chaque région prise en charge : 11 Oui Le nombre maximum APIs que vous pouvez ajouter à un agent.
Groupes d’actions par agent Chaque région prise en charge : 20 Oui Nombre maximal de groupes d'actions que vous pouvez ajouter à un agent.
Agents collaborateurs par agent Chaque Région prise en charge : 1 000 Oui Le nombre maximum d'agents collaborateurs que vous pouvez ajouter à un agent.
Agents par compte Chaque Région prise en charge : 1 000 Oui Le nombre maximum d'agents dans un compte.
AssociateAgentKnowledgeBase demandes par seconde Chaque région prise en charge : 6 Non Le nombre maximum de demandes d' AssociateAgentKnowledgeBase API par seconde.
Alias associés par agent Chaque Région prise en charge : 10 Non Le nombre maximum d'alias que vous pouvez associer à un agent.
Bases de connaissances associées par agent Chaque région prise en charge : 2 Oui Le nombre maximum de bases de connaissances que vous pouvez associer à un agent.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3 Haiku Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Claude 3 Haiku.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3 Opus Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude 3 Opus.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3 Sonnet Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude 3 Sonnet.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3.5 Haiku Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Claude 3.5 Haiku.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3.5 Sonnet Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude 3.5 Sonnet.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Claude 3.5 Sonnet v2 Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Claude 3.5 Sonnet v2.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.1 405B Instruct Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.1 405B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.1 70B Instruct Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.1 70B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.1 8B Instruct Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.1 8B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.2 11B Instruct Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.2 11B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.2 1B Instruct Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots Llama 3.2 1B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.2 3B Instruct Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.2 3B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.2 90B Instruct Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.2 90B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 3.3 70B Instruct Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 3.3 70B Instruct.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 4 Maverick Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Llama 4 Maverick.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Llama 4 Scout Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour une inférence par lots pour Llama 4 Scout.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Mistral Large 2 (24.07) Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Mistral Large 2 (24,07).
Taille du fichier d'entrée d'inférence par lots (en Go) pour Mistral Small Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Mistral Small.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Nova Lite V1 Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Nova Lite V1.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Nova Micro V1 Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Nova Micro V1.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Nova Pro V1 Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Nova Pro V1.
Taille du fichier d'entrée d'inférence par lots (en Go) pour Titan Multimodal Embeddings G1 Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Titan Multimodal Embeddings G1.
Taille du fichier d'entrée d'inférence par lots pour Titan Text Embeddings V2 (en Go) Par région prise en charge : 1 Non Taille maximale d'un seul fichier (en Go) soumis pour l'inférence par lots pour Titan Text Embeddings V2.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3 Haiku Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3 Haiku.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3 Opus Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3 Opus.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3 Sonnet Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3 Sonnet.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3.5 Haiku Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3.5 Haiku.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3.5 Sonnet Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3.5 Sonnet.
Taille de la tâche d'inférence par lots (en Go) pour Claude 3.5 Sonnet v2 Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Claude 3.5 Sonnet v2.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.1 405B Instruct Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.1 405B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.1 70B Instruct Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.1 70B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.1 8B Instruct Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.1 8B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.2 11B Instruct Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.2 11B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.2 1B Instruct Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.2 1B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.2 3B Instruct Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.2 3B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.2 90B Instruct Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.2 90B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 3.3 70B Instruct Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 3.3 70B Instruct.
Taille de la tâche d'inférence par lots (en Go) pour Llama 4 Maverick Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 4 Maverick.
Taille de la tâche d'inférence par lots (en Go) pour Llama 4 Scout Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Llama 4 Scout.
Taille de la tâche d'inférence par lots (en Go) pour Mistral Large 2 (24,07) Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Mistral Large 2 (24,07).
Taille de la tâche d'inférence par lots (en Go) pour Mistral Small Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Mistral Small.
Taille de la tâche d'inférence par lots (en Go) pour Nova Lite V1 Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Nova Lite V1.
Taille de la tâche d'inférence par lots (en Go) pour Nova Micro V1 Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Nova Micro V1.
Taille de la tâche d'inférence par lots (en Go) pour Nova Pro V1 Chaque Région prise en charge : 100 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Nova Pro V1.
Taille de la tâche d'inférence par lots (en Go) pour Titan Multimodal Embeddings G1 Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Titan Multimodal Embeddings G1.
Taille de la tâche d'inférence par lots pour Titan Text Embeddings V2 (en Go) Chaque région prise en charge : 5 Non Taille cumulée maximale de tous les fichiers d'entrée (en Go) inclus dans la tâche d'inférence par lots pour Titan Text Embeddings V2.
Caractères dans les instructions des agents Chaque Région prise en charge : 20 000 Non Le nombre maximum de caractères dans les instructions destinées à un agent.
Tâches d'importation de modèles simultanées Par région prise en charge : 1 Non Nombre maximal de tâches d'importation de modèles en cours simultanément.
CreateAgent demandes par seconde Chaque région prise en charge : 6 Non Le nombre maximum de demandes d' CreateAgent API par seconde.
CreateAgentActionGroup demandes par seconde Chaque région prise en charge : 12 Non Le nombre maximum de demandes d' CreateAgentActionGroup API par seconde.
CreateAgentAlias demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' CreateAgentAlias API par seconde.
Demandes d'inférence de modèles interrégionales par minute pour Anthropic Claude 3.5 Haiku Chaque Région prise en charge : 2 000 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel InvokeModelWithResponseStream en une minute. Le quota prend en compte la somme combinée de InvokeModel et de InvokeModelWithResponseStream jetons pour Anthropic Claude 3.5 Haiku.
Demandes d'inférence de modèles interrégionales par minute pour Anthropic Claude 3.5 Sonnet V2

us-west-2 : 500

Chacune des autres régions prises en charge : 100

Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Anthropic Claude 3.5 Sonnet V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèles d'inférence interrégionaux par minute pour Anthropic Claude 3.5 Haiku Chaque région prise en charge : 4 000 000 Oui Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Anthropic Claude 3.5 Haiku. ConverseStream
Jetons d'inférence de modèles interrégionaux par minute pour Anthropic Claude 3.5 Sonnet V2

us-west-2 : 4 000 000

Chacune des autres régions prises en charge : 800 000

Oui Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Sonnet V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Amazon Nova Lite

us-east-1 : 2 000

us-east-2 : 2 000

us-west-1 : 2 000

us-west-2 : 2 000

Chacune des autres régions prises en charge : 200

Non Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Lite. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Amazon Nova Micro

us-east-1 : 2 000

us-east-2 : 2 000

us-west-1 : 2 000

us-west-2 : 2 000

Chacune des autres régions prises en charge : 200

Non Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Micro. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Amazon Nova Premier V1 Chaque région prise en charge : 200 Non Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Premier V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Amazon Nova Pro

us-east-1 : 200

us-east-2 : 200

us-west-1 : 200

us-west-2 : 200

Chacune des autres régions prises en charge : 100

Non Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Pro. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Anthropic Claude 3 Haiku

us-east-1 : 2 000

us-west-2 : 2 000

ap-northeast-1 : 400

ap-southeast-1 : 400

Chacune des autres régions prises en charge : 800

Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Anthropic Claude 3 Haiku.
Demandes d'inférence de modèles interrégionales par minute pour Anthropic Claude 3 Opus Chaque Région prise en charge : 100 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude 3 Opus. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Anthropic Claude 3 Sonnet

us-east-1 : 1 000

us-west-2 : 1 000

Chacune des autres régions prises en charge : 200

Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Anthropic Claude 3, Sonnet.
Demandes d'inférence de modèles interrégionales par minute pour Anthropic Claude 3.5 Sonnet

us-west-2 : 500

ap-northeast-1 : 40

ap-southeast-1 : 40

eu-central-1 : 40

eu-west-1 : 40

eu-west-3 : 40

Chacune des autres régions prises en charge : 100

Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Anthropic Claude 3.5 Sonnet. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Anthropic Claude 3.7 Sonnet V1

us-east-1 : 250

us-east-2 : 250

us-west-2 : 250

eu-central-1 : 100

eu-north-1 : 100

eu-west-1 : 100

eu-west-2 : 250

eu-west-3 : 100

Chacune des autres régions prises en charge : 50

Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude 3.7 Sonnet V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Anthropic Claude Opus 4 V1 Chaque région prise en charge : 200 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Opus 4 V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Anthropic Claude Sonnet 4 V1 Chaque région prise en charge : 200 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude Sonnet 4 V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour DeepSeek R1 V1 Chaque région prise en charge : 200 Non Nombre maximal de demandes interrégionales que vous pouvez envoyer pour l'inférence de modèles en une minute pour DeepSeek R1 V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Meta Llama 3.1 405B Instruct Chaque région prise en charge : 400 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Meta Llama 3.1 70B Instruct Chaque région prise en charge : 800 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Meta Llama 3.1 8B Instruct Chaque région prise en charge : 1 600 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 8B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Meta Llama 3.2 1B Instruct Chaque région prise en charge : 1 600 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.2 1B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Meta Llama 3.2 3B Instruct Chaque région prise en charge : 1 600 Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Meta Llama 3.2 3B Instruct. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Demandes d'inférence de modèles interrégionales par minute pour Meta Llama 3.3 70B Instruct Chaque région prise en charge : 800 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.3 70B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Meta Llama 4 Maverick V1 Chaque région prise en charge : 800 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 4 Maverick V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Meta Llama 4 Scout V1 Chaque région prise en charge : 800 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 4 Scout V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Mistral Pixtral Large 25.02 V1 Chaque Région prise en charge : 10 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Mistral Pixtral Large 25.02 V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Writer AI Palmyra X4 V1 Chaque Région prise en charge : 10 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Writer AI Palmyra X4 V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles interrégionales par minute pour Writer AI Palmyra X5 V1 Chaque Région prise en charge : 10 Non Le nombre maximum de demandes interrégionales que vous pouvez soumettre pour l'inférence de modèles en une minute pour Writer AI Palmyra X5 V1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Amazon Nova Lite

us-east-1 : 4 000 000

us-east-2 : 4 000 000

us-west-1 : 4 000 000

us-west-2 : 4 000 000

Chacune des autres régions prises en charge : 200 000

Oui Le nombre maximum de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Lite. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Amazon Nova Micro

us-east-1 : 4 000 000

us-east-2 : 4 000 000

us-west-1 : 4 000 000

us-west-2 : 4 000 000

Chacune des autres régions prises en charge : 200 000

Oui Le nombre maximum de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Micro. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Amazon Nova Premier V1 Chaque région prise en charge : 800 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Premier V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Amazon Nova Pro

us-east-1 : 800 000

us-east-2 : 800 000

us-west-1 : 800 000

us-west-2 : 800 000

Chacune des autres régions prises en charge : 200 000

Oui Le nombre maximum de jetons interrégionaux que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Pro. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Anthropic Claude 3 Haiku

us-east-1 : 4 000 000

us-west-2 : 4 000 000

ap-northeast-1 : 400 000

ap-southeast-1 : 400 000

Chacune des autres régions prises en charge : 600 000

Oui Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Anthropic Claude 3 Haiku. ConverseStream
Jetons d'inférence de modèles interrégionaux par minute pour Anthropic Claude 3 Opus Chaque région prise en charge : 800 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3 Opus. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Anthropic Claude 3 Sonnet

us-east-1 : 2 000 000

us-west-2 : 2 000 000

Chacune des autres régions prises en charge : 400 000

Oui Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Anthropic Claude 3 Sonnet. ConverseStream
Jetons d'inférence de modèles interrégionaux par minute pour Anthropic Claude 3.5 Sonnet

us-west-2 : 4 000 000

ap-northeast-1 : 400 000

ap-southeast-1 : 400 000

eu-central-1 : 400 000

eu-west-1 : 400 000

eu-west-3 : 400 000

Chacune des autres régions prises en charge : 800 000

Oui Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Sonnet. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Anthropic Claude 3.7 Sonnet V1

us-east-1 : 1 000 000

us-east-2 : 1 000 000

us-west-2 : 1 000 000

eu-central-1 : 100 000

eu-north-1 : 100 000

eu-west-1 : 100 000

eu-west-2 : 1 000 000

eu-west-3 : 100 000

Chacune des autres régions prises en charge : 50 000

Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.7 Sonnet V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Anthropic Claude Opus 4 V1 Chaque région prise en charge : 200 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Opus 4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Anthropic Claude Sonnet 4 V1 Chaque région prise en charge : 200 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude Sonnet 4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour DeepSeek R1 V1 Chaque région prise en charge : 200 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour DeepSeek R1 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Meta Llama 3.1 405B Instruct Chaque région prise en charge : 800 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Meta Llama 3.1 70B Instruct Chaque région prise en charge : 600 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Meta Llama 3.1 8B Instruct Chaque région prise en charge : 600 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 8B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Meta Llama 3.2 1B Instruct Chaque région prise en charge : 600 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 1B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Meta Llama 3.2 3B Instruct Chaque région prise en charge : 600 000 Oui Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 3B Instruct. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Meta Llama 3.3 70B Instruct Chaque région prise en charge : 600 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.3 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Meta Llama 4 Maverick V1 Chaque région prise en charge : 600 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 4 Maverick V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Meta Llama 4 Scout V1 Chaque région prise en charge : 600 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 4 Scout V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Mistral Pixtral Large 25.02 V1 Chaque région prise en charge : 80 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Mistral Pixtral Large 25.02 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Writer AI Palmyra X4 V1 Chaque région prise en charge : 150 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence du modèle en une minute pour Writer AI Palmyra X4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles interrégionaux par minute pour Writer AI Palmyra X5 V1 Chaque région prise en charge : 150 000 Oui Le nombre maximum de jetons interrégionaux que vous pouvez soumettre pour l'inférence de modèles en une minute pour Writer AI Palmyra X5 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèles personnalisés avec statut de création par compte Chaque région prise en charge : 2 Oui Le nombre maximum de modèles personnalisés dotés d'un statut de création.
DeleteAgent demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' DeleteAgent API par seconde.
DeleteAgentActionGroup demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' DeleteAgentActionGroup API par seconde.
DeleteAgentAlias demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' DeleteAgentAlias API par seconde.
DeleteAgentVersion demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' DeleteAgentVersion API par seconde.
DisassociateAgentKnowledgeBase demandes par seconde Chaque Région prise en charge : 4 Non Le nombre maximum de demandes d' DisassociateAgentKnowledgeBase API par seconde.
Groupes d'actions activés par agent Chaque région prise en charge : 15 Oui Nombre maximal de groupes d'actions que vous pouvez activer dans un agent.
Points de terminaison par profil d'inférence Chaque région prise en charge : 5 Non Nombre maximal de points de terminaison dans un profil d'inférence. Un point de terminaison est défini par un modèle et la région vers laquelle les demandes d'invocation adressées au modèle sont envoyées.
GetAgent demandes par seconde Chaque région prise en charge : 15 Non Le nombre maximum de demandes d' GetAgent API par seconde.
GetAgentActionGroup demandes par seconde Chaque Région prise en charge : 20 Non Le nombre maximum de demandes d' GetAgentActionGroup API par seconde.
GetAgentAlias demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' GetAgentAlias API par seconde.
GetAgentKnowledgeBase demandes par seconde Chaque région prise en charge : 15 Non Le nombre maximum de demandes d' GetAgentKnowledgeBase API par seconde.
GetAgentVersion demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' GetAgentVersion API par seconde.
Modèles importés par compte Chaque région prise en charge : 3 Oui Le nombre maximum de modèles importés dans un compte.
Profils d'inférence par compte Chaque Région prise en charge : 1 000 Oui Le nombre maximum de profils d'inférence dans un compte.
ListAgentActionGroups demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' ListAgentActionGroups API par seconde.
ListAgentAliases demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' ListAgentAliases API par seconde.
ListAgentKnowledgeBases demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' ListAgentKnowledgeBases API par seconde.
ListAgentVersions demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' ListAgentVersions API par seconde.
ListAgents demandes par seconde Chaque Région prise en charge : 10 Non Le nombre maximum de demandes d' ListAgents API par seconde.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3 Haiku Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Haiku.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3 Opus Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Opus.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3 Sonnet Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Sonnet.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3.5 Haiku Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Haiku.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3.5 Sonnet Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Claude 3.5 Sonnet v2 Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet v2.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.1 405B Instruct Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 405B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.1 70B Instruct Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 70B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.1 8B Instruct Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 8B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.2 11B Instruct Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 11B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.2 1B Instruct Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée d'une tâche d'inférence par lots Llama 3.2 1B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.2 3B Instruct Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 3B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.2 90B Instruct Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 90B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 3.3 70B Instruct Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.3 70B Instruct.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 4 Maverick Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 4 Maverick.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Llama 4 Scout Chaque région prise en charge : 50 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 4 Scout.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Mistral Large 2 (24,07) Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Large 2 (24,07).
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Mistral Small Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Small.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Nova Lite V1 Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Lite V1.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Nova Micro V1 Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Micro V1.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Nova Pro V1 Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Pro V1.
Nombre minimum d'enregistrements par tâche d'inférence par lot pour Titan Multimodal Embeddings G1 Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Titan Multimodal Embeddings G1.
Nombre minimum d'enregistrements par tâche d'inférence par lots pour Titan Text Embeddings V2 Chaque Région prise en charge : 100 Non Le nombre minimum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Titan Text Embeddings V2.
Modèle d'invocation (nombre maximum de jetons par jour) pour Amazon Nova Premier V1 Chaque région prise en charge : 576 000 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence de modèles en une journée pour Amazon Nova Premier V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèle d'invocation (nombre maximum de jetons par jour) pour Anthropic Claude 3.7 Sonnet V1 Chaque région prise en charge : 720 000 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude 3.7 Sonnet V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèle d'invocation (nombre maximum de jetons par jour) pour Anthropic Claude Opus 4 V1 Chaque région prise en charge : 144 000 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Opus 4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèle d'invocation (nombre maximum de jetons par jour) pour Anthropic Claude Sonnet 4 V1 Chaque région prise en charge : 144 000 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence de modèles en une journée pour Anthropic Claude Sonnet 4 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèle d'invocation (nombre maximum de jetons par jour pour DeepSeek R1 V1) Chaque région prise en charge : 144 000 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence de modèles en une journée pour DeepSeek R1 V1. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Unités de modèle Débits provisionnés sans engagement sur l'ensemble des modèles de base Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être distribuées sur des débits provisionnés sans engagement pour les modèles de base
Unités de modèles Débits provisionnés sans engagement sur des modèles personnalisés Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être distribuées sur des débits provisionnés sans engagement pour les modèles personnalisés
Unités de modèle par modèle provisionné pour AI21 Labs Jurassic-2 Mid Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour AI21 Labs Jurassic-2 Mid.
Unités de modèle par modèle provisionné pour AI21 Labs Jurassic-2 Ultra Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour AI21 Labs Jurassic-2 Ultra.
Unités de modèle par modèle provisionné pour Amazon Nova Canvas Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Nova Canvas.
Unités de modèle par modèle provisionné pour Amazon Titan Embeddings G1 - Texte Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Embeddings G1 - Text.
Unités de modèle par modèle provisionné pour Amazon Titan Image Generator G1 Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Image Generator G1.
Unités de modèle par modèle provisionné pour Amazon Titan Image Generator G2 Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Image Generator G2.
Unités de modèle par modèle provisionné pour Amazon Titan Lite V1 4K Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Text Lite V1 4K.
Unités de modèle par modèle provisionné pour Amazon Titan Multimodal Embeddings G1 Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Multimodal Embeddings G1.
Unités de modèle par modèle provisionné pour Amazon Titan Text Embeddings V2 Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Text Embeddings V2.
Unités de modèle par modèle provisionné pour Amazon Titan Text G1 - Express 8K Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Text G1 - Express 8K.
Unités de modèle par modèle provisionné pour Amazon Titan Text Premier V1 32K Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Amazon Titan Text Premier V1 32K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3 Haiku 200K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Anthropic Claude 3 Haiku 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3 Haiku 48K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3 Haiku 48K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3 Sonnet 200K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Anthropic Claude 3 Sonnet 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3 Sonnet 28K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3 Sonnet 28K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Haiku 16K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Anthropic Claude 3.5 Haiku 16K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Haiku 200K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Haiku 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Haiku 64K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Haiku 64K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet 18K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet 18K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet 200K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet 51K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet 51K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 18K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 18K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 200K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 51K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.5 Sonnet V2 51K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 18K Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 18K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 200K Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être attribuées à un modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 200K.
Unités de modèle par modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 51K Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude 3.7 V1.0 Sonnet 51K.
Unités de modèle par modèle provisionné pour Anthropic Claude Instant V1 100K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude Instant V1 100K.
Unités de modèle par modèle provisionné pour Anthropic Claude V2 100K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude V2 100K.
Unités de modèle par modèle provisionné pour Anthropic Claude V2 18K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude V2 18K.
Unités de modèle par modèle provisionné pour Anthropic Claude V2.1 18K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude V2.1 18K.
Unités de modèle par modèle provisionné pour Anthropic Claude V2.1 200K Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Anthropic Claude V2.1 200K.
Unités de modèle par modèle provisionné pour Cohere Command Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Cohere Command.
Unités de modèle par modèle provisionné pour Cohere Command Light Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Cohere Command Light.
Unités de modèle par modèle provisionné pour Cohere Command R Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Cohere Command R 128k.
Unités de modèle par modèle provisionné pour Cohere Command R Plus Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Cohere Command R Plus 128k.
Unités de modèle par modèle provisionné pour Cohere Embed English Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Cohere Embed English.
Unités de modèle par modèle provisionné pour Cohere Embed Multilingual Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être attribuées à un modèle provisionné pour Cohere Embed Multilingual.
Unités de modèle par modèle provisionné pour Meta Llama 2 13B Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 2 13B.
Unités de modèle par modèle provisionné pour Meta Llama 2 70B Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 2 70B.
Unités de modèle par modèle provisionné pour Meta Llama 2 Chat 13B Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 2 Chat 13B.
Unités de modèle par modèle provisionné pour Meta Llama 2 Chat 70B Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 2 Chat 70B.
Unités de modèle par modèle provisionné pour Meta Llama 3 70B Instruct Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3 70B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3 8B Instruct Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3 8B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.1 70B Instruct Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.1 70B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.1 8B Instruct Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.1 8B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.2 11B Instruct Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.2 11B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.2 1B Instruct Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.2 1B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.2 3B Instruct Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.2 3B Instruct.
Unités de modèle par modèle provisionné pour Meta Llama 3.2 90B Instruct Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Meta Llama 3.2 90B Instruct.
Unités de modèle par modèle provisionné pour Mistral Large 2407 Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Mistral Large 2407.
Unités de modèle par modèle provisionné pour Mistral Small Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Mistral Small.
Unités de modèle par modèle provisionné pour Stability.ai Stable Diffusion XL 0.8 Chaque région prise en charge : 0 Oui Nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour Stability.ai Stable Diffusion XL 0.8
Unités de modèle par modèle provisionné pour Stability.ai Stable Diffusion XL 1.0 Chaque région prise en charge : 0 Oui Nombre maximal d'unités de modèle pouvant être allouées à un modèle provisionné pour Stability.ai Stable Diffusion XL 1.0.
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 128 000 caractères pour Amazon Nova Micro Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 128 000 pour Amazon Nova Micro
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Lite Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Lite
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Micro Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Micro
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Pro Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 24 000 caractères pour Amazon Nova Pro
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 300 000 unités pour Amazon Nova Lite Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 300 000 pour Amazon Nova Lite
Unités de modèle par modèle provisionné pour la variante de longueur de contexte de 300 000 pour Amazon Nova Pro Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un modèle provisionné pour la variante de longueur de contexte de 300 000 pour Amazon Nova Pro.
Unités modèles, avec engagement, pour Provisioned Through créées pour Meta Llama 4 Scout 17B Instruct 10M Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour Meta Llama 4 Scout 17B Instruct 10M, avec engagement.
Unités modèles, avec engagement, pour Provisioned Through créées pour Meta Llama 4 Scout 17B Instruct 128K Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour Meta Llama 4 Scout 17B Instruct 128K, avec engagement.
Unités modèles, avec engagement, pour Provisioned Through créées pour Meta Maverick 4 Scout 17B Instruct 128K Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour Meta Llama 4 Maverick 17B Instruct 128K, avec engagement.
Unités de modèle, avec engagement, pour Provisioned Through créées pour Meta Maverick 4 Scout 17B Instruct 1M Chaque région prise en charge : 0 Oui Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour Meta Llama 4 Maverick 17B Instruct 1M, avec engagement.
Unités de modèle sans engagement pour le débit provisionné créées pour le modèle de base Amazon Nova Canvas V1.0 Chaque région prise en charge : 0 Non Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour le modèle de base Amazon Nova Canvas V1.0, sans engagement.
Unités de modèle sans engagement pour le débit provisionné créées pour le modèle personnalisé Amazon Nova Canvas V1 0 Chaque région prise en charge : 0 Non Le nombre maximum d'unités de modèle pouvant être allouées à un débit provisionné créé pour le modèle personnalisé Amazon Nova Canvas V1 0, sans engagement.
Nombre de routeurs d'invite personnalisés par compte Chaque région prise en charge : 500 Non Le nombre maximum de routeurs d'invite personnalisés que vous pouvez créer par compte et par région.
Demandes d'inférence de modèles à la demande et optimisées pour la latence par minute pour Meta Llama 3.1 405B Instruct Chaque Région prise en charge : 100 Non Le nombre maximum de demandes à la demande et optimisées pour la latence que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande et optimisées pour la latence par minute pour Meta Llama 3.1 70B Instruct Chaque Région prise en charge : 100 Non Le nombre maximum de demandes à la demande et optimisées pour la latence que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèle à la demande et optimisés pour la latence par minute pour Meta Llama 3.1 405B Instruct Chaque région prise en charge : 40 000 Non Le nombre maximum de jetons à la demande et optimisés pour la latence que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèle à la demande et optimisés pour la latence par minute pour Meta Llama 3.1 70B Instruct Chaque région prise en charge : 40 000 Non Le nombre maximum de jetons à la demande et optimisés pour la latence que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes InvokeModel simultanées à la demande pour Amazon Nova Reel1.0 Chaque Région prise en charge : 10 Non Nombre maximal de demandes d'inférence de modèle simultanées que vous pouvez soumettre pour Amazon Nova Reel 1.0. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes InvokeModel simultanées à la demande pour Amazon Nova Reel1.1 Chaque région prise en charge : 3 Non Le nombre maximum de demandes d'inférence de modèle simultanées que vous pouvez soumettre pour Amazon Nova Reel 1.1. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes InvokeModel simultanées à la demande pour Amazon Nova Sonic Chaque Région prise en charge : 20 Non Le nombre maximum de demandes simultanées que vous pouvez envoyer pour l'inférence de modèles pour Amazon Nova Sonic.
Demandes d'inférence de modèles optimisées pour la latence et à la demande par minute pour Anthropic Claude 3.5 Haiku Chaque Région prise en charge : 100 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Anthropic Claude 3.5 Haiku, si l'optimisation de la latence est configurée.
Jetons d'inférence de modèles optimisés pour la latence et à la demande par minute pour Anthropic Claude 3.5 Haiku Chaque région prise en charge : 500 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream pour Anthropic Claude 3.5 Haiku, si l'optimisation de la latence est configurée.
Demandes simultanées d'inférence de modèles à la demande pour le Luma Ray V2 Par région prise en charge : 1 Non Le nombre maximum de demandes simultanées que vous pouvez soumettre pour l'inférence de modèle pour Luma Ray V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour AI21 Labs Jamba 1.5 Large Chaque Région prise en charge : 100 Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèles en une minute pour AI21 Labs Jamba 1.5 Large. Le quota prend en compte la somme combinée des demandes pour Converse et InvokeModel
Demandes d'inférence de modèles à la demande par minute pour AI21 Labs Jamba 1.5 Mini Chaque Région prise en charge : 100 Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour AI21 Labs Jamba 1.5 Mini. Le quota prend en compte la somme combinée des demandes pour Converse et InvokeModel
Demandes d'inférence de modèles à la demande par minute pour AI21 Labs Jamba Instruct Chaque Région prise en charge : 100 Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèles en une minute pour AI21 Labs Jamba Instruct. Le quota prend en compte la somme combinée des demandes pour Converse et InvokeModel
Demandes d'inférence de modèles à la demande par minute pour AI21 Labs Jurassic-2 Mid Chaque région prise en charge : 400 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour AI21 Labs Jurassic-2 Mid
Demandes d'inférence de modèles à la demande par minute pour AI21 Labs Jurassic-2 Ultra Chaque Région prise en charge : 100 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour AI21 Labs Jurassic-2 Ultra
Demandes d'inférence de modèles à la demande par minute pour Amazon Nova Canvas Chaque Région prise en charge : 100 Non Nombre maximal de demandes que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Canvas. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Amazon Nova Lite

us-east-1 : 1 000

Chacune des autres régions prises en charge : 100

Non Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Lite. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Amazon Nova Micro

us-east-1 : 1 000

Chacune des autres régions prises en charge : 100

Non Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Micro. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Amazon Nova Pro

us-east-1 : 100

us-east-2 : 100

Chacune des autres régions prises en charge : 50

Non Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Pro. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Amazon R Chaque région prise en charge : 200 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon R 1.0.
Demandes d'inférence de modèles à la demande par minute pour Amazon Titan Image Generator G1 Chaque région prise en charge : 60 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon Titan Image Generator G1.
Demandes d'inférence de modèles à la demande par minute pour Amazon Titan Image Generator G1 V2 Chaque région prise en charge : 60 Non Nombre maximal de demandes à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Titan Image Generator G1 V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Amazon Titan Multimodal Embeddings G1 Chaque Région prise en charge : 2 000 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon Titan Multimodal Embeddings G1.
Demandes d'inférence de modèles à la demande par minute pour Amazon Titan Text Embeddings Chaque Région prise en charge : 2 000 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon Titan Text Embeddings
Demandes d'inférence de modèles à la demande par minute pour Amazon Titan Text Embeddings V2 Chaque Région prise en charge : 2 000 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Amazon Titan Text Embeddings V2
Demandes d'inférence de modèles à la demande par minute pour Amazon Titan Text Express Chaque région prise en charge : 400 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Amazon, Titan Text Express
Demandes d'inférence de modèles à la demande par minute pour Amazon Titan Text Lite Chaque région prise en charge : 800 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Amazon Titan Text Lite
Demandes d'inférence de modèles à la demande par minute pour Amazon Titan Text Premier Chaque Région prise en charge : 100 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Amazon, Titan Text Premier
Demandes d'inférence de modèles à la demande par minute pour Anthropic Claude 3 Haiku

us-east-1 : 1 000

us-west-2 : 1 000

ap-northeast-1 : 200

ap-southeast-1 : 200

Chacune des autres régions prises en charge : 400

Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Anthropic Claude 3 Haiku.
Demandes d'inférence de modèles à la demande par minute pour Anthropic Claude 3 Opus Chaque région prise en charge : 50 Non Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude 3 Opus. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Anthropic Claude 3 Sonnet

us-east-1 : 500

us-west-2 : 500

Chacune des autres régions prises en charge : 100

Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Anthropic Claude 3, Sonnet.
Demandes d'inférence de modèles à la demande par minute pour Anthropic Claude 3.5 Haiku

us-west-1 : 400

Chacune des autres régions prises en charge : 1 000

Non Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Anthropic Claude 3.5 Haiku. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Anthropic Claude 3.5 Sonnet

us-east-1 : 50

us-east-2 : 50

us-west-2 : 250

ap-northeast-2 : 50

ap-south-1 : 50

ap-southeast-2 : 50

Chacune des autres régions prises en charge : 20

Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Anthropic Claude 3.5 Sonnet. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Anthropic Claude 3.5 Sonnet V2

us-west-2 : 250

Chacune des autres régions prises en charge : 50

Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Anthropic Claude 3.5 Sonnet V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Anthropic Claude Instant

us-east-1 : 1 000

us-west-2 : 1 000

Chacune des autres régions prises en charge : 400

Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota tient compte de la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour Anthropic, Claude Instant
Demandes d'inférence de modèles à la demande par minute pour Anthropic Claude V2

us-east-1 : 500

us-west-2 : 500

Chacune des autres régions prises en charge : 100

Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream pour Anthropic Claude V2
Demandes d'inférence de modèles à la demande par minute pour Cohere Command Chaque région prise en charge : 400 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream de Cohere InvokeModelWithResponseStream Command.
Demandes d'inférence de modèles à la demande par minute pour Cohere Command Light Chaque région prise en charge : 800 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream de InvokeModelWithResponseStream Cohere Command Light.
Demandes d'inférence de modèles à la demande par minute pour Cohere Command R Chaque région prise en charge : 400 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream pour Cohere Command R 128k.
Demandes d'inférence de modèles à la demande par minute pour Cohere Command R Plus Chaque région prise en charge : 400 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et de ConverseStream 128 000 InvokeModelWithResponseStream pour Cohere Command R Plus.
Demandes d'inférence de modèles à la demande par minute pour Cohere Embed English Chaque Région prise en charge : 2 000 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Cohere Embed English.
Demandes d'inférence de modèles à la demande par minute pour Cohere Embed Multilingual Chaque Région prise en charge : 2 000 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Cohere Embed Multilingual.
Demandes d'inférence de modèles à la demande par minute pour Cohere R 3.5 Chaque région prise en charge : 250 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Cohere R 3.5.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 2 13B Chaque région prise en charge : 800 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et de ConverseStream 13B InvokeModelWithResponseStream pour Meta Llama 2.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 2 70B Chaque région prise en charge : 400 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et de ConverseStream 70B InvokeModelWithResponseStream pour Meta Llama 2.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 2 Chat 13B Chaque région prise en charge : 800 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et InvokeModelWithResponseStream de Meta Llama 2 Chat 13B. ConverseStream
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 2 Chat 70B Chaque région prise en charge : 400 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et InvokeModelWithResponseStream de Meta Llama 2 Chat 70B. ConverseStream
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3 70B Instruct Chaque région prise en charge : 400 Non Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3 70B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3 8B Instruct Chaque région prise en charge : 800 Non Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3 8B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3.1 405B Instruct Chaque région prise en charge : 200 Non Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3.1 70B Instruct Chaque région prise en charge : 400 Non Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3.1 8B Instruct Chaque région prise en charge : 800 Non Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.1 8B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3.2 11B Instruct Chaque région prise en charge : 400 Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Meta Llama 3.2 11B Instruct. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3.2 1B Instruct Chaque région prise en charge : 800 Non Le nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.2 1B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3.2 3B Instruct Chaque région prise en charge : 800 Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Meta Llama 3.2 3B Instruct. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3.2 90B Instruct Chaque région prise en charge : 400 Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Meta Llama 3.2 90B Instruct. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Demandes d'inférence de modèles à la demande par minute pour Meta Llama 3.3 70B Instruct Chaque région prise en charge : 400 Non Nombre maximum de demandes à la demande que vous pouvez soumettre pour l'inférence de modèles en une minute pour Meta Llama 3.3 70B Instruct. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Demandes d'inférence de modèles à la demande par minute pour Mistral 7B Instruct Chaque région prise en charge : 800 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Mistral mistral-7 0 b-instruct-v
Demandes d'inférence de modèles à la demande par minute pour Mistral AI Mistral Small Chaque région prise en charge : 400 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel et InvokeModelWithResponseStream en une minute pour Mistral AI Mistral Small
Demandes d'inférence de modèles à la demande par minute pour Mistral Large Chaque région prise en charge : 400 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel et InvokeModelWithResponseStream en une minute pour Mistral mistral-large-2402-v1
Demandes d'inférence de modèles à la demande par minute pour Mistral Large 2407 Chaque région prise en charge : 400 Non Le nombre maximum de fois que vous pouvez appeler l'inférence de modèle en une minute pour Mistral Large 2407. Le quota prend en compte la somme combinée des demandes pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream
Demandes d'inférence de modèles à la demande par minute pour Mistral Mixtral 8x7b Instruct Chaque région prise en charge : 400 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Mistral mixtral-8x7b-v0
Demandes d'inférence de modèles à la demande par minute pour Stability.ai Stable Diffusion 3 Large Chaque région prise en charge : 15 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Diffusion 3 Large.
Demandes d'inférence de modèles à la demande par minute pour Stability.ai Stable Diffusion 3 Medium Chaque région prise en charge : 60 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Diffusion 3 Medium
Demandes d'inférence de modèles à la demande par minute pour Stability.ai Stable Diffusion 3.5 Large Chaque région prise en charge : 15 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Diffusion 3.5 Large.
Demandes d'inférence de modèles à la demande par minute pour Stability.ai Stable Diffusion XL 0.8 Chaque région prise en charge : 60 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Diffusion XL 0.8
Demandes d'inférence de modèles à la demande par minute pour Stability.ai Stable Diffusion XL 1.0 Chaque région prise en charge : 60 Non Le nombre maximum de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Diffusion XL 1.0
Demandes d'inférence de modèles à la demande par minute pour Stability.ai Stable Image Core Chaque région prise en charge : 90 Non Nombre maximal de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Image Core.
Demandes d'inférence de modèles à la demande par minute pour Stability.ai Stable Image Ultra Chaque Région prise en charge : 10 Non Nombre maximal de fois que vous pouvez appeler InvokeModel en une minute pour Stability.ai Stable Image Ultra.
Jetons d'inférence de modèles à la demande par minute pour AI21 Labs Jamba 1.5 Large Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour AI21 Labs Jamba 1.5 Large. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse et InvokeModel.
Jetons d'inférence de modèles à la demande par minute pour AI21 Labs Jamba 1.5 Mini Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence de modèles en une minute pour AI21 Labs Jamba 1.5 Mini. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse et InvokeModel.
Jetons d'inférence de modèles à la demande par minute pour AI21 Labs Jamba Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour AI21 Labs Jamba Instruct. Le quota prend en compte la somme combinée des jetons pour Converse et InvokeModel
Jetons d'inférence de modèles à la demande par minute pour AI21 Labs Jurassic-2 Mid Chaque région prise en charge : 300 000 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream, InvokeModelWithResponseStream pour AI21 Labs Jurassic-2 Mid.
Jetons d'inférence de modèles à la demande par minute pour AI21 Labs Jurassic-2 Ultra Chaque région prise en charge : 300 000 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et de Jurassic-2 InvokeModelWithResponseStream Ultra pour AI21 Labs. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Amazon Nova Lite

us-east-1 : 2 000 000

Chacune des autres régions prises en charge : 100 000

Non Le nombre maximum de jetons à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Lite. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Amazon Nova Micro

us-east-1 : 2 000 000

Chacune des autres régions prises en charge : 100 000

Non Nombre maximal de jetons à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Micro. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Amazon Nova Pro

us-east-1 : 400 000

us-east-2 : 400 000

Chacune des autres régions prises en charge : 100 000

Non Le nombre maximum de jetons à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Nova Pro. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Amazon Titan Image Generator G1 Chaque Région prise en charge : 2 000 Non Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Amazon Titan Image Generator G1.
Jetons d'inférence de modèles à la demande par minute pour Amazon Titan Image Generator G1 V2 Chaque Région prise en charge : 2 000 Non Le nombre maximum de jetons à la demande que vous pouvez envoyer pour l'inférence de modèles en une minute pour Amazon Titan Image Generator G1 V2. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Amazon Titan Multimodal Embeddings G1 Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Amazon Titan Multimodal Embeddings G1.
Jetons d'inférence de modèles à la demande par minute pour Amazon Titan Text Embeddings Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Amazon Titan Text Embeddings.
Jetons d'inférence de modèles à la demande par minute pour Amazon Titan Text Embeddings V2 Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Amazon Titan Text Embeddings V2.
Jetons d'inférence de modèles à la demande par minute pour Amazon Titan Text Express Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Amazon Titan Text Express. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Amazon Titan Text Lite Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Amazon Titan Text Lite. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Amazon Titan Text Premier Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Amazon Titan Text Premier. ConverseStream
Modèles de jetons d'inférence par minute à la demande pour Anthropic Claude 3 Haiku

us-east-1 : 2 000 000

us-west-2 : 2 000 000

ap-northeast-1 : 200 000

ap-southeast-1 : 200 000

Chacune des autres régions prises en charge : 300 000

Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Anthropic Claude 3 Haiku. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Anthropic Claude 3 Opus Chaque région prise en charge : 400 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3 Opus. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèles de jetons d'inférence par minute à la demande pour Anthropic Claude 3 Sonnet

us-east-1 : 1 000 000

us-west-2 : 1 000 000

Chacune des autres régions prises en charge : 200 000

Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Anthropic Claude 3 Sonnet. ConverseStream
Modèles de jetons d'inférence par minute à la demande pour Anthropic Claude 3.5 Haiku

us-west-1 : 300 000

Chacune des autres régions prises en charge : 2 000 000

Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Haiku. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèles d'inférence de modèles à la demande par minute pour Anthropic Claude 3.5 Sonnet

us-east-1 : 400 000

us-east-2 : 400 000

us-west-2 : 2 000 000

ap-northeast-2 : 400 000

ap-south-1 : 400 000

ap-southeast-2 : 400 000

Chacune des autres régions prises en charge : 200 000

Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Sonnet. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Anthropic Claude 3.5 Sonnet V2

us-west-2 : 2 000 000

Chacune des autres régions prises en charge : 400 000

Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Anthropic Claude 3.5 Sonnet V2. Le quota prend en compte la somme combinée de Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Modèles d'inférence de modèles à la demande par minute pour Anthropic Claude Instant

us-east-1 : 1 000 000

us-west-2 : 1 000 000

Chacune des autres régions prises en charge : 300 000

Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Anthropic Claude Instant. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Anthropic Claude V2

us-east-1 : 500 000

us-west-2 : 500 000

Chacune des autres régions prises en charge : 200 000

Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie InvokeModelWithResponseStream pour toutes les demandes adressées à Converse InvokeModel et à Anthropic Claude V2. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Cohere Command Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et à InvokeModelWithResponseStream Cohere Command. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Cohere Command Light Chaque région prise en charge : 300 000 Non Nombre maximal de fois que vous pouvez appeler l'inférence de modèle en une minute. Le quota prend en compte la somme combinée de Converse InvokeModel et ConverseStream de InvokeModelWithResponseStream Cohere Command Light.
Jetons d'inférence de modèles à la demande par minute pour Cohere Command R Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Cohere Command R 128k. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Cohere Command R Plus Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream pour Cohere Command R Plus 128k.
Jetons d'inférence de modèles à la demande par minute pour Cohere Embed English Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Cohere Embed English.
Jetons d'inférence de modèles à la demande par minute pour Cohere Embed Multilingual Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez fournir InvokeModel en une minute pour Cohere Embed Multilingual.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 2 13B Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Meta Llama 2 13B. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 2 70B Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream pour Meta Llama 2 70B.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 2 Chat 13B Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Meta Llama 2 Chat 13B. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 2 Chat 70B Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Meta Llama 2 Chat 70B. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3 70B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3 8B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3 8B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3.1 405B Instruct Chaque région prise en charge : 400 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 405B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3.1 70B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3.1 8B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.1 8B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3.2 11B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 11B Instruct. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3.2 1B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 1B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3.2 3B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 3B Instruct. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3.2 90B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.2 90B Instruct. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream.
Jetons d'inférence de modèles à la demande par minute pour Meta Llama 3.3 70B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute pour Meta Llama 3.3 70B Instruct. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse ConverseStream, InvokeModel et InvokeModelWithResponseStream.
Jetons d'inférence de modèles à la demande par minute pour Mistral AI Mistral 7B Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Mistral AI Mistral 7B Instruct. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Mistral AI Mistral Large Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Mistral AI Mistral Large. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Mistral AI Mistral Small Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Mistral AI Mistral Small. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Mistral AI Mixtral 8X7BB Instruct Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons à la demande que vous pouvez soumettre pour l'inférence du modèle en une minute. Le quota prend en compte la somme combinée des jetons d'entrée et de sortie pour toutes les demandes adressées à Converse InvokeModel et InvokeModelWithResponseStream pour Mistral AI Mixtral 8X7B Instruct. ConverseStream
Jetons d'inférence de modèles à la demande par minute pour Mistral Large 2407 Chaque région prise en charge : 300 000 Non Le nombre maximum de jetons que vous pouvez soumettre pour l'inférence du modèle en une minute pour Mistral Large 2407. Le quota prend en compte la somme combinée des jetons pour InvokeModel InvokeModelWithResponseStream, Converse et ConverseStream
Paramètres par fonction Chaque Région prise en charge : 5 Oui Le nombre maximum de paramètres que vous pouvez avoir dans une fonction de groupe d'actions.
PrepareAgent demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' PrepareAgent API par seconde.
Nombre d'enregistrements par lot, tâche d'inférence pour Claude 3 Haiku Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Haiku.
Nombre d'enregistrements par lot : tâche d'inférence pour Claude 3 Opus Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Opus.
Nombre d'enregistrements par lot : tâche d'inférence pour Claude 3 Sonnet Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3 Sonnet.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude 3.5 Haiku Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Haiku.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude 3.5 Sonnet Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet.
Nombre d'enregistrements par tâche d'inférence par lot pour Claude 3.5 Sonnet v2 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet v2.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.1 405B Instruct Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 405B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.1 70B Instruct Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 70B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.1 8B Instruct Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.1 8B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.2 11B Instruct Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 11B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.2 1B Instruct Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée d'une tâche d'inférence par lots Llama 3.2 1B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.2 3B Instruct Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 3B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.2 90B Instruct Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.2 90B Instruct.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 3.3 70B Instruct Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 3.3 70B Instruct.
Nombre d'enregistrements par lot, tâche d'inférence pour Llama 4 Maverick Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 4 Maverick.
Nombre d'enregistrements par tâche d'inférence par lot pour Llama 4 Scout Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Llama 4 Scout.
Nombre d'enregistrements par tâche d'inférence par lot pour Mistral Large 2 (24.07) Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Large 2 (24,07).
Nombre d'enregistrements par tâche d'inférence par lot pour Mistral Small Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Mistral Small.
Nombre d'enregistrements par tâche d'inférence par lot pour Nova Lite V1 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Lite V1.
Nombre d'enregistrements par tâche d'inférence par lot pour Nova Micro V1 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Micro V1.
Nombre d'enregistrements par tâche d'inférence par lot pour Nova Pro V1 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Nova Pro V1.
Nombre d'enregistrements par tâche d'inférence par lot pour Titan Multimodal Embeddings G1 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Titan Multimodal Embeddings G1.
Nombre d'enregistrements par tâche d'inférence par lot pour Titan Text Embeddings V2 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans tous les fichiers d'entrée dans une tâche d'inférence par lots pour Titan Text Embeddings V2.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3 Haiku Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3 Haiku.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3 Opus Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3 Opus.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3 Sonnet Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3 Sonnet.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3.5 Haiku Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Haiku.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3.5 Sonnet Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Claude 3.5 Sonnet v2 Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Claude 3.5 Sonnet v2.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.1 405B Instruct Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.1 405B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.1 70B Instruct Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.1 70B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.1 8B Instruct Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.1 8B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.2 11B Instruct Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.2 11B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.2 1B Instruct Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots Llama 3.2 1B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.2 3B Instruct Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.2 3B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.2 90B Instruct Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.2 90B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 3.3 70B Instruct Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 3.3 70B Instruct.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 4 Maverick Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 4 Maverick.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Llama 4 Scout Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Llama 4 Scout.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Mistral Large 2 (24.07) Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Mistral Large 2 (24,07).
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Mistral Small Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Mistral Small.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Nova Lite V1 Chaque région prise en charge : 50 000 Oui Nombre maximal d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Nova Lite V1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Nova Micro V1 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Nova Micro V1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Nova Pro V1 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Nova Pro V1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Titan Multimodal Embeddings G1 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Titan Multimodal Embeddings G1.
Enregistrements par fichier d'entrée par tâche d'inférence par lots pour Titan Text Embeddings V2 Chaque région prise en charge : 50 000 Oui Le nombre maximum d'enregistrements dans un fichier d'entrée dans une tâche d'inférence par lots pour Titan Text Embeddings V2.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Haiku Chaque région prise en charge : 20 Oui Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Haiku.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Opus Chaque région prise en charge : 20 Oui Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Opus.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Sonnet Chaque région prise en charge : 20 Oui Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3 Sonnet.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Haiku Chaque région prise en charge : 20 Oui Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Haiku.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Sonnet Chaque région prise en charge : 20 Oui Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Sonnet.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Sonnet v2 Chaque région prise en charge : 20 Oui Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Claude 3.5 Sonnet v2.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 405B Instruct Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 405B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 70B Instruct Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 70B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 8B Instruct Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.1 8B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 11B Instruct Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 11B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 1B Instruct Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 1B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 3B Instruct Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 3B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 90B Instruct Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.2 90B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.3 70B Instruct Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 3.3 70B Instruct.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 4 Maverick Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 4 Maverick.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 4 Scout Chaque région prise en charge : 20 Oui Nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Llama 4 Scout.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Large 2 (24.07) Chaque région prise en charge : 20 Oui Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Large 2 (24,07).
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Small Chaque région prise en charge : 20 Oui Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Mistral Small.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Lite V1 Chaque région prise en charge : 20 Oui Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Lite V1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Micro V1 Chaque région prise en charge : 20 Oui Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Micro V1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Pro V1 Chaque région prise en charge : 20 Oui Nombre maximal de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Nova Pro V1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Titan Multimodal Embeddings G1 Chaque région prise en charge : 20 Oui Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Titan Multimodal Embeddings G1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Titan Text Embeddings V2 Chaque région prise en charge : 20 Oui Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle de base pour Titan Text Embeddings V2.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle personnalisé pour Titan Multimodal Embeddings G1 Chaque région prise en charge : 3 Non Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle personnalisé pour Titan Multimodal Embeddings G1.
Somme des tâches d'inférence par lots en cours et soumises à l'aide d'un modèle personnalisé pour Titan Text Embeddings V2 Chaque région prise en charge : 3 Non Le nombre maximum de tâches d'inférence par lots en cours et soumises à l'aide d'un modèle personnalisé pour Titan Text Embeddings V2
Limite de fréquence d'accélération pour Bedrock Data Automation Runtime : ListTagsForResource Chaque région prise en charge : 25 par seconde Non Le nombre maximum de Bedrock Data Automation Runtime : ListTagsForResource demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de fréquence d'accélération pour Bedrock Data Automation Runtime : TagResource Chaque région prise en charge : 25 par seconde Non Le nombre maximum de Bedrock Data Automation Runtime : TagResource demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de fréquence d'accélération pour Bedrock Data Automation Runtime : UntagResource Chaque région prise en charge : 25 par seconde Non Le nombre maximum de Bedrock Data Automation Runtime : UntagResource demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélération pour Bedrock Data Automation : ListTagsForResource Chaque région prise en charge : 25 par seconde Non Le nombre maximum de Bedrock Data Automation : ListTagsForResource demandes que vous pouvez faire par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélération pour Bedrock Data Automation : TagResource Chaque région prise en charge : 25 par seconde Non Le nombre maximum de Bedrock Data Automation : TagResource demandes que vous pouvez faire par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélération pour Bedrock Data Automation : UntagResource Chaque région prise en charge : 25 par seconde Non Le nombre maximum de Bedrock Data Automation : UntagResource demandes que vous pouvez faire par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour CreateBlueprint Chaque région prise en charge : 5 par seconde Non Le nombre maximum de CreateBlueprint demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour CreateBlueprintVersion Chaque région prise en charge : 5 par seconde Non Le nombre maximum de CreateBlueprintVersion demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour CreateDataAutomationProject Chaque région prise en charge : 5 par seconde Non Le nombre maximum de CreateDataAutomationProject demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour DeleteBlueprint Chaque région prise en charge : 5 par seconde Non Le nombre maximum de DeleteBlueprint demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour DeleteDataAutomationProject Chaque région prise en charge : 5 par seconde Non Le nombre maximum de DeleteDataAutomationProject demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour GetBlueprint Chaque région prise en charge : 5 par seconde Non Le nombre maximum de GetBlueprint demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour GetDataAutomationProject Chaque région prise en charge : 5 par seconde Non Le nombre maximum de GetDataAutomationProject demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour GetDataAutomationStatus Chaque Région prise en charge : 10 par seconde Non Le nombre maximum de GetDataAutomationStatus demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour InvokeDataAutomationAsync Chaque Région prise en charge : 10 par seconde Non Le nombre maximum de InvokeDataAutomationAsync demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour ListBlueprints Chaque région prise en charge : 5 par seconde Non Le nombre maximum de ListBlueprints demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour ListDataAutomationProjects Chaque région prise en charge : 5 par seconde Non Le nombre maximum de ListDataAutomationProjects demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour UpdateBlueprint Chaque région prise en charge : 5 par seconde Non Le nombre maximum de UpdateBlueprint demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
Limite de vitesse d'accélérateur pour UpdateDataAutomationProject Chaque région prise en charge : 5 par seconde Non Le nombre maximum de UpdateDataAutomationProject demandes que vous pouvez effectuer par seconde et par compte, dans la région actuelle
UpdateAgent demandes par seconde Chaque Région prise en charge : 4 Non Le nombre maximum de demandes d' UpdateAgent API par seconde.
UpdateAgentActionGroup demandes par seconde Chaque région prise en charge : 6 Non Le nombre maximum de demandes d' UpdateAgentActionGroup API par seconde.
UpdateAgentAlias demandes par seconde Chaque région prise en charge : 2 Non Le nombre maximum de demandes d' UpdateAgentAlias API par seconde.
UpdateAgentKnowledgeBase demandes par seconde Chaque Région prise en charge : 4 Non Le nombre maximum de demandes d' UpdateAgentKnowledgeBase API par seconde.
Note

Vous pouvez demander une augmentation du quota de votre compte en suivant les étapes ci-dessous :

  • Si un quota est marqué Oui, vous pouvez l'ajuster en suivant les étapes décrites dans la section Demander une augmentation de quota dans le Guide de l'utilisateur du Service Quotas.

  • Si un quota est marqué comme Non, vous pouvez soumettre une demande par le biais du formulaire d'augmentation des limites pour qu'une augmentation soit prise en compte.

  • Quel que soit le modèle, vous pouvez demander une augmentation pour les quotas suivants en même temps :

    • InvokeModel Jetons interrégionaux par minute pour ${model}

    • InvokeModel Demandes interrégionales par minute pour ${model}

    • InvokeModel Jetons à la demande par minute pour ${model}

    • InvokeModel Demandes à la demande par minute pour ${model}

    Pour demander une augmentation pour n'importe quelle combinaison de ces quotas, demandez une augmentation du nombre de InvokeModel jetons interrégionaux par minute pour le ${model} quota en suivant les étapes décrites dans la section Demander une augmentation de quota dans le Guide de l'utilisateur du Service Quotas. Une fois cela fait, l'équipe d'assistance vous contactera et vous proposera la possibilité d'augmenter également les trois autres quotas. En raison de la forte demande, la priorité sera accordée aux clients dont le trafic consomme le quota qui leur est alloué. Votre demande peut être refusée si vous ne remplissez pas cette condition.