View a markdown version of this page

Régions et modèles pris en charge pour les profils d'inférence - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Régions et modèles pris en charge pour les profils d'inférence

Pour obtenir la liste des codes de région et des points de terminaison pris en charge dans Amazon Bedrock, consultez Points de terminaison et quotas Amazon Bedrock. Cette rubrique décrit les profils d'inférence prédéfinis que vous pouvez utiliser ainsi que les régions et les modèles qui prennent en charge les profils d'inférence d'application.

Note

Vous recherchez des identifiants de profil d'inférence pour un modèle spécifique ? Les identifiants de profil d'inférence et la disponibilité régionale de chaque modèle sont désormais documentés sur la page détaillée du modèle. Consultez les modèles en un coup d'œil et choisissez le modèle qui vous intéresse.

Profils d'inférence interrégionaux pris en charge

Vous pouvez effectuer une inférence entre régions à l'aide de profils d'inférence entre régions (définis par le système). Cross-Region l'inférence vous permet de gérer de manière fluide les pics de trafic imprévus en utilisant le calcul entre différents types de trafic. Régions AWS Grâce à l’inférence interrégionale, vous pouvez répartir le trafic entre plusieurs Régions AWS.

Cross-region les profils d'inférence (définis par le système) sont nommés d'après le modèle qu'ils prennent en charge et définis par les régions qu'ils prennent en charge. Pour comprendre comment un profil d’inférence interrégional gère vos demandes, consultez les définitions suivantes :

  • Région source : région à partir de laquelle vous effectuez la demande d’API qui spécifie le profil d’inférence.

  • Région de destination : région dans laquelle le service Amazon Bedrock peut acheminer la demande depuis votre région source.

Lorsque vous invoquez un profil d’inférence interrégional dans Amazon Bedrock, votre demande provient d’une région source et est automatiquement acheminée vers l’une des régions de destination définies dans ce profil, optimisant ainsi les performances. Les régions de destination pour les profils d’inférence interrégionaux mondiaux incluent toutes les régions commerciales.

Note

Les régions de destination d'un profil d'inférence interrégional peuvent inclure des régions facultatives, qui sont des régions que vous devez explicitement activer au niveau de l'organisation Compte AWS ou au niveau de l'organisation. Pour en savoir plus, consultez la section Activer ou désactiver Régions AWS dans votre compte. Lorsque vous utilisez un profil d’inférence interrégional, votre demande d’inférence peut être acheminée vers l’une des régions de destination figurant dans le profil, même si vous n’avez pas activé ces régions dans votre compte.

Les politiques de contrôle des services (SCP) et Gestion des identités et des accès AWS (IAM) fonctionnent ensemble pour contrôler les endroits où l'inférence entre régions est autorisée. À l’aide des SCP, vous pouvez contrôler les régions qu’Amazon Bedrock peut utiliser à des fins d’inférence, et à l’aide des politiques IAM, vous pouvez définir les utilisateurs ou rôles autorisés à exécuter l’inférence. Si une région de destination d’un profil d’inférence interrégional est bloquée dans vos SCP, la demande échoue même si les autres régions restent autorisées. Pour garantir un fonctionnement efficace avec l’inférence interrégionale, vous pouvez mettre à jour vos politiques SCP et IAM, afin d’autoriser toutes les actions d’inférence Amazon Bedrock requises (par exemple bedrock:InvokeModel* ou bedrock:CreateModelInvocationJob) dans toutes les régions de destination incluses dans le profil d’inférence que vous avez choisi. Pour en savoir plus, consultez Activation de l’inférence interrégionale Amazon Bedrock dans les environnements multicomptes.

Note

Certains profils d’inférence sont acheminés vers différentes régions de destination en fonction de la région source à partir de laquelle vous les appelez. Par exemple, si vous appelez us.anthropic.claude-3-haiku-20240307-v1:0 depuis la région USA Est (Ohio), il peut acheminer les demandes vers us-east-1, us-east-2 ou us-west-2, mais si vous l’appelez depuis la région USA Ouest (Oregon), il peut acheminer les demandes uniquement vers us-east-1 et us-west-2.

Pour vérifier les régions source et de destination d’un profil d’inférence, vous pouvez effectuer l’une des opérations suivantes :

Note

Le profil d'inférence interrégional global pour un modèle spécifique peut changer au fil du temps en raison de l' AWS ajout de nouvelles régions commerciales dans lesquelles vos demandes peuvent être traitées. Toutefois, si un profil d'inférence est lié à une zone géographique (comme les États-Unis, l'UE ou la région APAC), la liste des régions de destination ne changera jamais. AWS peut créer de nouveaux profils d'inférence incorporant de nouvelles régions. Vous pouvez mettre à jour vos systèmes pour utiliser ces profils d’inférence en remplaçant les identifiants de votre configuration par les nouveaux.

Le profil d’inférence interrégional mondial est actuellement pris en charge dans le modèle Anthropic Claude Sonnet 4 uniquement pour les régions source suivantes : USA Ouest (Oregon), USA Est (Virginie du Nord), USA Est (Ohio), Europe (Irlande) et Asie-Pacifique (Tokyo). Les régions de destination du profil d’inférence mondial comprennent toutes les Régions AWS commerciales.

Important

Les identifiants de profil d'inférence interrégional, les régions source prises en charge, les régions de destination et la portée géographique (mondiale, américaine ou européenne) de chaque modèle sont documentés sur la page détaillée du modèle. Pour trouver ces informations, consultez les modèles en un coup d'œil et choisissez le modèle qui vous intéresse. Sur la page du modèle, recherchez le tableau de disponibilité régional : il indique les profils d'inférence régionaux In-Region, géographiques et globaux pris en charge, et la section ID du profil d'inférence répertorie les identifiants exacts à utiliser dans les appels d'API.

Si vous devez comparer les options de résidence des données entre plusieurs modèles à des fins de planification de la conformité, consultez le tableau de disponibilité régional sur la page de chaque modèle pour vérifier que le profil d'inférence du modèle que vous avez choisi achemine les demandes uniquement vers les régions qui répondent à vos exigences.

Régions et modèles pris en charge pour les profils d'inférence d'applications

Des profils d'inférence d'application peuvent être créés pour tous les modèles suivants : Régions AWS

  • ap-northeast-1

  • ap-northeast-2

  • ap-south-1

  • ap-southeast-1

  • ap-southeast-2

  • ca-central-1

  • eu-central-1

  • eu-west-1

  • eu-west-2

  • eu-west-3

  • sa-east-1

  • us-east-1

  • us-east-2

  • us-gov-east-1

  • us-west-2

Les profils d'inférence d'applications peuvent être créés à partir de la plupart des modèles pris en charge par Amazon Bedrock. Certains modèles, tels que les modèles d'intégration, ne prennent pas en charge les profils d'inférence. Pour vérifier si un modèle spécifique prend en charge les profils d'inférence, consultez les modèles en un coup d'œil.