Utilisation d’un profil d’inférence lors de l’invocation du modèle - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation d’un profil d’inférence lors de l’invocation du modèle

Vous pouvez utiliser un profil d’inférence interrégional à la place d’un modèle de fondation pour acheminer les demandes vers plusieurs régions. Pour suivre les coûts et l’utilisation d’un modèle, dans une ou plusieurs régions, vous pouvez utiliser un profil d’inférence d’application. Pour savoir comment utiliser un profil d’inférence lors de l’exécution d’une inférence de modèle, choisissez l’onglet correspondant à votre méthode préférée, puis suivez les étapes :

Console

Pour utiliser un profil d’inférence avec une fonctionnalité qui le prend en charge, procédez comme suit :

  1. Connectez-vous à la AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ensuite, ouvrez la console Amazon Bedrock à l’adresse https://console.aws.amazon.com/bedrock.

  2. Accédez à la page de la fonctionnalité pour laquelle vous souhaitez utiliser un profil d’inférence. Par exemple, choisissez Terrain de jeu Discussion/Texte dans le volet de navigation de gauche.

  3. Choisissez Sélectionner un modèle, puis choisissez le modèle. Par exemple, choisissez Amazon puis Nova Premier.

  4. Sous Inférence, sélectionnez Profils d’inférence dans le menu déroulant.

  5. Sélectionnez le profil d’inférence à utiliser (par exemple, US Nova Premier), puis choisissez Appliquer.

API

Vous pouvez utiliser un profil d’inférence lorsque vous exécutez une inférence à partir de n’importe quelle région qui y est incluse avec les opérations d’API suivantes :

Note

Si vous utilisez un profil d’inférence interrégional (défini par le système), vous pouvez utiliser l’ARN ou l’ID du profil d’inférence.