Utiliser un profil d'inférence lors de l'invocation du modèle - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utiliser un profil d'inférence lors de l'invocation du modèle

Vous pouvez utiliser un profil d'inférence interrégional à la place d'un modèle de base pour acheminer les demandes vers plusieurs régions. Pour suivre les coûts et l'utilisation d'un modèle, dans une ou plusieurs régions, vous pouvez utiliser un profil d'inférence d'application. Pour savoir comment utiliser un profil d'inférence lors de l'exécution d'une inférence de modèle, choisissez l'onglet correspondant à votre méthode préférée, puis suivez les étapes suivantes :

Console

Pour utiliser un profil d'inférence avec une fonctionnalité qui le prend en charge, procédez comme suit :

  1. Connectez-vous au AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ouvrez ensuite la console Amazon Bedrock à https://console.aws.amazon.com/bedrock/l'adresse.

  2. Accédez à la page de la fonctionnalité pour laquelle vous souhaitez utiliser un profil d'inférence. Par exemple, sélectionnez Chat/Text playground dans le volet de navigation de gauche.

  3. Choisissez Sélectionner un modèle, puis choisissez le modèle. Par exemple, choisissez Amazon puis Nova Premier.

  4. Sous Inférence, sélectionnez Profils d'inférence dans le menu déroulant.

  5. Sélectionnez le profil d'inférence à utiliser (par exemple, US Nova Premier), puis choisissez Appliquer.

API

Vous pouvez utiliser un profil d'inférence lorsque vous exécutez une inférence à partir de n'importe quelle région qui y est incluse avec les opérations d'API suivantes :

Note

Si vous utilisez un profil d'inférence entre régions (défini par le système), vous pouvez utiliser l'ARN ou l'ID du profil d'inférence.