Achat de débit provisionné pour un modèle personnalisé - Amazon Bedrock

Achat de débit provisionné pour un modèle personnalisé

Pour utiliser un modèle personnalisé doté d’une capacité de calcul dédiée et d’un débit garanti, vous pouvez acheter le débit provisionné correspondant. Vous pouvez ensuite utiliser le modèle provisionné obtenu à des fins d’inférence. Pour plus d’informations sur le débit provisionné, consultez Débit provisionné.

Console
Pour acheter du débit provisionné pour un modèle personnalisé.
  1. Connectez-vous à la AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ensuite, ouvrez la console Amazon Bedrock à l’adresse https://console.aws.amazon.com/bedrock.

  2. Dans le volet de navigation de gauche, choisissez Modèles personnalisés sous Régler.

  3. Dans l’onglet Modèles, cliquez sur le bouton radio à côté du modèle pour lequel vous souhaitez acheter du débit provisionné ou sélectionnez le nom du modèle pour accéder à la page de détails.

  4. Sélectionnez Acheter du débit provisionné.

  5. Pour plus de détails, suivez les étapes décrites dans la documentation relative au débit provisionné.

  6. Après avoir acheté le débit provisionné pour votre modèle personnalisé, suivez les étapes décrites dans la documentation d’utilisation du débit provisionné.

Lorsque vous effectuez une opération prenant en charge l’utilisation de modèles personnalisés, vous verrez votre modèle personnalisé en option dans le menu de sélection du modèle.

API

Pour acheter du débit provisionné pour un modèle personnalisé, suivez les étapes décrites dans la documentation relative au débit provisionné pour envoyer une demande CreateProvisionedModelThroughput (consultez le lien pour les formats de demande et de réponse et les détails des champs) avec un point de terminaison de plan de contrôle Amazon Bedrock. Utilisez le nom ou l’ARN de votre modèle personnalisé comme modelId. La réponse renvoie un provisionedModelArn que vous pouvez utiliser comme modelId lorsque vous effectuez une demande InvokeModel ou InvokeModelWithResponseStream.

Consulter des exemples de code