Achat de débit provisionné pour un modèle personnalisé

Pour utiliser un modèle personnalisé doté d’une capacité de calcul dédiée et d’un débit garanti, vous pouvez acheter le débit provisionné correspondant. Vous pouvez ensuite utiliser le modèle provisionné obtenu à des fins d’inférence. Pour plus d’informations sur le débit provisionné, consultez Augmentez la capacité d'invocation des modèles grâce au débit provisionné dans Amazon Bedrock.

Console

Pour acheter du débit provisionné pour un modèle personnalisé.

Connectez-vous au AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ouvrez ensuite la console Amazon Bedrock à l'adresse https://console.aws.amazon.com/bedrock.
Dans le volet de navigation de gauche, choisissez Modèles personnalisés sous Régler.
Dans l’onglet Modèles, cliquez sur le bouton radio à côté du modèle pour lequel vous souhaitez acheter du débit provisionné ou sélectionnez le nom du modèle pour accéder à la page de détails.
Sélectionnez Acheter du débit provisionné.
Pour plus de détails, suivez les étapes décrites dans la documentation relative au débit provisionné.
Après avoir acheté le débit provisionné pour votre modèle personnalisé, suivez les étapes décrites dans la documentation d’utilisation du débit provisionné.

Lorsque vous effectuez une opération prenant en charge l’utilisation de modèles personnalisés, vous verrez votre modèle personnalisé en option dans le menu de sélection du modèle.

API

Pour acheter du débit provisionné pour un modèle personnalisé, suivez les étapes de la documentation sur le débit provisionné pour envoyer une demande CreateProvisionedModelThroughput(voir le lien pour les formats de demande et de réponse et les détails des champs) avec un point de terminaison du plan de contrôle Amazon Bedrock. Utilisez le nom ou l’ARN de votre modèle personnalisé comme modelId. La réponse renvoie un provisionedModelArn que vous pouvez utiliser modelId lorsque vous faites une InvokeModelWithResponseStreamdemande InvokeModelOR.

Consulter des exemples de code

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Configuration de l’inférence pour un modèle personnalisé

Déploiement d’un modèle personnalisé pour une inférence à la demande