Déploiement d’un modèle personnalisé - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Déploiement d’un modèle personnalisé

Vous pouvez déployer un modèle personnalisé à l'aide de la console Amazon BedrockAWS Command Line Interface, ou AWSSDKs. Pour plus d’informations sur l’utilisation du déploiement à des fins d’inférence, consultez Utiliser un déploiement pour une inférence à la demande.

Déploiement d’un modèle personnalisé (console)

Vous déployez un modèle personnalisé à partir de la page Modèles personnalisés comme suit. Vous pouvez également déployer un modèle à partir de la page Modèle personnalisé à la demande avec les mêmes champs. Pour accéder à cette page, sous Déduire dans le volet de navigation, sélectionnez Modèle personnalisé à la demande.

Pour déployer un modèle personnalisé
  1. Connectez-vous au AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ouvrez ensuite la console Amazon Bedrock à l'adresse https://console.aws.amazon.com/bedrock.

  2. Dans le volet de navigation de gauche, choisissez Modèles personnalisés sous Régler.

  3. Dans l’onglet Modèles, cliquez sur le bouton radio correspondant au modèle que vous souhaitez déployer.

  4. Choisissez Configurer l’inférence et choisissez Déployer avec la fonctionnalité à la demande.

  5. Sous Détails du déploiement, fournissez les informations suivantes :

    • Nom du déploiement (obligatoire) : saisissez un nom unique pour votre déploiement.

    • Description (facultatif) : entrez une description de votre déploiement.

    • Balises (facultatif) : ajoutez des balises pour la répartition des coûts et la gestion des ressources.

  6. Choisissez Créer. Lorsque le statut du déploiement est Active, votre modèle personnalisé est prêt pour une inférence à la demande. Pour plus d’informations sur l’utilisation des modèles personnalisés, consultez Utiliser un déploiement pour une inférence à la demande.

Déploiement d’un modèle personnalisé (AWS Command Line Interface)

Pour déployer un modèle personnalisé à des fins d'inférence à la demande à l'aide deAWS Command Line Interface, utilisez la create-custom-model-deployment commande avec le Amazon Resource Name (ARN) de votre modèle personnalisé. Cette commande utilise l'opération CreateCustomModelDeploymentAPI. La réponse comprend l’ARN du déploiement. Lorsque le déploiement est actif, vous utilisez cet ARN comme modelId lorsque vous effectuez des demandes d’inférence. Pour plus d’informations sur l’utilisation du déploiement à des fins d’inférence, consultez Utiliser un déploiement pour une inférence à la demande.

aws bedrock create-custom-model-deployment \ --model-deployment-name "Unique name" \ --model-arn "Custom Model ARN" \ --description "Deployment description" \ --tags '[ { "key": "Environment", "value": "Production" }, { "key": "Team", "value": "ML-Engineering" }, { "key": "Project", "value": "CustomerSupport" } ]' \ --client-request-token "unique-deployment-token" \ --region region

Déploiement d’un modèle personnalisé (AWSSDKs)

Pour déployer un modèle personnalisé à des fins d'inférence à la demande, utilisez l'opération d'CreateCustomModelDeploymentAPI avec le Amazon Resource Name (ARN) de votre modèle personnalisé. La réponse comprend l’ARN du déploiement. Lorsque le déploiement est actif, vous utilisez cet ARN comme modelId lorsque vous effectuez des demandes d’inférence. Pour plus d’informations sur l’utilisation du déploiement à des fins d’inférence, consultez Utiliser un déploiement pour une inférence à la demande.

Le code suivant montre comment utiliser le kit SDK for Python (Boto3) pour déployer un modèle personnalisé.

def create_custom_model_deployment(bedrock_client): """Create a custom model deployment Args: bedrock_client: A boto3 Amazon Bedrock client for making API calls Returns: str: The ARN of the new custom model deployment Raises: Exception: If there is an error creating the deployment """ try: response = bedrock_client.create_custom_model_deployment( modelDeploymentName="Unique deployment name", modelArn="Custom Model ARN", description="Deployment description", tags=[ {'key': 'Environment', 'value': 'Production'}, {'key': 'Team', 'value': 'ML-Engineering'}, {'key': 'Project', 'value': 'CustomerSupport'} ], clientRequestToken=f"deployment-{uuid.uuid4()}" ) deployment_arn = response['customModelDeploymentArn'] print(f"Deployment created: {deployment_arn}") return deployment_arn except Exception as e: print(f"Error creating deployment: {str(e)}") raise