Déployer un modèle personnalisé - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Déployer un modèle personnalisé

Vous pouvez déployer un modèle personnalisé avec la console Amazon Bedrock AWS Command Line Interface, ou AWS SDKs. Pour plus d'informations sur l'utilisation du déploiement à des fins d'inférence, consultezUtiliser un déploiement pour une inférence à la demande.

Déployer un modèle personnalisé (console)

Vous déployez un modèle personnalisé à partir de la page Modèles personnalisés comme suit. Vous pouvez également déployer un modèle à partir de la page Modèle personnalisé à la demande avec les mêmes champs. Pour accéder à cette page, sous Infer dans le volet de navigation, sélectionnez Modèle personnalisé à la demande.

Pour déployer un modèle personnalisé
  1. Connectez-vous au AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ouvrez ensuite la console Amazon Bedrock à https://console.aws.amazon.com/bedrock/l'adresse.

  2. Dans le volet de navigation de gauche, choisissez Modèles personnalisés sous Modèles de base.

  3. Dans l'onglet Modèles, cliquez sur le bouton radio correspondant au modèle que vous souhaitez déployer.

  4. Choisissez Configurer l'inférence et choisissez Déployer à la demande.

  5. Dans Détails du déploiement, fournissez les informations suivantes :

    • Nom du déploiement (obligatoire) — Entrez un nom unique pour votre déploiement.

    • Description (facultatif) — Entrez une description de votre déploiement.

    • Balises (facultatif) : ajoutez des balises pour la répartition des coûts et la gestion des ressources.

  6. Choisissez Créer. Lorsque le statut du déploiement est atteintActive, votre modèle personnalisé est prêt pour une inférence à la demande. Pour plus d'informations sur l'utilisation du modèle personnalisé, consultezUtiliser un déploiement pour une inférence à la demande.

Déployer un modèle personnalisé (AWS Command Line Interface)

Pour déployer un modèle personnalisé à des fins d'inférence à la demande à l'aide de AWS Command Line Interface, utilisez la create-custom-model-deployment commande avec le Amazon Resource Name (ARN) de votre modèle personnalisé. Cette commande utilise l'opération CreateCustomModelDeploymentAPI. La réponse inclut l'ARN du déploiement. Lorsque le déploiement est actif, vous utilisez cet ARN modelId lorsque vous effectuez des demandes d'inférence. Pour plus d'informations sur l'utilisation du déploiement à des fins d'inférence, consultezUtiliser un déploiement pour une inférence à la demande.

aws bedrock create-custom-model-deployment \ --model-deployment-name "Unique name" \ --model-arn "Custom Model ARN" \ --description "Deployment description" \ --tags '[ { "key": "Environment", "value": "Production" }, { "key": "Team", "value": "ML-Engineering" }, { "key": "Project", "value": "CustomerSupport" } ]' \ --client-request-token "unique-deployment-token" \ --region region

Déployer un modèle personnalisé (AWS SDKs)

Pour déployer un modèle personnalisé à des fins d'inférence à la demande, utilisez l'opération d'CreateCustomModelDeploymentAPI avec le Amazon Resource Name (ARN) de votre modèle personnalisé. La réponse inclut l'ARN du déploiement. Lorsque le déploiement est actif, vous utilisez cet ARN modelId lorsque vous effectuez des demandes d'inférence. Pour plus d'informations sur l'utilisation du déploiement à des fins d'inférence, consultezUtiliser un déploiement pour une inférence à la demande.

Le code suivant montre comment utiliser le SDK pour Python (Boto3) afin de déployer un modèle personnalisé.

def create_custom_model_deployment(bedrock_client): """Create a custom model deployment Args: bedrock_client: A boto3 Amazon Bedrock client for making API calls Returns: str: The ARN of the new custom model deployment Raises: Exception: If there is an error creating the deployment """ try: response = bedrock_client.create_custom_model_deployment( modelDeploymentName="Unique deployment name", modelArn="Custom Model ARN", description="Deployment description", tags=[ {'key': 'Environment', 'value': 'Production'}, {'key': 'Team', 'value': 'ML-Engineering'}, {'key': 'Project', 'value': 'CustomerSupport'} ], clientRequestToken=f"deployment-{uuid.uuid4()}" ) deployment_arn = response['customModelDeploymentArn'] print(f"Deployment created: {deployment_arn}") return deployment_arn except Exception as e: print(f"Error creating deployment: {str(e)}") raise