Utilisation de la CLI Amazon Bedrock Data Automation - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de la CLI Amazon Bedrock Data Automation

La fonctionnalité Amazon Bedrock Data Automation (BDA) fournit un flux de travail CLI rationalisé pour le traitement de vos données. Pour toutes les modalités, ce flux de travail comprend trois étapes principales : la création d’un projet, la création de plans pour une sortie personnalisée et le traitement de documents. Ce guide décrit les principales commandes CLI en cas d’utilisation de BDA.

Création de votre premier projet d’automatisation des données

Pour commencer à utiliser BDA, créez d’abord un projet à l’aide de la commande create-data-automation-project.

Examinez cet exemple de passeport que nous allons traiter :

Lorsque vous créez un projet, vous devez définir vos paramètres de configuration pour le type de fichier que vous souhaitez traiter. La commande suivante représente un exemple fonctionnel minimal de création d’un projet de traitement d’images :

aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'

La commande valide la configuration d’entrée et crée un projet avec un ARN unique. Une réponse inclurait l’ARN et la phase du projet :

{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }

Si un projet est créé sans paramètres, les paramètres par défaut s’appliquent. Par exemple, lors du traitement d’images, le résumé des images et la détection de texte sont activés par défaut.

Référence complète des paramètres

Le tableau suivant montre l’ensemble des paramètres disponibles pour la commande create-data-automation-project :

Paramètres pour create-data-automation-project
Paramètre Obligatoire Par défaut Description
--project-name Oui N/A Nom du projet d’automatisation des données
--project-type Non Le type de projet définit l'API de traitement d'exécution avec laquelle il peut être utilisé. ASYNCles projets ne peuvent être utilisés qu'avec l'invoke-bedrock-data-automation-asyncAPI, tandis que les SYNC projets ne peuvent être utilisés qu'avec l'invoke-bedrock-data-automationAPI.
--project-stage Non EN SERVICE Phase du projet (DÉVELOPPEMENT ou EN SERVICE)
--standard-output-configuration Oui N/A Configuration JSON pour le traitement de sortie standard
--custom-output-configuration Non N/A Configuration JSON pour un traitement de sortie personnalisé
--encryption-configuration Non N/A Paramètres de chiffrement pour le projet
--client-token Non Généré automatiquement Identifiant unique pour l’idempotence de la demande

Création d’un plan

Après avoir créé un projet, vous pouvez créer un plan pour définir la structure de votre traitement de données à l’aide de la commande create-blueprint.

Voici un exemple fonctionnel minimal de création d’un plan adapté au traitement de passeports :

aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'

La commande crée un plan avec le schéma spécifié. Vous pouvez ensuite extraire des données structurées conformément au schéma que vous avez défini à l’aide de ce plan lors du traitement de documents.

Utilisation de votre plan

Ajout d’un plan à un projet

Ajoutez un plan à votre projet à l’aide de la commande update-data-automation-project :

aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'

Vérification de l’intégration du plan

Vous pouvez vérifier l’intégration du plan à l’aide de la commande get-data-automation-project :

aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"

Gestion de plusieurs plans

Affichez tous vos plans à l’aide de la commande list-blueprints :

aws bedrock-data-automation list-blueprints

Traitement de documents

Une fois le projet configuré, vous pouvez traiter des documents à l’aide de la commande invoke-data-automation-async :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

La commande renvoie un ARN d’invocation vous permettant de vérifier le statut du traitement :

{ "invocationArn": "Amazon Resource Name (ARN)" }

Vérification du statut de traitement

Pour vérifier le statut de votre tâche de traitement, utilisez la commande get-data-automation-status :

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

La commande renvoie le statut actuel de la tâche de traitement :

{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }

Voici les valeurs de statut possibles :

  • IN_PROGRESS : la tâche de traitement est en cours d’exécution.

  • COMPLETED : la tâche de traitement s’est terminée avec succès.

  • FAILED : la tâche de traitement a échoué. Consultez la réponse pour obtenir des informations détaillées sur l’erreur.

  • STOPPED : la tâche de traitement a été arrêtée manuellement.

Récupération des résultats

Une fois le traitement terminé, vous pouvez répertorier les fichiers de sortie dans votre compartiment S3 :

aws s3 ls s3://my-bda-documents/output/efgh5678/

Pour télécharger les résultats sur votre ordinateur local :

aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

La sortie inclut des données structurées basées sur la configuration de votre projet et les plans que vous avez appliqués.

Traitez les images de manière synchrone

La commande renvoie des données structurées en fonction de la configuration de votre projet et des plans que vous avez appliqués :

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/advertisement_latest.jpeg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"