Création de votre premier projet d’automatisation des données Référence complète des paramètres Création d’un plan Utilisation de votre plan Traiter les documents de manière asynchrone Vérification du statut de traitement Récupération des résultats Traitez les documents de manière synchrone Traiter les images de manière synchrone

Utilisation de la CLI Amazon Bedrock Data Automation

La fonctionnalité Amazon Bedrock Data Automation (BDA) fournit un flux de travail CLI rationalisé pour le traitement de vos données. Pour toutes les modalités, ce flux de travail comprend trois étapes principales : la création d’un projet, la création de plans pour une sortie personnalisée et le traitement de documents. Ce guide décrit les principales commandes CLI en cas d’utilisation de BDA.

Création de votre premier projet d’automatisation des données

Pour commencer à utiliser BDA, créez d’abord un projet à l’aide de la commande create-data-automation-project.

Examinez cet exemple de passeport que nous allons traiter :

Lorsque vous créez un projet, vous devez définir vos paramètres de configuration pour le type de fichier que vous souhaitez traiter. La commande suivante représente un exemple fonctionnel minimal de création d’un projet de traitement d’images :


aws bedrock-data-automation create-data-automation-project \
    --project-name "ImageProcessingProject" \
    --standard-output-configuration '{
        "image": {
            "extraction": {
                "category": {
                    "state": "ENABLED",
                    "types": ["TEXT_DETECTION"]
                },
                "boundingBox": {
                    "state": "ENABLED"
                }
            },
            "generativeField": {
                "state": "ENABLED"
            }
        }
    }'

La commande valide la configuration d’entrée et crée un projet avec un ARN unique. Une réponse inclurait l’ARN et la phase du projet :


{
    "projectArn": "Amazon Resource Name (ARN)",
    "projectStage": "DEVELOPMENT",
    "status": "IN_PROGRESS"
}

Si un projet est créé sans paramètres, les paramètres par défaut s’appliquent. Par exemple, lors du traitement d’images, le résumé des images et la détection de texte sont activés par défaut.

Référence complète des paramètres

Le tableau suivant montre l’ensemble des paramètres disponibles pour la commande create-data-automation-project :

Paramètres pour create-data-automation-project
Paramètre	Obligatoire	Par défaut	Description
`--project-name`	Oui	N/A	Nom du projet d’automatisation des données
`--project-type`	Non	Le type de projet définit l'API de traitement d'exécution avec laquelle il peut être utilisé. `ASYNC`les projets ne peuvent être utilisés qu'avec l'`invoke-bedrock-data-automation-async`API, tandis que les `SYNC` projets ne peuvent être utilisés qu'avec l'`invoke-bedrock-data-automation`API.
`--project-stage`	Non	EN SERVICE	Phase du projet (DÉVELOPPEMENT ou EN SERVICE)
`--standard-output-configuration`	Oui	N/A	Configuration JSON pour le traitement de sortie standard
`--custom-output-configuration`	Non	N/A	Configuration JSON pour un traitement de sortie personnalisé
`--encryption-configuration`	Non	N/A	Paramètres de chiffrement pour le projet
`--client-token`	Non	Généré automatiquement	Identifiant unique pour l’idempotence de la demande

Création d’un plan

Après avoir créé un projet, vous pouvez créer un plan pour définir la structure de votre traitement de données à l’aide de la commande create-blueprint.

Voici un exemple fonctionnel minimal de création d’un plan adapté au traitement de passeports :


aws bedrock-data-automation create-blueprint \
    --blueprint-name "passport-blueprint" \
    --type "IMAGE" \
    --blueprint-stage "DEVELOPMENT" \
    --schema '{
        "class": "Passport",
        "description": "Blueprint for processing passport images",
        "properties": {
            "passport_number": {
                "type": "string",
                "inferenceType": "explicit",
                "instruction": "The passport identification number"
            },
            "full_name": {
                "type": "string",
                "inferenceType": "explicit",
                "instruction": "The full name of the passport holder"
            }
        }
    }'

La commande crée un plan avec le schéma spécifié. Vous pouvez ensuite extraire des données structurées conformément au schéma que vous avez défini à l’aide de ce plan lors du traitement de documents.

Utilisation de votre plan

Ajout d’un plan à un projet

Ajoutez un plan à votre projet à l’aide de la commande update-data-automation-project :


aws bedrock-data-automation update-data-automation-project \
    --project-arn "Amazon Resource Name (ARN)" \
    --standard-output-configuration '{
        "image": {
            "extraction": {
                "category": {
                    "state": "ENABLED",
                    "types": ["TEXT_DETECTION"]
                },
                "boundingBox": {
                    "state": "ENABLED"
                }
            },
            "generativeField": {
                "state": "ENABLED",
                "types": ["IMAGE_SUMMARY"]
            }
        }
    }' \
    --custom-output-configuration '{
        "blueprints": [
            {
                "blueprintArn": "Amazon Resource Name (ARN)",
                "blueprintVersion": "1",
                "blueprintStage": "LIVE"
            }
        ]
    }'

Vérification de l’intégration du plan

Vous pouvez vérifier l’intégration du plan à l’aide de la commande get-data-automation-project :


aws bedrock-data-automation get-data-automation-project \
    --project-arn "Amazon Resource Name (ARN)"

Gestion de plusieurs plans

Affichez tous vos plans à l’aide de la commande list-blueprints :


aws bedrock-data-automation list-blueprints

Traiter les documents de manière asynchrone

Avant de traiter des documents avec BDA, vous devez d'abord les télécharger dans un compartiment S3. Une fois le projet configuré, vous pouvez traiter les documents à l'aide de la commande : invoke-data-automation-async


aws bedrock-data-automation-runtime invoke-data-automation-async \
    --input-configuration '{
        "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf"
    }' \
    --output-configuration '{
        "s3Uri": "s3://my-bda-documents/output/"
    }' \
    --data-automation-configuration '{
        "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
        "stage": "LIVE"
    }' \
    --data-automation-profile-arn "Amazon Resource Name (ARN)"

La commande renvoie un ARN d’invocation vous permettant de vérifier le statut du traitement :


{
    "invocationArn": "Amazon Resource Name (ARN)"
}

Vérification du statut de traitement

Pour vérifier le statut de votre tâche de traitement, utilisez la commande get-data-automation-status :


aws bedrock-data-automation-runtime get-data-automation-status \
    --invocation-arn "Amazon Resource Name (ARN)"

La commande renvoie le statut actuel de la tâche de traitement :


{
    "status": "COMPLETED",
    "creationTime": "2025-07-09T12:34:56.789Z",
    "lastModifiedTime": "2025-07-09T12:45:12.345Z",
    "outputLocation": "s3://my-bda-documents/output/efgh5678/"
}

Voici les valeurs de statut possibles :

IN_PROGRESS : la tâche de traitement est en cours d’exécution.
COMPLETED : la tâche de traitement s’est terminée avec succès.
FAILED : la tâche de traitement a échoué. Consultez la réponse pour obtenir des informations détaillées sur l’erreur.
STOPPED : la tâche de traitement a été arrêtée manuellement.

Récupération des résultats

Une fois le traitement terminé, vous pouvez répertorier les fichiers de sortie dans votre compartiment S3 :


aws s3 ls s3://my-bda-documents/output/efgh5678/

Pour télécharger les résultats sur votre ordinateur local :


aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

La sortie inclut des données structurées basées sur la configuration de votre projet et les plans que vous avez appliqués.

Traitez les documents de manière synchrone

Avant de traiter des documents avec BDA, vous devez d'abord les télécharger dans un compartiment S3. L'API de synchronisation prend en charge à la fois les entrées via le compartiment S3 ou les octets d'image (c'est-à-dire le traitement de documents sans S3). La commande renvoie des données structurées en fonction de la configuration de votre projet et des plans que vous avez appliqués :


aws bedrock-data-automation-runtime invoke-data-automation \
    --input-configuration '{
        "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf"
    }' \
    --data-automation-configuration '{
        "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
        "stage": "LIVE"
    }' \
    --data-automation-profile-arn "Amazon Resource Name (ARN)"

Traiter les images de manière synchrone

La commande renvoie des données structurées en fonction de la configuration de votre projet et des plans que vous avez appliqués :


aws bedrock-data-automation-runtime invoke-data-automation \
    --input-configuration '{
        "s3Uri": "s3://my-bda-documents/invoices/advertisement_latest.jpeg"
    }' \
    --data-automation-configuration '{
        "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
        "stage": "LIVE"
    }' \
    --data-automation-profile-arn "Amazon Resource Name (ARN)"

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Conditions préalables à l’utilisation de l’automatisation des données Bedrock

Opérations de plan à l’aide de la CLI