Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Traitement au moyen de la CLI
Fichiers d’entrée dans un compartiment S3
Avant de traiter des documents avec BDA, vous devez d’abord les charger dans un compartiment S3 :
Syntaxe
aws s3 cp <source> <target> [--options]
Exemple :
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
- Async
-
Structure de commande de traitement de base
Traitez les fichiers à l’aide de la commande
invoke-data-automation-async:aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Structure de commande de traitement avancée
Traitement vidéo avec segments temporels
Pour les fichiers vidéo, vous pouvez spécifier les segments temporels à traiter :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Utilisation de plans personnalisés
Vous pouvez spécifier des plans personnalisés directement dans la commande :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Ajout d’une configuration de chiffrement
Pour renforcer la sécurité, vous pouvez ajouter une configuration de chiffrement :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Notifications d’événements
Activez EventBridge les notifications pour la fin du traitement :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Vérification de l'état du traitement
Vérifiez le statut de votre tâche de traitement à l’aide de la commande
get-data-automation-status:aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"La réponse inclut le statut actuel :
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }Récupérez les résultats du traitement
Localisation des fichiers de sortie dans S3
Répertoriez les fichiers de sortie de votre compartiment S3 :
aws s3 ls s3://amzn-s3-demo-bucket/output/Téléchargez les résultats sur votre ordinateur local :
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursivePrésentation de la structure de sortie
La sortie inclut généralement les éléments suivants :
-
standard-output.json: contient les résultats d’extraction standard -
custom-output.json: contient les résultats de plans personnalisés -
metadata.json: contient des métadonnées de traitement et des scores de confiance
Champs de réponse courants
La sortie standard inclut généralement les éléments suivants :
-
extractedData: principales informations extraites -
confidence: scores de confiance pour chaque champ extrait -
metadata: informations de traitement, y compris les horodatages et les détails du modèle -
boundingBoxes: informations de localisation pour les éléments détectés (en cas d’activation)
Gestion des erreurs et résolution des problèmes
Scénarios d’erreur courants et solutions :
-
URI S3 non valide : assurez-vous que votre compartiment S3 existe et que vous disposez des autorisations appropriées.
-
data-automation-profile-arnManquant : ce paramètre est obligatoire pour toutes les demandes de traitement
-
Projet introuvable : vérifiez que l’ARN de votre projet est correct et que le projet existe.
-
Format de fichier non pris en charge : vérifiez que votre format de fichier est pris en charge par BDA.
Ajout de balises aux tâches de traitement
Vous pouvez ajouter des balises pour vous aider à organiser et suivre vos tâches de traitement :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" -
- Sync
-
Structure de commande de traitement de base
Traitez les fichiers à l’aide de la commande
invoke-data-automation:aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"Structure de commande de traitement avancée
Sortie vers le compartiment S3
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region" //document onlyUtiliser la saisie d'octets
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "bytes": #blob input }' \ --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"Note
Octets
Blob d'octets de document codés en base64. La taille maximale d'un document fourni dans un blob d'octets est de 50 Mo. Le type doit être un objet de données binaires codé en Base64.
Utiliser des plans personnalisés (uniquement pour l'image)
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --blueprints '[{"blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"