Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verarbeitung über die CLI
Verarbeiten Ihres ersten Dokuments über die CLI
Eingeben von Dateien in einen S3-Bucket
Damit Sie Dokumente mit BDA verarbeiten können, müssen Sie sie zunächst in einen S3-Bucket hochladen:
Syntax
aws s3 cp <source> <target> [--options]
Beispiel:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Grundlegende Befehlsstruktur für die Verarbeitung
Verwenden Sie den invoke-data-automation-async-Befehl, um Dateien zu verarbeiten:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Befehlsstruktur für die erweiterte Verarbeitung
Videoverarbeitung mit Zeitsegmenten
Für Videodateien können Sie Zeitsegmente angeben, die verarbeitet werden sollen:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Verwenden von benutzerdefinierten Vorlagen
Sie können benutzerdefinierte Vorlagen direkt im Befehl angeben:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Hinzufügen einer Verschlüsselungskonfiguration
Für mehr Sicherheit können Sie eine Verschlüsselungskonfiguration hinzufügen:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Ereignis-Benachrichtigungen
Aktivieren Sie EventBridge-Benachrichtigungen für den Abschluss der Verarbeitung:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Prüfen des Verarbeitungsstatus
Verwenden Sie den get-data-automation-status-Befehl, um den Status des Verarbeitungsauftrags zu überprüfen:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
Die Antwort enthält den aktuellen Status:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Abrufen der Verarbeitungsergebnisse
Suchen nach Ausgabedateien in S3
Auflisten der Ausgabedateien in Ihrem S3-Bucket:
aws s3 ls s3://amzn-s3-demo-bucket/output/
Laden Sie die Ergebnisse auf Ihren lokalen Computer herunter:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Grundlagen zur Ausgabestruktur
Die Ausgabe umfasst in der Regel Folgendes:
-
standard-output.json: Enthält die Standardextraktionsergebnisse -
custom-output.json: Enthält Ergebnisse aus benutzerdefinierten Vorlagen -
metadata.json: Enthält Verarbeitungsmetadaten und Konfidenzwerte
Allgemeine Antwortfelder
Die Standardausgabe umfasst in der Regel Folgendes:
-
extractedData: Die wichtigsten extrahierten Informationen -
confidence: Konfidenzwerte für jedes extrahierte Feld -
metadata: Verarbeitungsinformationen wie Zeitstempel und Modelldetails -
boundingBoxes: Positionsinformationen für erkannte Elemente (falls aktiviert)
Fehlerbehandlung und -behebung
Häufige Fehlerszenarien und Lösungen:
-
Ungültiger S3-URI: Stellen Sie sicher, dass Ihr S3-Bucket existiert und Sie über die entsprechenden Berechtigungen verfügen.
-
data-automation-profile-arn fehlt: Dieser Parameter ist für alle Verarbeitungsanfragen erforderlich.
-
Projekt nicht gefunden: Stellen Sie sicher, dass Ihr Projekt-ARN korrekt ist und das Projekt existiert.
-
Nicht unterstütztes Dateiformat: Stellen Sie sicher, dass Ihr Dateiformat von BDA unterstützt wird.
Hinzufügen von Tags zu Verarbeitungsaufträgen
Sie können Tags hinzufügen, um Ihre Verarbeitungsaufträge zu organisieren und zu verfolgen:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"