Verarbeitung über die CLI - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verarbeitung über die CLI

Verarbeiten Ihres ersten Dokuments über die CLI

Eingeben von Dateien in einen S3-Bucket

Damit Sie Dokumente mit BDA verarbeiten können, müssen Sie sie zunächst in einen S3-Bucket hochladen:

Syntax

aws s3 cp <source> <target> [--options]

Beispiel:

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

Grundlegende Befehlsstruktur für die Verarbeitung

Verwenden Sie den invoke-data-automation-async-Befehl, um Dateien zu verarbeiten:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Befehlsstruktur für die erweiterte Verarbeitung

Videoverarbeitung mit Zeitsegmenten

Für Videodateien können Sie Zeitsegmente angeben, die verarbeitet werden sollen:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Verwenden von benutzerdefinierten Vorlagen

Sie können benutzerdefinierte Vorlagen direkt im Befehl angeben:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Hinzufügen einer Verschlüsselungskonfiguration

Für mehr Sicherheit können Sie eine Verschlüsselungskonfiguration hinzufügen:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Ereignis-Benachrichtigungen

Aktivieren Sie EventBridge-Benachrichtigungen für den Abschluss der Verarbeitung:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Prüfen des Verarbeitungsstatus

Verwenden Sie den get-data-automation-status-Befehl, um den Status des Verarbeitungsauftrags zu überprüfen:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

Die Antwort enthält den aktuellen Status:

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Abrufen der Verarbeitungsergebnisse

Suchen nach Ausgabedateien in S3

Auflisten der Ausgabedateien in Ihrem S3-Bucket:

aws s3 ls s3://amzn-s3-demo-bucket/output/

Laden Sie die Ergebnisse auf Ihren lokalen Computer herunter:

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Grundlagen zur Ausgabestruktur

Die Ausgabe umfasst in der Regel Folgendes:

  • standard-output.json: Enthält die Standardextraktionsergebnisse

  • custom-output.json: Enthält Ergebnisse aus benutzerdefinierten Vorlagen

  • metadata.json: Enthält Verarbeitungsmetadaten und Konfidenzwerte

Allgemeine Antwortfelder

Die Standardausgabe umfasst in der Regel Folgendes:

  • extractedData: Die wichtigsten extrahierten Informationen

  • confidence: Konfidenzwerte für jedes extrahierte Feld

  • metadata: Verarbeitungsinformationen wie Zeitstempel und Modelldetails

  • boundingBoxes: Positionsinformationen für erkannte Elemente (falls aktiviert)

Fehlerbehandlung und -behebung

Häufige Fehlerszenarien und Lösungen:

  • Ungültiger S3-URI: Stellen Sie sicher, dass Ihr S3-Bucket existiert und Sie über die entsprechenden Berechtigungen verfügen.

  • data-automation-profile-arn fehlt: Dieser Parameter ist für alle Verarbeitungsanfragen erforderlich.

  • Projekt nicht gefunden: Stellen Sie sicher, dass Ihr Projekt-ARN korrekt ist und das Projekt existiert.

  • Nicht unterstütztes Dateiformat: Stellen Sie sicher, dass Ihr Dateiformat von BDA unterstützt wird.

Hinzufügen von Tags zu Verarbeitungsaufträgen

Sie können Tags hinzufügen, um Ihre Verarbeitungsaufträge zu organisieren und zu verfolgen:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"