View a markdown version of this page

Verarbeitung über die CLI - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verarbeitung über die CLI

Eingeben von Dateien in einen S3-Bucket

Damit Sie Dokumente mit BDA verarbeiten können, müssen Sie sie zunächst in einen S3-Bucket hochladen:

Syntax

aws s3 cp <source> <target> [--options]

Beispiel:

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Async

Grundlegende Struktur der Verarbeitungsbefehle

Verwenden Sie den invoke-data-automation-async-Befehl, um Dateien zu verarbeiten:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Erweiterte Befehlsstruktur für die Verarbeitung

Videoverarbeitung mit Zeitsegmenten

Für Videodateien können Sie Zeitsegmente angeben, die verarbeitet werden sollen:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Verwenden von benutzerdefinierten Vorlagen

Sie können benutzerdefinierte Vorlagen direkt im Befehl angeben:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Hinzufügen einer Verschlüsselungskonfiguration

Für mehr Sicherheit können Sie eine Verschlüsselungskonfiguration hinzufügen:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Ereignis-Benachrichtigungen

EventBridge Benachrichtigungen für den Abschluss der Verarbeitung aktivieren:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Der Verarbeitungsstatus wird überprüft

Verwenden Sie den get-data-automation-status-Befehl, um den Status des Verarbeitungsauftrags zu überprüfen:

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

Die Antwort enthält den aktuellen Status:

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Verarbeitungsergebnisse abrufen

Suchen nach Ausgabedateien in S3

Auflisten der Ausgabedateien in Ihrem S3-Bucket:

aws s3 ls s3://amzn-s3-demo-bucket/output/

Laden Sie die Ergebnisse auf Ihren lokalen Computer herunter:

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Grundlagen zur Ausgabestruktur

Die Ausgabe umfasst in der Regel Folgendes:

  • standard-output.json: Enthält die Standardextraktionsergebnisse

  • custom-output.json: Enthält Ergebnisse aus benutzerdefinierten Vorlagen

  • metadata.json: Enthält Verarbeitungsmetadaten und Konfidenzwerte

Allgemeine Antwortfelder

Die Standardausgabe umfasst in der Regel Folgendes:

  • extractedData: Die wichtigsten extrahierten Informationen

  • confidence: Konfidenzwerte für jedes extrahierte Feld

  • metadata: Verarbeitungsinformationen wie Zeitstempel und Modelldetails

  • boundingBoxes: Positionsinformationen für erkannte Elemente (falls aktiviert)

Fehlerbehandlung und Problembehandlung

Häufige Fehlerszenarien und Lösungen:

  • Ungültiger S3-URI: Stellen Sie sicher, dass Ihr S3-Bucket existiert und Sie über die entsprechenden Berechtigungen verfügen.

  • Fehlt data-automation-profile-arn: Dieser Parameter ist für alle Verarbeitungsanfragen erforderlich

  • Projekt nicht gefunden: Stellen Sie sicher, dass Ihr Projekt-ARN korrekt ist und das Projekt existiert.

  • Nicht unterstütztes Dateiformat: Stellen Sie sicher, dass Ihr Dateiformat von BDA unterstützt wird.

Hinzufügen von Tags zu Verarbeitungsaufträgen

Sie können Tags hinzufügen, um Ihre Verarbeitungsaufträge zu organisieren und zu verfolgen:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Sync

Grundlegende Struktur der Verarbeitungsbefehle

Verwenden Sie den invoke-data-automation-Befehl, um Dateien zu verarbeiten:

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"

Erweiterte Befehlsstruktur für die Verarbeitung

Ausgabe in den S3-Bucket

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region" //document only

Verwenden Sie die Byte-Eingabe

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "bytes": #blob input }' \ --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"
Anmerkung

Bytes

Ein Blob von Base64-codierten Dokument-Bytes. Die maximale Größe eines Dokuments, das in einem Byte-Blob bereitgestellt wird, beträgt 50 MB. Der Typ sollte ein Base64-kodiertes binäres Datenobjekt sein.

Verwenden Sie benutzerdefinierte Blueprints (nur für Bilder)

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --blueprints '[{"blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"