Verwenden von Amazon Bedrock Data Automation CLI - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von Amazon Bedrock Data Automation CLI

Die Amazon Bedrock Datenautomatisierungsfunktion (BDA) bietet einen optimierten CLI-Workflow für die Verarbeitung Ihrer Daten. Für alle Modalitäten besteht dieser Workflow aus drei Hauptschritten: Erstellen eines Projekts, Erstellen von Vorlagen für benutzerdefinierte Ausgaben und Verarbeiten von Dokumenten. Diese Anleitung führt Sie durch die wichtigsten CLI-Befehle für das Arbeiten mit BDA.

Erstellen Ihres ersten Data-Automation-Projekts

Um mit der Arbeit mit BDA zu beginnen, erstellen Sie zunächst ein Projekt mit dem create-data-automation-project-Befehl.

Betrachten Sie diesen Beispielausweis, den wir verarbeiten werden:

Wenn Sie ein Projekt erstellen, müssen Sie Ihre Konfigurationseinstellungen für den Dateityp definieren, den Sie verarbeiten möchten. Der folgende Befehl stellt ein kurzes funktionierendes Beispiel für die Erstellung eines Bildverarbeitungsprojekts dar:

aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'

Der Befehl validiert die Eingabekonfiguration und erstellt ein neues Projekt mit einem eindeutigen ARN. Eine Antwort würde den ARN und die Phase des Projekts beinhalten:

{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }

Wenn ein Projekt ohne Parameter erstellt wird, gelten die Standardeinstellungen. Bei der Verarbeitung von Bildern sind beispielsweise die Bildzusammenfassung und die Texterkennung standardmäßig aktiviert.

Vollständige Parameterreferenz

In der folgenden Tabelle werden alle verfügbaren Parameter für den create-data-automation-project-Befehl aufgeführt:

Parameter für create-data-automation-project
Parameter Erforderlich Standard Description
--project-name Ja Name für das Data-Automation-Projekt
--project-type Nein Der Typ des Projekts definiert, mit welcher Runtime-Verarbeitungs-API es verwendet werden kann. ASYNCProjekte dürfen nur mit der invoke-bedrock-data-automation-async API verwendet werden, wohingegen SYNC Projekte nur mit der invoke-bedrock-data-automation API verwendet werden dürfen.
--project-stage Nein LIVE Phase des Projekts (DEVELOPMENT oder LIVE)
--standard-output-configuration Ja JSON-Konfiguration für die Verarbeitung mit Standardausgabe
--custom-output-configuration Nein JSON-Konfiguration für die Verarbeitung mit benutzerdefinierter Ausgabe
--encryption-configuration Nein Verschlüsselungseinstellungen für das Projekt
--client-token Nein Automatisch generiert Eindeutiger Bezeichner für die Anforderungsidempotenz

Erstellen einer Vorlage

Nachdem Sie ein Projekt erstellt haben, können Sie mithilfe des Befehls create-blueprint eine Vorlage erstellen, um die Struktur Ihrer Datenverarbeitung zu definieren.

Hier ist ein funktionierendes kleines Beispiel für die Erstellung einer Vorlage für die Verarbeitung von Ausweisen:

aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'

Der Befehl erstellt eine neue Vorlage mit dem angegebenen Schema. Sie können diese Vorlage dann bei der Verarbeitung von Dokumenten verwenden, um strukturierte Daten gemäß Ihrem definierten Schema zu extrahieren.

Verwenden der Vorlage

Hinzufügen einer Vorlage zu einem Projekt

Verwenden Sie den update-data-automation-project-Befehl, um Ihrem Projekt eine Vorlage hinzuzufügen:

aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'

Verifizierung der Integration von Vorlagen

Sie können die Integration von Vorlagen mit dem get-data-automation-project-Befehl überprüfen:

aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"

Verwalten mehrerer Vorlagen

Verwenden Sie den list-blueprints-Befehl, um alle Ihre Vorlagen anzusehen:

aws bedrock-data-automation list-blueprints

Dokumente asynchron verarbeiten

Bevor Sie Dokumente mit BDA verarbeiten können, müssen Sie Ihre Dokumente zunächst in einen S3-Bucket hochladen. Sobald Sie ein Projekt eingerichtet haben, können Sie Dokumente mit dem folgenden Befehl verarbeiten: invoke-data-automation-async

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Der Befehl gibt einen Aufruf-ARN zurück, mit dem Sie den Verarbeitungsstatus überprüfen können:

{ "invocationArn": "Amazon Resource Name (ARN)" }

Prüfen des Bearbeitungsstatus

Verwenden Sie den get-data-automation-status-Befehl, um den Status des Verarbeitungsauftrags zu überprüfen.

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

Der Befehl gibt den aktuellen Status des Verarbeitungsauftrags zurück:

{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }

Mögliche Statuswerte:

  • IN_PROGRESS: Der Verarbeitungsauftrag wird derzeit ausgeführt.

  • COMPLETED: Der Verarbeitungsauftrag wurde erfolgreich abgeschlossen.

  • FAILED: Der Verarbeitungsauftrag ist fehlgeschlagen. Überprüfen Sie die Antwort auf Fehlerdetails.

  • STOPPED: Der Verarbeitungsauftrag wurde manuell beendet.

Abrufen der Ergebnisse

Sobald die Verarbeitung abgeschlossen ist, können Sie die Ausgabedateien in Ihrem S3-Bucket auflisten:

aws s3 ls s3://my-bda-documents/output/efgh5678/

So laden Sie die Ergebnisse auf Ihren lokalen Computer herunter:

aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

Die Ausgabe umfasst strukturierte Daten, die auf Ihrer Projektkonfiguration und allen von Ihnen angewendeten Vorlagen basieren.

Dokumente synchron verarbeiten

Bevor Sie Dokumente mit BDA verarbeiten können, müssen Sie Ihre Dokumente zunächst in einen S3-Bucket hochladen. Die Sync-API unterstützt sowohl Eingaben über S3-Bucket als auch Bildbytes (d. h. die Verarbeitung von Dokumenten ohne S3). Der Befehl gibt strukturierte Daten zurück, die auf Ihrer Projektkonfiguration und allen Blueprints basieren, die Sie angewendet haben:

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Bilder synchron verarbeiten

Der Befehl gibt strukturierte Daten zurück, die auf Ihrer Projektkonfiguration und allen Blueprints basieren, die Sie angewendet haben:

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/advertisement_latest.jpeg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"