Utilizzo della CLI di automazione Amazon Bedrock dei dati - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo della CLI di automazione Amazon Bedrock dei dati

La funzionalità Amazon Bedrock Data Automation (BDA) fornisce un flusso di lavoro CLI semplificato per l'elaborazione dei dati. Per tutte le modalità, questo flusso di lavoro consiste in tre fasi principali: creazione di un progetto, creazione di blueprint per output personalizzati ed elaborazione dei documenti. In questa guida vengono illustrati i comandi della CLI chiave per l’utilizzo con BDA.

Creazione del primo progetto Data Automation

Per iniziare a lavorare con BDA, crea prima un progetto utilizzando il comando create-data-automation-project.

Considera questo passaporto di esempio che elaboreremo:

Quando si crea un progetto, è necessario definire le impostazioni di configurazione per il tipo di file che si intende elaborare. Il comando seguente rappresenta un esempio minimo funzionante per la creazione di un progetto di elaborazione delle immagini:

aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'

Il comando convalida la configurazione di input e crea un nuovo progetto con un ARN univoco. Una risposta deve includere l’ARN e la fase del progetto:

{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }

Se un progetto viene creato senza parametri, vengono applicate le impostazioni predefinite. Ad esempio, durante l’elaborazione delle immagini, la sintesi delle immagini e il rilevamento del testo saranno abilitati per impostazione predefinita.

Riferimento completo ai parametri

La tabella seguente mostra tutti i parametri disponibili per il comando create-data-automation-project:

Parametri per create-data-automation-project
Parametro Obbligatorio Predefinita Description
--project-name N/D Nome del progetto Data Automation
--project-type No Il tipo di progetto definisce con quale API di elaborazione in fase di esecuzione può essere utilizzato. ASYNCi progetti possono essere utilizzati solo con l'invoke-bedrock-data-automation-asyncAPI, mentre SYNC i progetti possono essere utilizzati solo con l'invoke-bedrock-data-automationAPI.
--project-stage No LIVE Fase del progetto (DEVELOPMENT o LIVE)
--standard-output-configuration N/D Configurazione JSON per l’elaborazione dell’output standard
--custom-output-configuration No N/D Configurazione JSON per l’elaborazione personalizzata dell’output
--encryption-configuration No N/D Impostazioni di crittografia per il progetto
--client-token No Generato automaticamente Identificatore univoco per l’idempotenza della richiesta

Creazione di blueprint

Dopo aver creato un progetto, puoi creare un blueprint per definire la struttura dell’elaborazione dei dati utilizzando il comando create-blueprint.

Ecco un esempio minimo funzionante per creare un blueprint su misura per l’elaborazione del passaporto:

aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'

Il comando crea un nuovo blueprint con lo schema specificato. Puoi quindi utilizzare questo blueprint durante l’elaborazione dei documenti per estrarre dati strutturati in base allo schema definito.

Utilizzo di un blueprint

Aggiunta di un blueprint a un progetto

Per aggiungere un blueprint al progetto, utilizza il comando update-data-automation-project:

aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'

Verifica dell’integrazione del blueprint

Puoi verificare l’integrazione di blueprint utilizzando il comando get-data-automation-project.

aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"

Gestione di più blueprint

Utilizza il comando list-blueprints per visualizzare tutti i blueprint:

aws bedrock-data-automation list-blueprints

Elabora i documenti in modo asincrono

Prima di elaborare i documenti con BDA, devi prima caricare i documenti in un bucket S3. Una volta impostato un progetto, puoi elaborare i documenti utilizzando il comando: invoke-data-automation-async

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Il comando restituisce un ARN di invocazione che puoi usare per controllare lo stato di elaborazione:

{ "invocationArn": "Amazon Resource Name (ARN)" }

Verifica dello stato di elaborazione

Per verificare lo stato della creazione del progetto, utilizza il comando get-data-automation-status.

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

Il comando restituisce lo stato corrente del processo di elaborazione:

{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }

I valori di stato possibili includono:

  • IN_PROGRESS: il processo di elaborazione è attualmente in esecuzione.

  • COMPLETED: il processo di elaborazione è stato correttamente completato.

  • FAILED: il processo di elaborazione non è andato a buon fine. Controlla la risposta per i dettagli dell’errore.

  • STOPPED: il processo di elaborazione è stato interrotto manualmente.

Recupero dei risultati

Una volta completata l’elaborazione, puoi elencare i file di output nel bucket S3:

aws s3 ls s3://my-bda-documents/output/efgh5678/

Come scaricare i risultati nella macchina locale:

aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

L’output include dati strutturati basati sulla configurazione del progetto e su eventuali blueprint applicati.

Elabora documenti in modo sincrono

Prima di elaborare i documenti con BDA, devi prima caricare i documenti in un bucket S3. L'API di sincronizzazione supporta sia l'input tramite bucket S3 che i byte di immagine (ad esempio l'elaborazione di documenti senza S3). Il comando restituisce dati strutturati in base alla configurazione del progetto e a qualsiasi Blueprint applicato:

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Elabora immagini in modo sincrono

Il comando restituisce dati strutturati in base alla configurazione del progetto e a qualsiasi progetto applicato:

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/advertisement_latest.jpeg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"