Usando CLI Amazon Bedrock de automação de dados - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usando CLI Amazon Bedrock de automação de dados

O recurso Amazon Bedrock Data Automation (BDA) fornece um fluxo de trabalho CLI simplificado para processar seus dados. Para todas as modalidades, esse fluxo de trabalho consiste em três etapas principais: criar um projeto, criar esquemas para saída personalizada e processar documentos. Este guia mostra os principais comandos da CLI para trabalhar com a BDA.

Criar seu primeiro projeto de automação de dados

Para começar a trabalhar com a BDA, primeiro crie um projeto usando o comando create-data-automation-project.

Considere este exemplo de passaporte que processaremos:

Ao criar um projeto, é necessário definir as configurações para o tipo de arquivo que você tende a processar. O seguinte comando representa um exemplo prático mínimo para criar um projeto de processamento de imagem:

aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'

O comando valida a configuração de entrada e cria um projeto com um ARN exclusivo. Uma resposta inclui o ARN do projeto e o estágio:

{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }

Se um projeto for criado sem parâmetros, serão aplicadas as configurações padrão. Por exemplo, ao processar imagens, o resumo de imagens e a detecção de texto serão habilitados por padrão.

Referência de parâmetro completa

A seguinte tabela mostra todos os parâmetros disponíveis para o comando create-data-automation-project:

Parâmetros para create-data-automation-project
Parâmetro Obrigatório Padrão Description
--project-name Sim N/D Nome do projeto de automação de dados
--project-type Não O tipo do projeto define com qual API de processamento de tempo de execução ele pode ser usado. ASYNCprojetos só podem ser usados com a invoke-bedrock-data-automation-async API, enquanto SYNC projetos só podem ser usados com a invoke-bedrock-data-automation API.
--project-stage Não AO VIVO Estágio do esquema (DEVELOPMENT ou LIVE)
--standard-output-configuration Sim N/D Configuração JSON para processamento de saída padrão
--custom-output-configuration Não N/D Configuração JSON para processamento de saída personalizada
--encryption-configuration Não N/D Configurações de criptografia para o projeto
--client-token Não Gerado automaticamente Identificador exclusivo de idempotência da solicitação

Criar um esquema

Depois de criar um projeto, você pode criar um esquema para definir a estrutura do processamento de dados usando o comando create-blueprint.

Veja aqui um exemplo prático mínimo para criar um esquema personalizado para o processamento de passaportes:

aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'

O comando cria um esquema com o esquema especificado. Em seguida, você pode usar esse esquema ao processar documentos para extrair dados estruturados de acordo com o esquema definido.

Usar seu esquema

Adicionar um esquema a um projeto

Para adicionar um esquema ao seu projeto, use o comando update-data-automation-project:

aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'

Verificar a integração do esquema

É possível verificar a integração do esquema usando o comando get-data-automation-project:

aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"

Gerenciar vários esquemas

Use o comando list-blueprints para visualizar todos os seus esquemas:

aws bedrock-data-automation list-blueprints

Processar documentos

Depois de configurar um projeto, você pode processar documentos usando o comando invoke-data-automation-async:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

O comando exibe um ARN de invocação que você pode usar para verificar o status do processamento:

{ "invocationArn": "Amazon Resource Name (ARN)" }

Verificar o status do processamento

Para verificar o status do trabalho de processamento, use o comando get-data-automation-status.

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

O comando exibe o status atual de um trabalho de processamento:

{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }

Os valores de status possíveis incluem:

  • IN_PROGRESS: o trabalho de processamento está sendo executado no momento.

  • COMPLETED: o trabalho de processamento foi concluído com êxito.

  • FAILED: o trabalho de processamento falhou. Verifique a resposta para ver os detalhes do erro.

  • STOPPED: o trabalho de processamento foi interrompido manualmente.

Recuperar resultados

Quando o processamento for concluído, será possível listar os arquivos de saída no bucket do S3:

aws s3 ls s3://my-bda-documents/output/efgh5678/

Para fazer download dos resultados sua máquina local:

aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

A saída inclui dados estruturados com base na configuração do projeto e em todos os esquemas que você aplicou.

Processe imagens de forma síncrona

O comando retorna dados estruturados com base na configuração do seu projeto e em todos os Blueprints que você aplicou:

aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/advertisement_latest.jpeg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"