As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Usando CLI Amazon Bedrock de automação de dados
O recurso Amazon Bedrock Data Automation (BDA) fornece um fluxo de trabalho CLI simplificado para processar seus dados. Para todas as modalidades, esse fluxo de trabalho consiste em três etapas principais: criar um projeto, criar esquemas para saída personalizada e processar documentos. Este guia mostra os principais comandos da CLI para trabalhar com a BDA.
Criar seu primeiro projeto de automação de dados
Para começar a trabalhar com a BDA, primeiro crie um projeto usando o comando create-data-automation-project.
Considere este exemplo de passaporte que processaremos:
Ao criar um projeto, é necessário definir as configurações para o tipo de arquivo que você tende a processar. O seguinte comando representa um exemplo prático mínimo para criar um projeto de processamento de imagem:
aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'
O comando valida a configuração de entrada e cria um projeto com um ARN exclusivo. Uma resposta inclui o ARN do projeto e o estágio:
{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }
Se um projeto for criado sem parâmetros, serão aplicadas as configurações padrão. Por exemplo, ao processar imagens, o resumo de imagens e a detecção de texto serão habilitados por padrão.
Referência de parâmetro completa
A seguinte tabela mostra todos os parâmetros disponíveis para o comando create-data-automation-project:
| Parâmetro | Obrigatório | Padrão | Description |
|---|---|---|---|
--project-name |
Sim | N/D | Nome do projeto de automação de dados |
--project-type |
Não | O tipo do projeto define com qual API de processamento de tempo de execução ele pode ser usado. ASYNCprojetos só podem ser usados com a invoke-bedrock-data-automation-async API, enquanto SYNC projetos só podem ser usados com a invoke-bedrock-data-automation API. |
|
--project-stage |
Não | AO VIVO | Estágio do esquema (DEVELOPMENT ou LIVE) |
--standard-output-configuration |
Sim | N/D | Configuração JSON para processamento de saída padrão |
--custom-output-configuration |
Não | N/D | Configuração JSON para processamento de saída personalizada |
--encryption-configuration |
Não | N/D | Configurações de criptografia para o projeto |
--client-token |
Não | Gerado automaticamente | Identificador exclusivo de idempotência da solicitação |
Criar um esquema
Depois de criar um projeto, você pode criar um esquema para definir a estrutura do processamento de dados usando o comando create-blueprint.
Veja aqui um exemplo prático mínimo para criar um esquema personalizado para o processamento de passaportes:
aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'
O comando cria um esquema com o esquema especificado. Em seguida, você pode usar esse esquema ao processar documentos para extrair dados estruturados de acordo com o esquema definido.
Usar seu esquema
Adicionar um esquema a um projeto
Para adicionar um esquema ao seu projeto, use o comando update-data-automation-project:
aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'
Verificar a integração do esquema
É possível verificar a integração do esquema usando o comando get-data-automation-project:
aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"
Gerenciar vários esquemas
Use o comando list-blueprints para visualizar todos os seus esquemas:
aws bedrock-data-automation list-blueprints
Processar documentos
Depois de configurar um projeto, você pode processar documentos usando o comando invoke-data-automation-async:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
O comando exibe um ARN de invocação que você pode usar para verificar o status do processamento:
{ "invocationArn": "Amazon Resource Name (ARN)" }
Verificar o status do processamento
Para verificar o status do trabalho de processamento, use o comando get-data-automation-status.
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
O comando exibe o status atual de um trabalho de processamento:
{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }
Os valores de status possíveis incluem:
-
IN_PROGRESS: o trabalho de processamento está sendo executado no momento. -
COMPLETED: o trabalho de processamento foi concluído com êxito. -
FAILED: o trabalho de processamento falhou. Verifique a resposta para ver os detalhes do erro. -
STOPPED: o trabalho de processamento foi interrompido manualmente.
Recuperar resultados
Quando o processamento for concluído, será possível listar os arquivos de saída no bucket do S3:
aws s3 ls s3://my-bda-documents/output/efgh5678/
Para fazer download dos resultados sua máquina local:
aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive
A saída inclui dados estruturados com base na configuração do projeto e em todos os esquemas que você aplicou.
Processe imagens de forma síncrona
O comando retorna dados estruturados com base na configuração do seu projeto e em todos os Blueprints que você aplicou:
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/advertisement_latest.jpeg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"