Criar seu primeiro projeto de automação de dados Referência de parâmetro completa Criar um esquema Usar seu esquema Processar documentos de forma assíncrona Verificar o status do processamento Recuperar resultados Processar documentos de forma síncrona Processar imagens de forma síncrona

Usando a CLI Amazon Bedrock de automação de dados

O recurso Amazon Bedrock Data Automation (BDA) fornece um fluxo de trabalho CLI simplificado para processar seus dados. Para todas as modalidades, esse fluxo de trabalho consiste em três etapas principais: criar um projeto, criar esquemas para saída personalizada e processar documentos. Este guia mostra os principais comandos da CLI para trabalhar com a BDA.

Criar seu primeiro projeto de automação de dados

Para começar a trabalhar com a BDA, primeiro crie um projeto usando o comando create-data-automation-project.

Considere este exemplo de passaporte que processaremos:

Ao criar um projeto, é necessário definir as configurações para o tipo de arquivo que você tende a processar. O seguinte comando representa um exemplo prático mínimo para criar um projeto de processamento de imagem:


aws bedrock-data-automation create-data-automation-project \
    --project-name "ImageProcessingProject" \
    --standard-output-configuration '{
        "image": {
            "extraction": {
                "category": {
                    "state": "ENABLED",
                    "types": ["TEXT_DETECTION"]
                },
                "boundingBox": {
                    "state": "ENABLED"
                }
            },
            "generativeField": {
                "state": "ENABLED"
            }
        }
    }'

O comando valida a configuração de entrada e cria um projeto com um ARN exclusivo. Uma resposta inclui o ARN do projeto e o estágio:


{
    "projectArn": "Amazon Resource Name (ARN)",
    "projectStage": "DEVELOPMENT",
    "status": "IN_PROGRESS"
}

Se um projeto for criado sem parâmetros, serão aplicadas as configurações padrão. Por exemplo, ao processar imagens, o resumo de imagens e a detecção de texto serão habilitados por padrão.

Referência de parâmetro completa

A seguinte tabela mostra todos os parâmetros disponíveis para o comando create-data-automation-project:

Parâmetros para create-data-automation-project
Parâmetro	Obrigatório	Padrão	Description
`--project-name`	Sim	N/D	Nome do projeto de automação de dados
`--project-type`	Não	O tipo do projeto define com qual API de processamento de tempo de execução ele pode ser usado. `ASYNC`projetos só podem ser usados com a `invoke-bedrock-data-automation-async` API, enquanto `SYNC` projetos só podem ser usados com a `invoke-bedrock-data-automation` API.
`--project-stage`	Não	AO VIVO	Estágio do esquema (DEVELOPMENT ou LIVE)
`--standard-output-configuration`	Sim	N/D	Configuração JSON para processamento de saída padrão
`--custom-output-configuration`	Não	N/D	Configuração JSON para processamento de saída personalizada
`--encryption-configuration`	Não	N/D	Configurações de criptografia para o projeto
`--client-token`	Não	Gerado automaticamente	Identificador exclusivo de idempotência da solicitação

Criar um esquema

Depois de criar um projeto, você pode criar um esquema para definir a estrutura do processamento de dados usando o comando create-blueprint.

Veja aqui um exemplo prático mínimo para criar um esquema personalizado para o processamento de passaportes:


aws bedrock-data-automation create-blueprint \
    --blueprint-name "passport-blueprint" \
    --type "IMAGE" \
    --blueprint-stage "DEVELOPMENT" \
    --schema '{
        "class": "Passport",
        "description": "Blueprint for processing passport images",
        "properties": {
            "passport_number": {
                "type": "string",
                "inferenceType": "explicit",
                "instruction": "The passport identification number"
            },
            "full_name": {
                "type": "string",
                "inferenceType": "explicit",
                "instruction": "The full name of the passport holder"
            }
        }
    }'

O comando cria um esquema com o esquema especificado. Em seguida, você pode usar esse esquema ao processar documentos para extrair dados estruturados de acordo com o esquema definido.

Usar seu esquema

Adicionar um esquema a um projeto

Para adicionar um esquema ao seu projeto, use o comando update-data-automation-project:


aws bedrock-data-automation update-data-automation-project \
    --project-arn "Amazon Resource Name (ARN)" \
    --standard-output-configuration '{
        "image": {
            "extraction": {
                "category": {
                    "state": "ENABLED",
                    "types": ["TEXT_DETECTION"]
                },
                "boundingBox": {
                    "state": "ENABLED"
                }
            },
            "generativeField": {
                "state": "ENABLED",
                "types": ["IMAGE_SUMMARY"]
            }
        }
    }' \
    --custom-output-configuration '{
        "blueprints": [
            {
                "blueprintArn": "Amazon Resource Name (ARN)",
                "blueprintVersion": "1",
                "blueprintStage": "LIVE"
            }
        ]
    }'

Verificar a integração do esquema

É possível verificar a integração do esquema usando o comando get-data-automation-project:


aws bedrock-data-automation get-data-automation-project \
    --project-arn "Amazon Resource Name (ARN)"

Gerenciar vários esquemas

Use o comando list-blueprints para visualizar todos os seus esquemas:


aws bedrock-data-automation list-blueprints

Processar documentos de forma assíncrona

Antes de processar documentos com o BDA, você deve primeiro carregar seus documentos em um bucket do S3. Depois de configurar um projeto, você pode processar documentos usando o comando: invoke-data-automation-async


aws bedrock-data-automation-runtime invoke-data-automation-async \
    --input-configuration '{
        "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf"
    }' \
    --output-configuration '{
        "s3Uri": "s3://my-bda-documents/output/"
    }' \
    --data-automation-configuration '{
        "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
        "stage": "LIVE"
    }' \
    --data-automation-profile-arn "Amazon Resource Name (ARN)"

O comando exibe um ARN de invocação que você pode usar para verificar o status do processamento:


{
    "invocationArn": "Amazon Resource Name (ARN)"
}

Verificar o status do processamento

Para verificar o status do trabalho de processamento, use o comando get-data-automation-status.


aws bedrock-data-automation-runtime get-data-automation-status \
    --invocation-arn "Amazon Resource Name (ARN)"

O comando exibe o status atual de um trabalho de processamento:


{
    "status": "COMPLETED",
    "creationTime": "2025-07-09T12:34:56.789Z",
    "lastModifiedTime": "2025-07-09T12:45:12.345Z",
    "outputLocation": "s3://my-bda-documents/output/efgh5678/"
}

Os valores de status possíveis incluem:

IN_PROGRESS: o trabalho de processamento está sendo executado no momento.
COMPLETED: o trabalho de processamento foi concluído com êxito.
FAILED: o trabalho de processamento falhou. Verifique a resposta para ver os detalhes do erro.
STOPPED: o trabalho de processamento foi interrompido manualmente.

Recuperar resultados

Quando o processamento for concluído, será possível listar os arquivos de saída no bucket do S3:


aws s3 ls s3://my-bda-documents/output/efgh5678/

Para fazer download dos resultados sua máquina local:


aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive

A saída inclui dados estruturados com base na configuração do projeto e em todos os esquemas que você aplicou.

Processar documentos de forma síncrona

Antes de processar documentos com o BDA, você deve primeiro carregar seus documentos em um bucket do S3. A API de sincronização interrompe a entrada via bucket do S3 ou bytes de imagem (ou seja, o processamento de documentos sem o S3). O comando retorna dados estruturados com base na configuração do seu projeto e em todos os Blueprints que você aplicou:


aws bedrock-data-automation-runtime invoke-data-automation \
    --input-configuration '{
        "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf"
    }' \
    --data-automation-configuration '{
        "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
        "stage": "LIVE"
    }' \
    --data-automation-profile-arn "Amazon Resource Name (ARN)"

Processar imagens de forma síncrona

O comando retorna dados estruturados com base na configuração do seu projeto e em todos os Blueprints que você aplicou:


aws bedrock-data-automation-runtime invoke-data-automation \
    --input-configuration '{
        "s3Uri": "s3://my-bda-documents/invoices/advertisement_latest.jpeg"
    }' \
    --data-automation-configuration '{
        "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
        "stage": "LIVE"
    }' \
    --data-automation-profile-arn "Amazon Resource Name (ARN)"

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Pré-requisitos para usar a Automação de Dados do Bedrock

CLI de operações do esquema