As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Processar por meio da CLI
Inserir arquivos em um bucket do S3
Antes de processar documentos com a BDA, você deve primeiro fazer upload dos documentos em um bucket do S3:
Sintaxe
aws s3 cp <source> <target> [--options]
Exemplo:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
- Async
-
Estrutura básica de comando de processamento
Use o comando
invoke-data-automation-asyncpara processar arquivos:aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Estrutura avançada de comando de processamento
Processamento de vídeo com segmentos de tempo
Para arquivos de vídeo, você pode especificar segmentos de tempo a serem processados:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Usar esquemas personalizados
É possível especificar esquemas personalizados diretamente no comando:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Adicionar configuração de criptografia
Para aumentar a segurança, você pode adicionar a configuração de criptografia:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Notificações de eventos
Ative EventBridge as notificações para a conclusão do processamento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"Verificando o status do processamento
Use o comando
get-data-automation-statuspara verificar o status do trabalho de processamento:aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"A resposta incluirá o status atual:
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }Recupere os resultados do processamento
Localizar arquivos de saída no S3
Liste os arquivos de saída no bucket do S3:
aws s3 ls s3://amzn-s3-demo-bucket/output/Faça download dos resultados sua máquina local:
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursiveNoções básicas sobre a estrutura de saída
A saída normalmente inclui:
-
standard-output.json: contém resultados de extração padrão. -
custom-output.json: contém resultados de esquemas personalizados. -
metadata.json: contém metadados de processamento e pontuações de confiança.
Campos de resposta comuns
A saída padrão normalmente inclui:
-
extractedData: as principais informações extraídas. -
confidence: pontuações de confiança para cada campo extraído. -
metadata: processamento de informações, como carimbos de data/hora e detalhes do modelo. -
boundingBoxes: informações de localização dos elementos detectados (se habilitado).
Tratamento de erros e solução de problemas
Cenários e soluções de erro comuns:
-
URI inválido do S3: verifique se o bucket do S3 existe e se você tem as permissões adequadas.
-
Ausente data-automation-profile-arn: esse parâmetro é obrigatório para todas as solicitações de processamento
-
Projeto não encontrado: verifique se o ARN do projeto está correto e se o projeto existe.
-
Formato de arquivo não compatível: verifique se o formato do arquivo é compatível com a BDA.
Adicionar tags às tarefas de processamento
Você pode adicionar tags para ajudar a organizar e rastrear seus trabalhos de processamento:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" -
- Sync
-
Estrutura básica de comando de processamento
Use o comando
invoke-data-automationpara processar arquivos:aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"Estrutura avançada de comando de processamento
Saída para o bucket S3
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region" //document onlyUse entrada de bytes
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "bytes": #blob input }' \ --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"nota
Bytes
Um blob de bytes de documentos codificados em base64. O tamanho máximo de um documento fornecido em um blob de bytes é de 50 MB. O tipo deve ser um objeto de dados binários codificado em Base64.
Use plantas personalizadas (somente para imagem)
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --blueprints '[{"blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"