기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
CLI를 통한 처리
S3 버킷에 파일 입력
BDA로 문서를 처리하기 전에 먼저 S3 버킷에 문서를 업로드해야 합니다.
구문
aws s3 cp <source> <target> [--options]
예제:
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
- Async
-
기본 처리 명령 구조
invoke-data-automation-async명령을 사용하여 파일을 처리합니다.aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"고급 처리 명령 구조
시간 세그먼트를 사용한 비디오 처리
비디오 파일의 경우 처리할 시간 세그먼트를 지정할 수 있습니다.
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"사용자 지정 블루프린트 사용
명령에서 직접 사용자 지정 블루프린트를 지정할 수 있습니다.
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"암호화 구성 추가
보안 강화를 위해 암호화 구성을 추가할 수 있습니다.
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"이벤트 알림
처리 완료를 위해 EventBridge 알림 활성화:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"처리 상태 확인
처리 작업의 상태를 확인하려면
get-data-automation-status명령을 사용합니다.aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"응답에는 현재 상태가 포함됩니다.
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }처리 결과 검색
S3에서 출력 파일 찾기
S3 버킷의 출력 파일 나열:
aws s3 ls s3://amzn-s3-demo-bucket/output/결과를 로컬 시스템에 다운로드하려면 다음을 수행합니다.
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive출력 구조 이해
출력에는 일반적으로 다음이 포함됩니다.
-
standard-output.json: 표준 추출 결과 포함 -
custom-output.json: 사용자 지정 블루프린트의 결과 포함 -
metadata.json: 처리 메타데이터 및 신뢰도 점수 포함
공통 응답 필드
표준 출력에는 일반적으로 다음이 포함됩니다.
-
extractedData: 추출된 주요 정보 -
confidence: 추출된 각 필드의 신뢰도 점수 -
metadata: 타임스탬프 및 모델 세부 정보를 포함한 처리 정보 -
boundingBoxes: 감지된 요소의 위치 정보(활성화된 경우)
오류 처리 및 문제 해결
일반적인 오류 시나리오 및 해결 방법:
-
잘못된 S3 URI: S3 버킷이 존재하고 적절한 권한이 있는지 확인합니다.
-
data-automation-profile-arn 누락:이 파라미터는 모든 처리 요청에 필요합니다.
-
프로젝트를 찾을 수 없음: 프로젝트 ARN이 올바르고 프로젝트가 존재하는지 확인합니다.
-
지원되지 않는 파일 형식: 파일 형식이 BDA에서 지원되는지 확인합니다.
처리 작업에 태그 추가
태그를 추가하여 처리 작업을 구성하고 추적할 수 있습니다.
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" -
- Sync
-
기본 처리 명령 구조
invoke-data-automation명령을 사용하여 파일을 처리합니다.aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"고급 처리 명령 구조
S3 버킷으로 출력
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region" //document only바이트 입력 사용
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "bytes": #blob input }' \ --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"참고
바이트
base64로 인코딩된 문서 바이트의 BLOB입니다. 바이트 BLOB에 제공되는 문서의 최대 크기는 50MB입니다. 유형은 Base64-encoded 바이너리 데이터 객체여야 합니다.
사용자 지정 블루프린트 사용(이미지에만 해당)
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --blueprints '[{"blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)" --region "aws-region"