本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用Amazon Bedrock資料自動化 CLI
Amazon Bedrock資料自動化 (BDA) 功能提供簡化的 CLI 工作流程來處理您的資料。對於所有模態,此工作流程包含三個主要步驟:建立專案、建立自訂輸出的藍圖,以及處理文件。本指南會逐步引導您使用 BDA 的金鑰 CLI 命令。
建立您的第一個 Data Automation 專案
若要開始使用 BDA,請先使用 create-data-automation-project 命令建立專案。
請參考我們將要處理的此護照範例:
建立專案時,您必須為要處理的檔案類型定義組態設定。下列命令代表建立影像處理專案的最小工作範例:
aws bedrock-data-automation create-data-automation-project \ --project-name "ImageProcessingProject" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED" } } }'
命令會驗證輸入組態,並使用唯一的 ARN 建立新的專案。回應將包含專案 ARN 和階段:
{ "projectArn": "Amazon Resource Name (ARN)", "projectStage": "DEVELOPMENT", "status": "IN_PROGRESS" }
如果專案建立時未使用參數,則將套用預設設定。例如,處理影像時,預設會啟用影像摘要和文字偵測。
完成參數參考
下表顯示 create-data-automation-project 命令的所有可用參數:
| 參數 | 必要 | 預設 | Description |
|---|---|---|---|
--project-name |
是 | N/A | Data Automation 專案的名稱 |
--project-type |
否 | 專案的類型會定義可與哪些執行時間處理 API 搭配使用。 ASYNC專案只能與 invoke-bedrock-data-automation-async API 搭配使用,而SYNC專案只能與 invoke-bedrock-data-automation API 搭配使用。 |
|
--project-stage |
否 | LIVE | 專案的階段 (DEVELOPMENT 或 LIVE) |
--standard-output-configuration |
是 | N/A | 標準輸出處理的 JSON 組態 |
--custom-output-configuration |
否 | N/A | 自訂輸出處理的 JSON 組態 |
--encryption-configuration |
否 | N/A | 專案的加密設定 |
--client-token |
否 | 自動產生 | 請求冪等性的唯一識別符 |
建立藍圖
建立專案之後,您可以使用 create-blueprint 命令建立藍圖來定義資料處理的結構。
以下是建立專為處理護照量身打造的藍圖的最小工作範例:
aws bedrock-data-automation create-blueprint \ --blueprint-name "passport-blueprint" \ --type "IMAGE" \ --blueprint-stage "DEVELOPMENT" \ --schema '{ "class": "Passport", "description": "Blueprint for processing passport images", "properties": { "passport_number": { "type": "string", "inferenceType": "explicit", "instruction": "The passport identification number" }, "full_name": { "type": "string", "inferenceType": "explicit", "instruction": "The full name of the passport holder" } } }'
命令會使用指定的結構描述來建立新的藍圖。然後,您可以在處理文件時使用此藍圖,根據您定義的結構描述擷取結構化資料。
使用您的藍圖
將藍圖新增至專案
若要將藍圖新增至您的專案,請使用 update-data-automation-project 命令:
aws bedrock-data-automation update-data-automation-project \ --project-arn "Amazon Resource Name (ARN)" \ --standard-output-configuration '{ "image": { "extraction": { "category": { "state": "ENABLED", "types": ["TEXT_DETECTION"] }, "boundingBox": { "state": "ENABLED" } }, "generativeField": { "state": "ENABLED", "types": ["IMAGE_SUMMARY"] } } }' \ --custom-output-configuration '{ "blueprints": [ { "blueprintArn": "Amazon Resource Name (ARN)", "blueprintVersion": "1", "blueprintStage": "LIVE" } ] }'
驗證藍圖整合
您可以使用 get-data-automation-project 命令來驗證藍圖整合:
aws bedrock-data-automation get-data-automation-project \ --project-arn "Amazon Resource Name (ARN)"
管理多個藍圖
使用 list-blueprints 命令來檢視您的所有藍圖:
aws bedrock-data-automation list-blueprints
處理文件
設定專案後,您可以使用 invoke-data-automation-async 命令處理文件:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/invoice-123.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bda-documents/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
命令會傳回調用 ARN,您可以用來檢查處理狀態:
{ "invocationArn": "Amazon Resource Name (ARN)" }
檢查處理狀態
若要檢查處理任務的狀態,請使用 get-data-automation-status 命令:
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
命令會傳回處理任務的目前狀態:
{ "status": "COMPLETED", "creationTime": "2025-07-09T12:34:56.789Z", "lastModifiedTime": "2025-07-09T12:45:12.345Z", "outputLocation": "s3://my-bda-documents/output/efgh5678/" }
可能的狀態值包括:
-
IN_PROGRESS:處理任務目前正在執行中。 -
COMPLETED:處理任務已成功完成。 -
FAILED:處理任務失敗。檢查回應以取得錯誤詳細資訊。 -
STOPPED:處理任務已手動停止。
擷取結果
處理完成後,您可以列出 S3 儲存貯體中的輸出檔案:
aws s3 ls s3://my-bda-documents/output/efgh5678/
下載結果到您的本機電腦:
aws s3 cp s3://my-bda-documents/output/efgh5678/ ~/Downloads/bda-results/ --recursive
輸出包含根據您的專案組態的結構化資料,以及您套用的任何藍圖。
同步處理映像
命令會根據您的專案組態和您已套用的任何藍圖傳回結構化資料:
aws bedrock-data-automation-runtime invoke-data-automation \ --input-configuration '{ "s3Uri": "s3://my-bda-documents/invoices/advertisement_latest.jpeg" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"