本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
資料自動化程式庫
AWS Bedrock Data Automation Library 可讓您增強 BDA 對內容的理解,並從資料中產生更準確的洞見。Data Automation Library 做為儲存實體的容器,並且可以與 BDA 專案建立關聯,以改善特定使用案例跨多個實體類型和模態的擷取準確性。目前,Data Automation Library 支援自訂詞彙,以增強音訊和視訊內容的擷取準確性。與此功能相關的限制位於配額和限制頁面。
主要優點
提高準確性:根據您的特定需求進行量身訂做辨識。
跨模態支援:增強音訊和視訊分析。
彈性管理:輕鬆建立、更新和關聯至專案。
可重複使用的資源:建立一次程式庫,並在多個專案中使用它們。
輕鬆整合:簡易 API 驅動的程式庫管理工作流程。
資料自動化程式庫的運作方式
您可以建立 Data Automation Library 並將其填入特定網域的實體,讓 BDA 在內容處理期間套用您的自訂知識,並提高整個使用案例的擷取準確性。您可以將程式庫與 BDA 專案建立關聯,讓透過該專案處理的所有任務能夠自動利用程式庫的實體,而不需要為每個任務進行額外的組態。
擷取完成時,會在擷取 API 請求中提供的 S3 URI 中建立具有任務 ID 名稱的資料夾。輸入資訊清單和最終擷取結果都會上傳到該資料夾中。例如,如果請求中提供的輸出儲存貯體是 ,s3://my-bucket/outputs/而 jobId 是 328c43e7-d226-41c9-9acb-e71a37022b99,則輸入資訊清單和最終擷取結果會上傳到 s3://my-bucket/outputs/328c43e7-d226-41c9-9acb-e71a37022b99
基本工作流程:
建立程式庫 — 使用 CreateDataAutomationLibrary 初始化空的程式庫容器。
將實體新增至您的程式庫 — 使用 InvokeDataAutomationLibraryIngestionJob 來新增您的網域特定實體。
將程式庫與專案建立關聯 — 在專案建立期間,使用 CreateDataAutomationProject 連結程式庫,或使用 UpdateDataAutomationProject 更新現有專案。
處理您的內容 — 透過相關聯的專案使用 InvokeDataAutomationAsync 執行任務,以在內容中套用增強的擷取準確性。
重要概念
資料自動化程式庫
儲存一或多個類型實體的容器。程式庫可以連接到多個資料自動化專案,並在不同的工作負載中重複使用。
Data Automation Library 實體類型
存放在程式庫中的內容類型。目前僅支援 VOCABULARY 實體類型。
資料自動化程式庫實體
實體類型中的特定執行個體。對於自訂詞彙,實體代表特定語言的單字和片語集合。
資料自動化程式庫擷取任務
非同步操作,可新增、更新或刪除程式庫中的實體。任務會依序處理,以維持資料一致性。
專案關聯
程式庫與 BDA 專案之間的連結。當您將程式庫與專案建立關聯時,透過該專案處理的所有任務都會套用程式庫的實體,以提高內容的擷取準確性。請注意,專案只能與一個程式庫相關聯,但一個程式庫可以與多個專案相關聯。
在 BDA 主控台中導覽至資料自動化程式庫頁面
導覽至 Amazon Bedrock 服務。
在側邊列功能表中,選取「資料自動化」。
選取「管理程式庫」
區域可用性
Data Automation Library 可在下列 AWS 區域使用:
區域名稱 |
區域代碼 |
|---|---|
美國東部 (維吉尼亞北部) |
us-east-1 |
美國西部 (奧勒岡) |
us-west-2 |
歐洲 (愛爾蘭) |
eu-west-1 |
歐洲 (倫敦) |
eu-west-2 |
歐洲 (法蘭克福) |
eu-central-1 |
亞太區域 (孟買) |
ap-south-1 |
亞太地區 (悉尼) |
ap-southeast-2 |