主要優點資料自動化程式庫的運作方式重要概念在 BDA 主控台中導覽至資料自動化程式庫頁面區域可用性

資料自動化程式庫

AWS Bedrock Data Automation Library 可讓您增強 BDA 對內容的理解，並從資料中產生更準確的洞見。Data Automation Library 做為儲存實體的容器，並且可以與 BDA 專案建立關聯，以改善特定使用案例跨多個實體類型和模態的擷取準確性。目前，Data Automation Library 支援自訂詞彙，以增強音訊和視訊內容的擷取準確性。與此功能相關的限制位於配額和限制頁面。

主要優點

提高準確性：根據您的特定需求進行量身訂做辨識。
跨模態支援：增強音訊和視訊分析。
彈性管理：輕鬆建立、更新和關聯至專案。
可重複使用的資源：建立一次程式庫，並在多個專案中使用它們。
輕鬆整合：簡易 API 驅動的程式庫管理工作流程。

資料自動化程式庫的運作方式

您可以建立 Data Automation Library 並將其填入特定網域的實體，讓 BDA 在內容處理期間套用您的自訂知識，並提高整個使用案例的擷取準確性。您可以將程式庫與 BDA 專案建立關聯，讓透過該專案處理的所有任務能夠自動利用程式庫的實體，而不需要為每個任務進行額外的組態。

擷取完成時，會在擷取 API 請求中提供的 S3 URI 中建立具有任務 ID 名稱的資料夾。輸入資訊清單和最終擷取結果都會上傳到該資料夾中。例如，如果請求中提供的輸出儲存貯體是，s3://my-bucket/outputs/而 jobId 是 328c43e7-d226-41c9-9acb-e71a37022b99，則輸入資訊清單和最終擷取結果會上傳到 s3://my-bucket/outputs/328c43e7-d226-41c9-9acb-e71a37022b99

基本工作流程：

建立程式庫 — 使用 CreateDataAutomationLibrary 初始化空的程式庫容器。
將實體新增至您的程式庫 — 使用 InvokeDataAutomationLibraryIngestionJob 來新增您的網域特定實體。
將程式庫與專案建立關聯 — 在專案建立期間，使用 CreateDataAutomationProject 連結程式庫，或使用 UpdateDataAutomationProject 更新現有專案。
處理您的內容 — 透過相關聯的專案使用 InvokeDataAutomationAsync 執行任務，以在內容中套用增強的擷取準確性。

重要概念

資料自動化程式庫

儲存一或多個類型實體的容器。程式庫可以連接到多個資料自動化專案，並在不同的工作負載中重複使用。

Data Automation Library 實體類型

存放在程式庫中的內容類型。目前僅支援 VOCABULARY 實體類型。

資料自動化程式庫實體

實體類型中的特定執行個體。對於自訂詞彙，實體代表特定語言的單字和片語集合。

資料自動化程式庫擷取任務

非同步操作，可新增、更新或刪除程式庫中的實體。任務會依序處理，以維持資料一致性。

專案關聯

程式庫與 BDA 專案之間的連結。當您將程式庫與專案建立關聯時，透過該專案處理的所有任務都會套用程式庫的實體，以提高內容的擷取準確性。請注意，專案只能與一個程式庫相關聯，但一個程式庫可以與多個專案相關聯。

導覽至 Amazon Bedrock 服務。
在側邊列功能表中，選取「資料自動化」。
選取「管理程式庫」

區域可用性

Data Automation Library 可在下列 AWS 區域使用：

區域名稱	區域代碼
美國東部 (維吉尼亞北部)	us-east-1
美國西部 (奧勒岡)	us-west-2
歐洲 (愛爾蘭)	eu-west-1
歐洲 (倫敦)	eu-west-2
歐洲 (法蘭克福)	eu-central-1
亞太區域 (孟買)	ap-south-1
亞太地區 (悉尼)	ap-southeast-2

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

使用 Ground Truth 最佳化您的藍圖

自訂詞彙