View a markdown version of this page

資料自動化程式庫 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料自動化程式庫

AWS Bedrock Data Automation Library 可讓您增強 BDA 對內容的理解,並從資料中產生更準確的洞見。Data Automation Library 做為儲存實體的容器,並且可以與 BDA 專案建立關聯,以改善特定使用案例跨多個實體類型和模態的擷取準確性。目前,Data Automation Library 支援自訂詞彙,以增強音訊和視訊內容的擷取準確性。與此功能相關的限制位於配額和限制頁面。

主要優點

  1. 提高準確性:根據您的特定需求進行量身訂做辨識。

  2. 跨模態支援:增強音訊和視訊分析。

  3. 彈性管理:輕鬆建立、更新和關聯至專案。

  4. 可重複使用的資源:建立一次程式庫,並在多個專案中使用它們。

  5. 輕鬆整合:簡易 API 驅動的程式庫管理工作流程。

資料自動化程式庫的運作方式

您可以建立 Data Automation Library 並將其填入特定網域的實體,讓 BDA 在內容處理期間套用您的自訂知識,並提高整個使用案例的擷取準確性。您可以將程式庫與 BDA 專案建立關聯,讓透過該專案處理的所有任務能夠自動利用程式庫的實體,而不需要為每個任務進行額外的組態。

擷取完成時,會在擷取 API 請求中提供的 S3 URI 中建立具有任務 ID 名稱的資料夾。輸入資訊清單和最終擷取結果都會上傳到該資料夾中。例如,如果請求中提供的輸出儲存貯體是 ,s3://my-bucket/outputs/而 jobId 是 328c43e7-d226-41c9-9acb-e71a37022b99,則輸入資訊清單和最終擷取結果會上傳到 s3://my-bucket/outputs/328c43e7-d226-41c9-9acb-e71a37022b99

基本工作流程:

  1. 建立程式庫 — 使用 CreateDataAutomationLibrary 初始化空的程式庫容器。

  2. 將實體新增至您的程式庫 — 使用 InvokeDataAutomationLibraryIngestionJob 來新增您的網域特定實體。

  3. 將程式庫與專案建立關聯 — 在專案建立期間,使用 CreateDataAutomationProject 連結程式庫,或使用 UpdateDataAutomationProject 更新現有專案。

  4. 處理您的內容 — 透過相關聯的專案使用 InvokeDataAutomationAsync 執行任務,以在內容中套用增強的擷取準確性。

重要概念

資料自動化程式庫

儲存一或多個類型實體的容器。程式庫可以連接到多個資料自動化專案,並在不同的工作負載中重複使用。

Data Automation Library 實體類型

存放在程式庫中的內容類型。目前僅支援 VOCABULARY 實體類型。

資料自動化程式庫實體

實體類型中的特定執行個體。對於自訂詞彙,實體代表特定語言的單字和片語集合。

資料自動化程式庫擷取任務

非同步操作,可新增、更新或刪除程式庫中的實體。任務會依序處理,以維持資料一致性。

專案關聯

程式庫與 BDA 專案之間的連結。當您將程式庫與專案建立關聯時,透過該專案處理的所有任務都會套用程式庫的實體,以提高內容的擷取準確性。請注意,專案只能與一個程式庫相關聯,但一個程式庫可以與多個專案相關聯。

在 BDA 主控台中導覽至資料自動化程式庫頁面

  1. 導覽至 Amazon Bedrock 服務。

  2. 在側邊列功能表中,選取「資料自動化」。

  3. 選取「管理程式庫」

區域可用性

Data Automation Library 可在下列 AWS 區域使用:

區域名稱

區域代碼

美國東部 (維吉尼亞北部)

us-east-1

美國西部 (奧勒岡)

us-west-2

歐洲 (愛爾蘭)

eu-west-1

歐洲 (倫敦)

eu-west-2

歐洲 (法蘭克福)

eu-central-1

亞太區域 (孟買)

ap-south-1

亞太地區 (悉尼)

ap-southeast-2