本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
自訂詞彙
您可以為每個語言提供特定網域的單字和片語,這可讓 BDA 改善音訊和視訊內容的擷取準確性。您可以包含產業或網域獨有的術語,例如品牌名稱、縮寫、適當的名詞和專業術語,這可讓 BDA 從您的處理內容中準確辨識和擷取這些術語。
重要
當您使用 Bedrock Data Automation Library 時,您必須對自己的資料完整性負責。請勿在自訂詞彙中輸入機密資訊、個人資訊 (PII) 或受保護的健康資訊 (PHI)。
您可以在此處找到自訂詞彙的支援語言清單。請注意,只有您語言的字元集中列出的字元才可在自訂詞彙使用。
如何使用 ?
您可以在 BDA 專案中使用自訂詞彙,方法是建立資料自動化程式庫、新增目標語言的網域特定詞彙實體/清單,以及在專案建立期間將程式庫與專案建立關聯,或更新現有的專案,讓透過該專案執行的所有音訊和視訊處理任務都能套用您的自訂詞彙。這可改善標準輸出和自訂藍圖輸出中網域特定詞彙的擷取準確度。
使用自訂詞彙時的考量事項:
專注於經常無法辨識的網域特定術語
包含重要術語的常見變化和拼寫
依語言組織詞彙,以獲得更好的管理
優先考慮產業特定的術語和技術術語
包含網域中常用的縮寫和縮寫