View a markdown version of this page

自定义词汇表 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

自定义词汇表

您可以为每种语言提供特定领域的单词和短语,这使得 BDA 能够提高音频和视频内容的提取准确性。您可以包含您所在行业或领域所特有的术语,例如品牌名称、首字母缩略词、专有名词和专业术语,这使得 BDA 能够从您处理的内容中准确识别和提取这些术语。

重要

在使用 Bedrock 数据自动化库时,您应对自己数据的完整性负责。请勿在自定义词汇表中输入机密信息、个人信息 (PII) 或受保护的健康信息 (PHI)。

您可以在此处找到自定义词汇支持的语言列表。请注意,只有您的语言字符集中列出的字符才能用于自定义词汇表。

怎么用?

您可以在 BDA 项目中使用自定义词汇表,方法是创建数据自动化库, entities/lists 为目标语言添加特定领域的词汇,在项目创建期间将库与项目相关联,或者更新现有项目,这样通过该项目执行的所有音频和视频处理作业都可以应用您的自定义词汇。这可以提高标准输出和自定义蓝图输出中特定领域术语的提取准确性。

使用自定义词汇表时的注意事项:

  • 重点关注经常被错误识别的特定域名术语

  • 包括重要术语的常见变体和拼写

  • 按语言整理词汇以实现更好的管理

  • 优先考虑特定行业的术语和技术术语

  • 包括您的域名中常用的首字母缩写词和缩写词