

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用自定义词汇表和自定义语言模型提高转录准确性
<a name="improving-accuracy"></a>

如果您的媒体包含特定领域或非标准术语，例如品牌名称、首字母缩略词、技术词和行话，则 Amazon Transcribe 可能无法在转录输出中正确捕捉这些术语。

要更正转录不准确之处并针对您的特定用例自定义输出，您可以创建[自定义词汇表](custom-vocabulary.md)和[自定义语言模型](custom-language-models.md)。
+ [自定义词汇表](custom-vocabulary.md) 旨在调整和提高所有上下文中特定单词的识别和格式。这包括为 Amazon Transcribe 提供单词以及（可选）发音和显示形式。

  如果 Amazon Transcribe 无法正确呈现成绩单中的特定术语，则可以创建一个自定义词汇文件，告诉您希望 Amazon Transcribe 如何显示这些术语。这种针对单词的方法最适合更正品牌名称和首字母缩略词等术语。
+ [自定义语言模型](custom-language-models.md) 旨在捕捉与术语相关的上下文。这涉及 Amazon Transcribe 提供大量特定于域名的文本数据。

  如果 Amazon Transcribe 未正确呈现技术术语或在成绩单中使用了错误的同音异义词，则可以创建自定义语言模型来教授 Amazon Transcribe 特定领域的语言。例如，自定义语言模型可以学习何时使用“floe”（浮冰）和“flow”（线性流）。

  这种上下文感知方法最适合转录大量特定领域的语音。与单独使用自定义词汇表相比，自定义语言模型可以显著提高准确性。使用批量转录时，您可以在请求中同时包含自定义语言模型和自定义词汇表。

**提示**  
要最大程度地实现转录准确性，请将自定义词汇表与自定义语言模型结合使用。

有关创建和使用自定义词汇表的视频演练，请参阅：

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/oBgSJ7bsP2U/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/oBgSJ7bsP2U)


有关创建和使用自定义语言模型的视频演练，请参阅：

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/iTkJoIqRrPU/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/iTkJoIqRrPU)


**通过 Machine Learn AWS ing 博客深入了解**  
自定义词汇表：  
[使用 F1 比赛的现场转录 Amazon Transcribe](https://aws.amazon.com/blogs/machine-learning/live-transcriptions-of-f1-races-using-amazon-transcribe/)
自定义语言模型：  
[构建自定义语言模型以增强性能 speech-to-text Amazon Transcribe](https://aws.amazon.com/blogs/machine-learning/building-custom-language-models-to-supercharge-speech-to-text-performance-for-amazon-transcribe/)
[使用适用于 Amazon Transcribe的自定义语言模型提高课堂讲座的转录准确性](https://aws.amazon.com/blogs/machine-learning/transcribe-class-lectures-accurately-using-amazon-transcribe-with-custom-language-models/)