配置语音活动检测灵敏度 - Amazon Lex

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

配置语音活动检测灵敏度

语音活动检测 (VAD) 是一种确定音频信号中何时出现语音的技术。Amazon Lex V2 使用 VAD 通过区分实际语音和背景噪音来优化语音识别精度。您可以配置 VAD 灵敏度等级,以提高机器人在不同声学环境中的性能。

了解 VAD 灵敏度级别

Amazon Lex V2 提供了三个 VAD 敏感度级别,您可以为机器人区域设置配置这些级别:

默认

标准灵敏度级别适用于大多数具有典型背景噪音水平的环境。这是一般用例的推荐设置。

HighNoiseTolerance

提高了对中等背景噪音的容忍度。当您的机器人在噪音水平一致但中等的环境中运行时,例如繁忙的办公室或零售环境,请使用此设置。

MaximumNoiseTolerance

对高水平背景噪音的最大容忍度。此设置适用于噪音非常大的环境,例如呼叫中心、制造车间或环境噪音较大的室外场所。

注意

较高的噪声容限水平可能会导致系统对自己认为的言语更加宽容,这可能会在非常安静的环境中导致误报。选择最符合您预期的声学环境的灵敏度级别。

配置 VAD 灵敏度

您可以使用 Amazon Lex V2 控制台、AWS CLI 或在创建或更新机器人区域设置时配置 VAD 敏感度。 SDKs

使用 Amazon Lex V2 控制台

在控制台中配置 VAD 灵敏度
  1. 打开 Amazon Lex V2 主机,网址为https://console.aws.amazon.com/lexv2/

  2. 从列表中选择您的机器人。

  3. 在左侧导航窗格中,选择机器人语言

  4. 选择要配置的语言,或者选择 “添加语言” 来添加新语言。

  5. 在 “语音检测灵敏度” 部分,选择以下选项之一:

    • 默认-典型环境的标准灵敏度

    • 高耐噪性-适用于中等噪音环境

    • 最大噪音耐受性-适用于非常嘈杂的环境

  6. 选择 “保存” 以应用更改。

使用 AWS CLI 或 SDKs

您可以在以下 API 操作中使用speechDetectionSensitivity参数设置 VAD 灵敏度:

  • CreateBotLocale-在创建新的机器人区域设置时设置 VAD 灵敏度

  • UpdateBotLocale-修改现有机器人区域的 VAD 灵敏度

  • DescribeBotLocale-查看当前 VAD 灵敏度设置

例 使用 AWS CLI 设置 VAD 敏感度
aws lexv2-models create-bot-locale \ --bot-id "AIDACKCEVSQ6C2EXAMPLE" \ --bot-version "DRAFT" \ --locale-id "en_US" \ --nlu-intent-confidence-threshold 0.40 \ --speech-detection-sensitivity "HighNoiseTolerance"

VAD 配置的最佳实践

  • 在目标环境中进行测试-根据将部署机器人的实际声学条件配置 VAD 灵敏度。

  • 从默认设置开始-从默认设置开始,然后根据性能测试和用户反馈进行调整。

  • 监控性能-使用 Amazon Lex V2 分析和对话日志监控语音识别准确性并根据需要调整 VAD 灵敏度。

  • 考虑用例 ——对于嘈杂的环境,较高的灵敏度级别是有益的,但对于受控的环境,例如配备头戴式耳机的客户服务中心,则可能不是必需的。