設定語音活動偵測敏感度 - Amazon Lex

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定語音活動偵測敏感度

語音活動偵測 (VAD) 是一種技術,可判斷語音何時出現在音訊訊號中。Amazon Lex V2 使用 VAD 透過區分實際語音和背景雜訊來最佳化語音辨識準確性。您可以設定 VAD 敏感度等級,以改善機器人在不同聲學環境中的效能。

了解 VAD 敏感度等級

Amazon Lex V2 提供三個 VAD 敏感層級,您可以針對機器人地區設定進行設定:

預設

標準敏感度等級適用於具有典型背景雜訊等級的大多數環境。這是一般使用案例的建議設定。

HighNoiseTolerance

提高對中等背景雜訊的容忍度。當您的機器人在雜訊等級一致但中等的環境中操作時,請使用此設定,例如忙碌的辦公室或零售環境。

MaximumNoiseTolerance

高背景雜訊的最大容錯度。將此設定用於非常嘈雜的環境,例如呼叫中心、製造樓層或具有顯著環境噪音的戶外位置。

注意

較高的雜訊容錯程度可能會導致系統對其認為語音的內容更寬鬆,這可能會導致在非常安靜的環境中出現誤報。選擇最符合您預期聲音環境的敏感度等級。

設定 VAD 敏感度

您可以在使用 Amazon Lex V2 主控台、AWS CLI 或 SDKs 建立或更新機器人地區設定時設定 VAD 敏感度。

使用 Amazon Lex V2 主控台

在主控台中設定 VAD 敏感度
  1. 在 https://https://console.aws.amazon.com/lexv2/ 開啟 Amazon Lex V2 主控台。

  2. 從清單中選擇您的機器人。

  3. 在左側導覽窗格中,選擇機器人語言

  4. 選擇您要設定的語言,或選擇新增語言以新增新的語言。

  5. 語音偵測敏感度區段中,選擇下列其中一個選項:

    • 預設 - 一般環境的標準敏感度

    • 高雜訊容錯能力 - 適用於中等雜訊的環境

    • 最大雜訊容錯能力 - 適用於非常吵雜的環境

  6. 選擇儲存以套用變更。

使用 AWS CLI 或 SDKs

您可以在下列 API 操作中使用 speechDetectionSensitivity 參數設定 VAD 敏感度:

  • CreateBotLocale - 建立新的機器人地區設定時設定 VAD 敏感度

  • UpdateBotLocale - 修改現有機器人地區設定的 VAD 敏感度

  • DescribeBotLocale - 檢視目前的 VAD 敏感度設定

範例 使用 AWS CLI 設定 VAD 敏感度
aws lexv2-models create-bot-locale \ --bot-id "AIDACKCEVSQ6C2EXAMPLE" \ --bot-version "DRAFT" \ --locale-id "en_US" \ --nlu-intent-confidence-threshold 0.40 \ --speech-detection-sensitivity "HighNoiseTolerance"

VAD 組態的最佳實務

  • 在目標環境中測試 - 根據要部署機器人的實際聲音條件來設定 VAD 敏感度。

  • 從預設開始 - 從預設設定開始,並根據效能測試和使用者意見回饋進行調整。

  • 監控效能 - 使用 Amazon Lex V2 分析和對話日誌來監控語音辨識準確性,並視需要調整 VAD 敏感度。

  • 考慮使用案例 - 較高的敏感度等級對於嘈雜的環境很有幫助,但對於具有耳機的客戶服務中心等受控環境可能並非必要。