音声アクティビティの検出感度の設定 - Amazon Lex

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

音声アクティビティの検出感度の設定

音声アクティビティ検出 (VAD) は、音声信号に音声が存在するタイミングを決定するテクノロジーです。Amazon Lex V2 は VAD を使用して、実際の音声とバックグラウンドノイズを区別することで、音声認識の精度を最適化します。VAD 感度レベルを設定して、さまざまな音響環境でボットのパフォーマンスを向上させることができます。

VAD の感度レベルについて

Amazon Lex V2 には、ボットロケール用に設定できる 3 つの VAD 感度レベルが用意されています。

デフォルト

一般的なバックグラウンドノイズレベルを持つほとんどの環境に適した標準感度レベル。これは、一般的なユースケースで推奨される設定です。

HighNoiseTolerance

中程度のバックグラウンドノイズに対する耐性が向上しました。この設定は、多忙なオフィスや小売環境など、一貫した中程度のノイズレベルを持つ環境でボットが動作する場合に使用します。

MaximumNoiseTolerance

高レベルのバックグラウンドノイズの最大許容値。この設定は、コールセンター、製造フロア、環境ノイズが大きい屋外の場所など、非常にノイズの多い環境で使用します。

注記

ノイズ耐性レベルが高いと、システムが音声と考えるものに対してより寛容になり、非常に静かな環境で誤検出が発生する可能性があります。予想される音響環境に最適な感度レベルを選択します。

VAD の機密性の設定

Amazon Lex V2 コンソール、AWS CLI、または SDKs を使用して、ボットロケールを作成または更新するときに VAD の機密性を設定できます。

Amazon Lex V2 コンソールの使用

コンソールで VAD 感度を設定するには
  1. https://console.aws.amazon.com/lexv2/ で Amazon Lex V2 コンソールを開きます。

  2. リストからボットを選択します。

  3. 左側のナビゲーションペインで、ボット言語を選択します。

  4. 設定する言語を選択するか、言語の追加を選択して新しい言語を追加します。

  5. 音声検出感度セクションで、次のいずれかのオプションを選択します。

    • デフォルト - 一般的な環境の標準感度

    • 高ノイズ耐性 - ノイズが中程度の環境の場合

    • 最大耐ノイズ性 - 非常にノイズの多い環境の場合

  6. 保存を選択して変更を適用します。

AWS CLI または SDKs

次の API オペレーションで speechDetectionSensitivityパラメータを使用して VAD 感度を設定できます。

  • CreateBotLocale - 新しいボットロケールを作成するときに VAD の機密性を設定する

  • UpdateBotLocale - 既存のボットロケールの VAD 感度を変更する

  • DescribeBotLocale - 現在の VAD 感度設定を表示する

例 AWS CLI での VAD 感度の設定
aws lexv2-models create-bot-locale \ --bot-id "AIDACKCEVSQ6C2EXAMPLE" \ --bot-version "DRAFT" \ --locale-id "en_US" \ --nlu-intent-confidence-threshold 0.40 \ --speech-detection-sensitivity "HighNoiseTolerance"

VAD 設定のベストプラクティス

  • ターゲット環境でテストする - ボットがデプロイされる実際の音響条件に基づいて VAD 感度を設定します。

  • デフォルトから開始 - デフォルト設定から開始し、パフォーマンステストとユーザーフィードバックに基づいて調整します。

  • パフォーマンスのモニタリング - Amazon Lex V2 分析と会話ログを使用して、音声認識の精度をモニタリングし、必要に応じて VAD 感度を調整します。

  • ユースケースを検討する - 機密性レベルが高いほどノイズの多い環境には有益ですが、ヘッドセットを備えたカスタマーサービスセンターなどの制御された環境では必要ではない場合があります。