음성 활동 감지 민감도 구성 - Amazon Lex

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

음성 활동 감지 민감도 구성

음성 활동 감지(VAD)는 오디오 신호에 음성이 있는 시기를 결정하는 기술입니다. Amazon Lex V2는 VAD를 사용하여 실제 음성과 배경 소음을 구분하여 음성 인식 정확도를 최적화합니다. VAD 민감도 수준을 구성하여 다양한 음향 환경에서 봇의 성능을 개선할 수 있습니다.

VAD 민감도 수준 이해

Amazon Lex V2는 봇 로캘에 대해 구성할 수 있는 세 가지 VAD 민감도 수준을 제공합니다.

기본값

일반적인 배경 노이즈 수준이 있는 대부분의 환경에 적합한 표준 민감도 수준입니다. 일반 사용 사례에 권장되는 설정입니다.

HighNoiseTolerance

중간 수준의 배경 노이즈에 대한 허용 오차를 높입니다. 봇이 사용량이 많은 사무실 또는 소매 환경과 같이 일관되지만 중간 수준의 소음이 있는 환경에서 작동하는 경우이 설정을 사용합니다.

MaximumNoiseTolerance

높은 수준의 배경 노이즈에 대한 최대 허용 오차입니다. 콜 센터, 제조 현장 또는 주변 소음이 큰 야외 위치와 같은 매우 시끄러운 환경에이 설정을 사용합니다.

참고

내노이즈성 수준이 높을수록 시스템이 스피치로 간주하는 것에 대해 더 허용적일 수 있으며, 이는 매우 조용한 환경에서 오탐으로 이어질 수 있습니다. 예상 음향 환경에 가장 적합한 민감도 수준을 선택합니다.

VAD 민감도 구성

Amazon Lex V2 콘솔, AWS CLI 또는 SDK를 사용하여 봇 로캘을 생성하거나 업데이트할 때 VAD SDKs.

Amazon Lex V2 콘솔 사용

콘솔에서 VAD 민감도를 구성하려면
  1. https://console.aws.amazon.com/lexv2/ Amazon Lex V2 콘솔을 엽니다.

  2. 목록에서 봇을 선택합니다.

  3. 왼쪽 탐색 창에서 봇 언어를 선택합니다.

  4. 구성할 언어를 선택하거나 언어 추가를 선택하여 새 언어를 추가합니다.

  5. 음성 감지 민감도 섹션에서 다음 옵션 중 하나를 선택합니다.

    • 기본값 - 일반적인 환경에 대한 표준 민감도

    • 높은 내노이즈성 - 중간 정도의 노이즈가 있는 환경의 경우

    • 최대 내노이즈성 - 매우 시끄러운 환경용

  6. 저장을 선택하여 변경 사항을 적용합니다.

AWS CLI 또는 SDKs 사용

다음 API 작업에서 speechDetectionSensitivity 파라미터를 사용하여 VAD 민감도를 설정할 수 있습니다.

  • CreateBotLocale - 새 봇 로캘을 생성할 때 VAD 민감도 설정

  • UpdateBotLocale - 기존 봇 로캘에 대한 VAD 민감도 수정

  • DescribeBotLocale - 현재 VAD 민감도 설정 보기

예 AWS CLI를 사용하여 VAD 민감도 설정
aws lexv2-models create-bot-locale \ --bot-id "AIDACKCEVSQ6C2EXAMPLE" \ --bot-version "DRAFT" \ --locale-id "en_US" \ --nlu-intent-confidence-threshold 0.40 \ --speech-detection-sensitivity "HighNoiseTolerance"

VAD 구성 모범 사례

  • 대상 환경에서 테스트 - 봇이 배포될 실제 음향 조건을 기반으로 VAD 민감도를 구성합니다.

  • 기본값으로 시작 - 기본값 설정으로 시작하고 성능 테스트 및 사용자 피드백에 따라 조정합니다.

  • 성능 모니터링 - Amazon Lex V2 분석 및 대화 로그를 사용하여 음성 인식 정확도를 모니터링하고 필요에 따라 VAD 민감도를 조정합니다.

  • 사용 사례 고려 - 민감도 수준이 높을수록 노이즈가 많은 환경에 유용하지만 헤드셋이 있는 고객 서비스 센터와 같은 제어된 환경에는 필요하지 않을 수 있습니다.