Configurando a sensibilidade de detecção de atividade de voz - Guia do desenvolvedor

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configurando a sensibilidade de detecção de atividade de voz

A Detecção de Atividade de Voz (VAD) é uma tecnologia que determina quando a fala está presente em um sinal de áudio. O Amazon Lex V2 usa o VAD para otimizar a precisão do reconhecimento de fala ao distinguir entre fala real e ruído de fundo. Você pode configurar o nível de sensibilidade do VAD para melhorar o desempenho do seu bot em diferentes ambientes acústicos.

Entendendo os níveis de sensibilidade do VAD

O Amazon Lex V2 fornece três níveis de sensibilidade do VAD que você pode configurar para a localidade do seu bot:

Padrão

O nível de sensibilidade padrão adequado para a maioria dos ambientes com níveis típicos de ruído de fundo. Essa é a configuração recomendada para casos de uso geral.

HighNoiseTolerance

Maior tolerância a ruídos de fundo moderados. Use essa configuração quando seu bot opera em ambientes com níveis de ruído consistentes, mas moderados, como escritórios movimentados ou ambientes de varejo.

MaximumNoiseTolerance

Tolerância máxima para altos níveis de ruído de fundo. Use essa configuração para ambientes muito ruidosos, como call centers, fábricas ou locais externos com ruído ambiente significativo.

nota

Níveis mais altos de tolerância ao ruído podem fazer com que o sistema seja mais permissivo sobre o que considera fala, o que pode levar a falsos positivos em ambientes muito silenciosos. Escolha o nível de sensibilidade que melhor corresponda ao ambiente acústico esperado.

Configurando a sensibilidade do VAD

Você pode configurar a sensibilidade do VAD ao criar ou atualizar uma localidade de bot usando o console Amazon Lex V2, o AWS CLI ou. SDKs

Usar o console do Amazon Lex V2

Para configurar a sensibilidade do VAD no console
  1. Abra o console do Amazon Lex V2 em https://console.aws.amazon.com/lexv2/.

  2. Escolha seu bot na lista.

  3. No painel de navegação esquerdo, escolha Idiomas do bot.

  4. Escolha o idioma que você deseja configurar ou escolha Adicionar idioma para adicionar um novo.

  5. Na seção Sensibilidade de detecção de fala, escolha uma das seguintes opções:

    • Padrão - Sensibilidade padrão para ambientes típicos

    • Alta tolerância ao ruído - Para ambientes moderadamente ruidosos

    • Tolerância máxima de ruído - Para ambientes muito ruidosos

  6. Escolha Salvar para aplicar as alterações.

Usando a AWS CLI ou SDKs

Você pode definir a sensibilidade do VAD usando o speechDetectionSensitivity parâmetro nas seguintes operações de API:

  • CreateBotLocale- Defina a sensibilidade do VAD ao criar uma nova localidade de bot

  • UpdateBotLocale- Modifique a sensibilidade do VAD para uma localidade de bot existente

  • DescribeBotLocale- Veja a configuração atual de sensibilidade do VAD

exemplo Definindo a sensibilidade do VAD com o AWS CLI
aws lexv2-models create-bot-locale \ --bot-id "AIDACKCEVSQ6C2EXAMPLE" \ --bot-version "DRAFT" \ --locale-id "en_US" \ --nlu-intent-confidence-threshold 0.40 \ --speech-detection-sensitivity "HighNoiseTolerance"

Práticas recomendadas para configuração de VAD

  • Teste em seu ambiente de destino - configure a sensibilidade do VAD com base nas condições acústicas reais em que seu bot será implantado.

  • Comece com o padrão - comece com a configuração padrão e ajuste com base no teste de desempenho e no feedback do usuário.

  • Monitore o desempenho — Use os registros analíticos e de conversação do Amazon Lex V2 para monitorar a precisão do reconhecimento de fala e ajustar a sensibilidade do VAD conforme necessário.

  • Considere o caso de uso: níveis mais altos de sensibilidade são benéficos para ambientes ruidosos, mas podem não ser necessários para ambientes controlados, como centros de atendimento ao cliente com fones de ouvido.