Tipos de modelos de reconocimiento de voz Configuración de las preferencias del modelo de voz Elegir el modelo de voz correcto

Configuración de las preferencias del modelo de reconocimiento de voz

Amazon Lex V2 ofrece diferentes modelos de reconocimiento de voz entre los que puede elegir para optimizar la precisión y el rendimiento de las capacidades de reconocimiento de voz de su bot. Puede configurar las preferencias del modelo de voz para seleccionar el modelo más adecuado para su caso de uso.

Tipos de modelos de reconocimiento de voz

Amazon Lex V2 es compatible con los siguientes modelos de reconocimiento de voz:

Modelo estándar: El modelo de reconocimiento de voz estándar proporciona un rendimiento de reconocimiento de voz fiable para casos de uso general. Este modelo ofrece una precisión uniforme en una amplia gama de condiciones de audio y es adecuado para la mayoría de las aplicaciones de IA conversacional.
Modelo neuronal: El modelo de reconocimiento neuronal de voz proporciona una mayor precisión y un mejor manejo de los patrones naturales del habla, los acentos y el ruido de fondo. Este modelo utiliza arquitecturas de redes neuronales avanzadas para mejorar el rendimiento del reconocimiento, especialmente en entornos de audio exigentes.
Deepgram: Deepgram proporciona una API pública de conversión de voz a texto (STT) para los usuarios que crean una cuenta y una clave de API. Consulte https://deepgram.com/para obtener información sobre sus ofertas públicas.

Configuración de las preferencias del modelo de voz

Puede configurar las preferencias del modelo de voz al crear o actualizar la configuración regional de un bot. La configuración de preferencias del modelo de voz determina qué modelo de reconocimiento utiliza Amazon Lex V2 para procesar la entrada de audio de su bot.

Para configurar las preferencias del modelo de voz:

En la consola Amazon Lex V2, navegue hasta el bot y seleccione la configuración regional que desee configurar.
En la configuración regional del bot, localice la sección de configuración del reconocimiento de voz.
En la preferencia del modelo de voz, selecciona una de las siguientes opciones:
- Estándar: utilice el modelo de reconocimiento de voz estándar para obtener un rendimiento fiable en todos los casos de uso generales.
- Neural: utilice el modelo de reconocimiento de voz neuronal para aumentar la precisión y gestionar mejor los patrones naturales del habla.
- Deepgram: utilice la API Listen de Deepgram para el reconocimiento de voz. Para obtener instrucciones de configuración, consulte. Configuración de la preferencia del modelo de voz de Deepgram
Guarde los cambios para aplicar la preferencia del modelo de voz a la configuración regional del bot.

nota

Si no especifica una preferencia de modelo de voz, Amazon Lex V2 utiliza el modelo estándar de forma predeterminada.

Elegir el modelo de voz correcto

Ten en cuenta los siguientes factores a la hora de elegir un modelo de reconocimiento de voz para tu bot:

Calidad de audio: si tu bot procesa el audio con ruido de fondo, con una calidad de audio variable o en condiciones acústicas difíciles, el modelo neuronal puede ofrecer una mayor precisión.
Diversidad de altavoces: si tu bot interactúa con usuarios que tienen distintos acentos o patrones de voz, las capacidades mejoradas de procesamiento del lenguaje natural del modelo neuronal pueden mejorar el rendimiento del reconocimiento.
Requisitos de rendimiento: el modelo estándar proporciona un rendimiento uniforme y puede ser suficiente para aplicaciones con entornos de audio controlados y una entrada de voz clara.

Puede probar ambos modelos con su caso de uso específico para determinar cuál ofrece el mejor equilibrio entre precisión y rendimiento para su aplicación.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Personalización de las transcripciones de voz para usarlas con su bot Lex V2

Configuración de la preferencia del modelo de voz de Deepgram