Types de modèles de reconnaissance vocale Configuration des préférences du modèle vocal Choisir le bon modèle vocal

Configuration des préférences du modèle de reconnaissance vocale

Amazon Lex V2 propose différents modèles de reconnaissance vocale parmi lesquels vous pouvez choisir pour optimiser la précision et les performances des capacités de reconnaissance vocale de votre bot. Vous pouvez configurer les préférences du modèle vocal afin de sélectionner le modèle le mieux adapté à votre cas d'utilisation.

Types de modèles de reconnaissance vocale

Amazon Lex V2 prend en charge les modèles de reconnaissance vocale suivants :

Modèle standard: Le modèle de reconnaissance vocale standard fournit des performances de reconnaissance vocale fiables pour les cas d'utilisation généraux. Ce modèle offre une précision constante dans un large éventail de conditions audio et convient à la plupart des applications d'IA conversationnelle.
Modèle neuronal: Le modèle de reconnaissance vocale neurale offre une précision améliorée et une meilleure gestion des modèles vocaux naturels, des accents et du bruit de fond. Ce modèle utilise des architectures de réseaux neuronaux avancées pour améliorer les performances de reconnaissance, en particulier dans les environnements audio difficiles.
Deepgram: Deepgram fournit une API publique de synthèse vocale (STT) aux utilisateurs qui créent un compte et une clé d'API. Consultez https://deepgram.com/pour plus d'informations sur leurs offres publiques.

Configuration des préférences du modèle vocal

Vous pouvez configurer les préférences du modèle vocal lors de la création ou de la mise à jour des paramètres régionaux d'un bot. Le paramètre de préférence du modèle vocal détermine le modèle de reconnaissance utilisé par Amazon Lex V2 pour traiter les entrées audio de votre bot.

Pour configurer les préférences du modèle vocal :

Dans la console Amazon Lex V2, accédez à votre bot et sélectionnez les paramètres régionaux que vous souhaitez configurer.
Dans les paramètres régionaux du bot, recherchez la section Paramètres de reconnaissance vocale.
Pour la préférence du modèle vocal, choisissez l'une des options suivantes :
- Standard : utilisez le modèle de reconnaissance vocale standard pour des performances fiables dans tous les cas d'utilisation généraux.
- Neural - Utilisez le modèle de reconnaissance vocale neurale pour une précision accrue et une meilleure gestion des modèles vocaux naturels.
- Deepgram - Utilisez l'API Listen de Deepgram pour la reconnaissance vocale. Pour les instructions de configuration, voirConfiguration des préférences du modèle vocal Deepgram.
Enregistrez vos modifications pour appliquer la préférence du modèle vocal aux paramètres régionaux de votre bot.

Note

Si vous ne spécifiez aucune préférence de modèle vocal, Amazon Lex V2 utilise le modèle standard par défaut.

Choisir le bon modèle vocal

Tenez compte des facteurs suivants lorsque vous choisissez un modèle de reconnaissance vocale pour votre bot :

Qualité audio : si votre robot doit traiter le son avec un bruit de fond, une qualité audio variable ou des conditions acoustiques difficiles, le modèle neuronal peut fournir une meilleure précision.
Diversité des locuteurs : si votre bot doit interagir avec des utilisateurs aux accents ou aux modèles vocaux variés, les capacités améliorées de traitement du langage naturel du modèle neuronal peuvent améliorer les performances de reconnaissance.
Exigences de performance - Le modèle standard fournit des performances constantes et peut être suffisant pour les applications avec des environnements audio contrôlés et une saisie vocale claire.

Vous pouvez tester les deux modèles en fonction de votre cas d'utilisation spécifique afin de déterminer lequel offre le meilleur équilibre entre précision et performances pour votre application.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Personnalisation des transcriptions vocales à utiliser avec votre robot Lex V2

Configuration des préférences du modèle vocal Deepgram