Tipi di modelli di riconoscimento vocale Configurazione delle preferenze del modello vocale Scelta del modello vocale giusto

Configurazione delle preferenze del modello di riconoscimento vocale

Amazon Lex V2 offre diversi modelli di riconoscimento vocale tra cui scegliere per ottimizzare la precisione e le prestazioni delle funzionalità di riconoscimento vocale del bot. Puoi configurare le preferenze del modello vocale per selezionare il modello più appropriato per il tuo caso d'uso.

Tipi di modelli di riconoscimento vocale

Amazon Lex V2 supporta i seguenti modelli di riconoscimento vocale:

Modello standard: Il modello di riconoscimento vocale standard offre prestazioni di riconoscimento vocale affidabili per casi d'uso generici. Questo modello offre una precisione costante in un'ampia gamma di condizioni audio ed è adatto per la maggior parte delle applicazioni di intelligenza artificiale conversazionale.
Modello neurale: Il modello di riconoscimento vocale neurale offre una maggiore precisione e una migliore gestione degli schemi vocali naturali, degli accenti e del rumore di fondo. Questo modello utilizza architetture di rete neurale avanzate per migliorare le prestazioni di riconoscimento, specialmente in ambienti audio difficili.
Deepgram: Deepgram fornisce un'API pubblica speech-to-test (STT) per gli utenti che creano un account e una chiave API. Vedi https://deepgram.com/per informazioni sulle loro offerte pubbliche.

Configurazione delle preferenze del modello vocale

È possibile configurare le preferenze del modello vocale durante la creazione o l'aggiornamento delle impostazioni locali di un bot. L'impostazione delle preferenze del modello vocale determina il modello di riconoscimento utilizzato da Amazon Lex V2 per elaborare l'input audio per il bot.

Per configurare le preferenze del modello vocale:

Nella console Amazon Lex V2, accedi al tuo bot e seleziona le impostazioni locali che desideri configurare.
Nelle impostazioni locali del bot, individua la sezione Impostazioni di riconoscimento vocale.
Per la preferenza del modello Speech, scegliete una delle seguenti opzioni:
- Standard: utilizzate il modello di riconoscimento vocale standard per prestazioni affidabili in tutti i casi d'uso generici.
- Neurale: utilizza il modello di riconoscimento vocale neurale per una maggiore precisione e una migliore gestione dei modelli vocali naturali.
- Deepgram - Usa l'API Listen di Deepgram per il riconoscimento vocale. Per le istruzioni di configurazione, consulta. Impostazione della preferenza del modello vocale Deepgram
Salva le modifiche per applicare la preferenza del modello vocale alle impostazioni locali del bot.

Nota

Se non specifichi una preferenza per il modello vocale, Amazon Lex V2 utilizza il modello standard per impostazione predefinita.

Scelta del modello vocale giusto

Quando scegli un modello di riconoscimento vocale per il tuo bot, considera i seguenti fattori:

Qualità audio: se il bot elaborerà l'audio con rumore di fondo, qualità audio variabile o condizioni acustiche difficili, il modello neurale potrebbe fornire una maggiore precisione.
Diversità degli altoparlanti: se il bot interagirà con utenti con accenti o schemi vocali diversi, le funzionalità avanzate di elaborazione del linguaggio naturale del modello neurale potrebbero migliorare le prestazioni di riconoscimento.
Requisiti prestazionali - Il modello standard offre prestazioni costanti e può essere sufficiente per applicazioni con ambienti audio controllati e input vocale chiaro.

È possibile testare entrambi i modelli in base al proprio caso d'uso specifico per determinare quale offre il miglior equilibrio tra precisione e prestazioni per l'applicazione.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Personalizzazione delle trascrizioni vocali da utilizzare con il bot Lex V2

Impostazione della preferenza del modello vocale Deepgram