Modelltypen der Spracherkennung Konfiguration der Sprachmodell-Einstellungen Auswahl des richtigen Sprachmodells

Konfiguration der Einstellungen für Spracherkennungsmodelle

Amazon Lex V2 bietet verschiedene Spracherkennungsmodelle, aus denen Sie wählen können, um die Genauigkeit und Leistung der Spracherkennungsfunktionen Ihres Bots zu optimieren. Sie können die Sprachmodelleinstellungen konfigurieren, um das für Ihren Anwendungsfall am besten geeignete Modell auszuwählen.

Modelltypen der Spracherkennung

Amazon Lex V2 unterstützt die folgenden Spracherkennungsmodelle:

Standardmodell: Das Standard-Spracherkennungsmodell bietet zuverlässige Spracherkennungsleistung für allgemeine Anwendungsfälle. Dieses Modell bietet eine gleichbleibende Genauigkeit bei einer Vielzahl von Audiobedingungen und ist für die meisten Konversations-KI-Anwendungen geeignet.
Neuronales Modell: Das neuronale Spracherkennungsmodell bietet eine höhere Genauigkeit und einen besseren Umgang mit natürlichen Sprachmustern, Akzenten und Hintergrundgeräuschen. Dieses Modell verwendet fortschrittliche neuronale Netzwerkarchitekturen, um die Erkennungsleistung zu verbessern, insbesondere in schwierigen Audioumgebungen.
Deepgram: Deepgram bietet eine öffentliche Speech-to-Text (STT) -API für Benutzer, die ein Konto und einen API-Schlüssel erstellen. Informationen zu ihren öffentlichen https://deepgram.com/Angeboten finden Sie unter.

Konfiguration der Sprachmodell-Einstellungen

Sie können Sprachmodelleinstellungen konfigurieren, wenn Sie ein Bot-Gebietsschema erstellen oder aktualisieren. Die Sprachmodell-Voreinstellung bestimmt, welches Erkennungsmodell Amazon Lex V2 verwendet, um Audioeingaben für Ihren Bot zu verarbeiten.

So konfigurieren Sie die Einstellungen für das Sprachmodell:

Navigieren Sie in der Amazon Lex V2-Konsole zu Ihrem Bot und wählen Sie das Gebietsschema aus, das Sie konfigurieren möchten.
Suchen Sie in den Gebietsschemaeinstellungen des Bots den Abschnitt Spracherkennungseinstellungen.
Wählen Sie unter Sprachmodellpräferenz eine der folgenden Optionen aus:
- Standard — Verwenden Sie das standardmäßige Spracherkennungsmodell für zuverlässige Leistung in allgemeinen Anwendungsfällen.
- Neuronal — Verwenden Sie das neuronale Spracherkennungsmodell für eine höhere Genauigkeit und einen besseren Umgang mit natürlichen Sprachmustern.
- Deepgram — Verwenden Sie die Listen API von Deepgram für die Spracherkennung. Anweisungen zur Einrichtung finden Sie unter. Deepgram-Sprachmodellpräferenz einrichten
Speichern Sie Ihre Änderungen, um die Sprachmodell-Voreinstellung auf Ihr Bot-Gebietsschema anzuwenden.

Anmerkung

Wenn Sie keine Sprachmodellpräferenz angeben, verwendet Amazon Lex V2 standardmäßig das Standardmodell.

Auswahl des richtigen Sprachmodells

Berücksichtigen Sie bei der Auswahl eines Spracherkennungsmodells für Ihren Bot die folgenden Faktoren:

Audioqualität — Wenn Ihr Bot Audio mit Hintergrundgeräuschen, unterschiedlicher Audioqualität oder schwierigen akustischen Bedingungen verarbeitet, bietet das neuronale Modell möglicherweise eine bessere Genauigkeit.
Sprechervielfalt — Wenn Ihr Bot mit Benutzern interagiert, die unterschiedliche Akzente oder Sprachmuster haben, können die verbesserten Fähigkeiten des neuronalen Modells zur Verarbeitung natürlicher Sprache die Erkennungsleistung verbessern.
Leistungsanforderungen — Das Standardmodell bietet eine gleichbleibende Leistung und kann für Anwendungen mit kontrollierter Audioumgebung und klarer Spracheingabe ausreichend sein.

Sie können beide Modelle anhand Ihres spezifischen Anwendungsfalls testen, um festzustellen, welches Modell das beste Gleichgewicht zwischen Genauigkeit und Leistung für Ihre Anwendung bietet.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Anpassen von Sprachtranskriptionen für die Verwendung mit Ihrem Lex V2-Bot

Deepgram-Sprachmodellpräferenz einrichten