Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Konfiguration der Einstellungen für Spracherkennungsmodelle
Amazon Lex V2 bietet verschiedene Spracherkennungsmodelle, aus denen Sie wählen können, um die Genauigkeit und Leistung der Spracherkennungsfunktionen Ihres Bots zu optimieren. Sie können die Sprachmodelleinstellungen konfigurieren, um das für Ihren Anwendungsfall am besten geeignete Modell auszuwählen.
Modelltypen der Spracherkennung
Amazon Lex V2 unterstützt die folgenden Spracherkennungsmodelle:
- Standardmodell
-
Das Standard-Spracherkennungsmodell bietet zuverlässige Spracherkennungsleistung für allgemeine Anwendungsfälle. Dieses Modell bietet eine gleichbleibende Genauigkeit bei einer Vielzahl von Audiobedingungen und ist für die meisten Konversations-KI-Anwendungen geeignet.
- Neuronales Modell
-
Das neuronale Spracherkennungsmodell bietet eine höhere Genauigkeit und einen besseren Umgang mit natürlichen Sprachmustern, Akzenten und Hintergrundgeräuschen. Dieses Modell verwendet fortschrittliche neuronale Netzwerkarchitekturen, um die Erkennungsleistung zu verbessern, insbesondere in schwierigen Audioumgebungen.
- Deepgram
-
Deepgram bietet eine öffentliche speech-to-test (STT) API für Benutzer, die ein Konto und einen API-Schlüssel erstellen. Informationen zu ihren öffentlichen Angeboten finden Sie unter https://deepgram.com/
.
Konfiguration der Sprachmodell-Einstellungen
Sie können Sprachmodelleinstellungen konfigurieren, wenn Sie ein Bot-Gebietsschema erstellen oder aktualisieren. Die Sprachmodell-Voreinstellung bestimmt, welches Erkennungsmodell Amazon Lex V2 verwendet, um Audioeingaben für Ihren Bot zu verarbeiten.
So konfigurieren Sie die Einstellungen für das Sprachmodell:
-
Navigieren Sie in der Amazon Lex V2-Konsole zu Ihrem Bot und wählen Sie das Gebietsschema aus, das Sie konfigurieren möchten.
-
Suchen Sie in den Gebietsschemaeinstellungen des Bots den Abschnitt Spracherkennungseinstellungen.
-
Wählen Sie unter Sprachmodellpräferenz eine der folgenden Optionen aus:
-
Standard — Verwenden Sie das standardmäßige Spracherkennungsmodell für zuverlässige Leistung in allgemeinen Anwendungsfällen.
-
Neuronal — Verwenden Sie das neuronale Spracherkennungsmodell für eine höhere Genauigkeit und einen besseren Umgang mit natürlichen Sprachmustern.
-
Deepgram — Verwenden Sie die Listen API von Deepgram für die Spracherkennung. Anweisungen zur Einrichtung finden Sie unter. Einstellung der Deepgram-Sprachmodellpräferenz
-
-
Speichern Sie Ihre Änderungen, um die Sprachmodell-Voreinstellung auf Ihr Bot-Gebietsschema anzuwenden.
Anmerkung
Wenn Sie keine Sprachmodellpräferenz angeben, verwendet Amazon Lex V2 standardmäßig das Standardmodell.
Auswahl des richtigen Sprachmodells
Berücksichtigen Sie bei der Auswahl eines Spracherkennungsmodells für Ihren Bot die folgenden Faktoren:
-
Audioqualität — Wenn Ihr Bot Audio mit Hintergrundgeräuschen, unterschiedlicher Audioqualität oder schwierigen akustischen Bedingungen verarbeitet, bietet das neuronale Modell möglicherweise eine bessere Genauigkeit.
-
Sprechervielfalt — Wenn Ihr Bot mit Benutzern interagiert, die unterschiedliche Akzente oder Sprachmuster haben, können die verbesserten Fähigkeiten des neuronalen Modells zur Verarbeitung natürlicher Sprache die Erkennungsleistung verbessern.
-
Leistungsanforderungen — Das Standardmodell bietet eine gleichbleibende Leistung und kann für Anwendungen mit kontrollierter Audioumgebung und klarer Spracheingabe ausreichend sein.
Sie können beide Modelle anhand Ihres spezifischen Anwendungsfalls testen, um festzustellen, welches Modell das beste Gleichgewicht zwischen Genauigkeit und Leistung für Ihre Anwendung bietet.