Konfiguration der Empfindlichkeit der Sprachaktivitätserkennung - Amazon Lex

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Konfiguration der Empfindlichkeit der Sprachaktivitätserkennung

Voice Activity Detection (VAD) ist eine Technologie, die bestimmt, wann Sprache in einem Audiosignal vorhanden ist. Amazon Lex V2 verwendet VAD, um die Genauigkeit der Spracherkennung zu optimieren, indem zwischen echter Sprache und Hintergrundgeräuschen unterschieden wird. Sie können die VAD-Empfindlichkeitsstufe konfigurieren, um die Leistung Ihres Bots in verschiedenen akustischen Umgebungen zu verbessern.

Grundlegendes zu den VAD-Empfindlichkeitsstufen

Amazon Lex V2 bietet drei VAD-Empfindlichkeitsstufen, die Sie für Ihr Bot-Gebietsschema konfigurieren können:

Standard

Die Standardempfindlichkeitsstufe, die für die meisten Umgebungen mit typischen Hintergrundgeräuschpegeln geeignet ist. Dies ist die empfohlene Einstellung für allgemeine Anwendungsfälle.

HighNoiseTolerance

Höhere Toleranz gegenüber moderaten Hintergrundgeräuschen. Verwenden Sie diese Einstellung, wenn Ihr Bot in Umgebungen mit gleichbleibendem, aber moderatem Geräuschpegel arbeitet, z. B. in stark frequentierten Büros oder Einzelhandelsumgebungen.

MaximumNoiseTolerance

Maximale Toleranz für hohe Hintergrundgeräusche. Verwenden Sie diese Einstellung für sehr laute Umgebungen wie Call Center, Fertigungshallen oder Standorte im Freien mit starken Umgebungsgeräuschen.

Anmerkung

Höhere Geräuschtoleranzwerte können dazu führen, dass das System nachgiebiger umgeht, was in sehr leisen Umgebungen möglicherweise zu Fehlalarmen führen kann. Wählen Sie die Empfindlichkeitsstufe, die am besten zu Ihrer erwarteten akustischen Umgebung passt.

Konfiguration der VAD-Empfindlichkeit

Sie können die VAD-Sensitivität konfigurieren, wenn Sie ein Bot-Gebietsschema mithilfe der Amazon Lex V2-Konsole, der AWS-CLI oder aktualisieren. SDKs

Verwenden der Amazon Lex V2-Konsole

Um die VAD-Empfindlichkeit in der Konsole zu konfigurieren
  1. Öffnen Sie die Amazon Lex V2-Konsole unter https://console.aws.amazon.com/lexv2/.

  2. Wählen Sie Ihren Bot aus der Liste aus.

  3. Wählen Sie im linken Navigationsbereich Bot-Sprachen aus.

  4. Wählen Sie die Sprache aus, die Sie konfigurieren möchten, oder wählen Sie Sprache hinzufügen, um eine neue Sprache hinzuzufügen.

  5. Wählen Sie im Bereich Empfindlichkeit der Spracherkennung eine der folgenden Optionen aus:

    • Standard — Standardempfindlichkeit für typische Umgebungen

    • Hohe Geräuschtoleranz — Für mäßig laute Umgebungen

    • Maximale Geräuschtoleranz — Für sehr laute Umgebungen

  6. Wählen Sie Speichern, um die Änderungen zu übernehmen.

Mit der AWS-CLI oder SDKs

Sie können die VAD-Empfindlichkeit mithilfe des speechDetectionSensitivity Parameters in den folgenden API-Vorgängen festlegen:

  • CreateBotLocale- Stellen Sie die VAD-Empfindlichkeit ein, wenn Sie ein neues Bot-Gebietsschema erstellen

  • UpdateBotLocale- Ändern Sie die VAD-Empfindlichkeit für ein vorhandenes Bot-Locale

  • DescribeBotLocale- Sehen Sie sich die aktuelle VAD-Empfindlichkeitseinstellung an

Beispiel Einstellung der VAD-Empfindlichkeit mit AWS CLI
aws lexv2-models create-bot-locale \ --bot-id "AIDACKCEVSQ6C2EXAMPLE" \ --bot-version "DRAFT" \ --locale-id "en_US" \ --nlu-intent-confidence-threshold 0.40 \ --speech-detection-sensitivity "HighNoiseTolerance"

Bewährte Methoden für die VAD-Konfiguration

  • Testen Sie in Ihrer Zielumgebung — Konfigurieren Sie die VAD-Empfindlichkeit auf der Grundlage der tatsächlichen akustischen Bedingungen, unter denen Ihr Bot eingesetzt wird.

  • Mit Standard beginnen — Beginnen Sie mit der Standardeinstellung und passen Sie sie auf der Grundlage von Leistungstests und Benutzerfeedback an.

  • Leistung überwachen — Verwenden Sie Amazon Lex V2-Analysen und Konversationsprotokolle, um die Genauigkeit der Spracherkennung zu überwachen und die VAD-Empfindlichkeit nach Bedarf anzupassen.

  • Betrachten Sie den Anwendungsfall: Höhere Empfindlichkeitsstufen sind für laute Umgebungen von Vorteil, in kontrollierten Umgebungen wie Kundenservice-Centern mit Headsets jedoch möglicherweise nicht erforderlich.