View a markdown version of this page

Benutzerdefiniertes Vokabular - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Benutzerdefiniertes Vokabular

Sie können domänenspezifische Wörter und Ausdrücke pro Sprache angeben, sodass BDA die Extraktionsgenauigkeit für Ihre Audio- und Videoinhalte verbessern kann. Sie können für Ihre Branche oder Ihr Fachgebiet spezifische Terminologie wie Markennamen, Akronyme, Eigennamen und Fachbegriffe angeben, sodass BDA diese Begriffe erkennen und aus Ihren verarbeiteten Inhalten präzise extrahieren kann.

Wichtig

Sie sind für die Integrität Ihrer eigenen Daten verantwortlich, wenn Sie die Bedrock Data Automation Library verwenden. Geben Sie keine vertraulichen Daten, personenbezogene Daten (PII) oder geschützte Gesundheitsinformationen (PHI) in ein benutzerdefiniertes Vokabular ein.

Die Liste der unterstützten Sprachen für Custom Vocabulary finden Sie hier. Beachten Sie, dass nur die im Zeichensatz Ihrer Sprache aufgeführten Zeichen in einem benutzerdefinierten Vokabular verwendet werden können.

Wie benutzt man?

Sie können Benutzerdefiniertes Vokabular in Ihrem BDA-Projekt verwenden, indem Sie eine Datenautomatisierungsbibliothek erstellen, domänenspezifisches Vokabular entities/lists für Ihre Zielsprache hinzufügen und die Bibliothek während der Projekterstellung Ihrem Projekt zuordnen oder indem Sie ein vorhandenes Projekt aktualisieren, sodass alle Audio- und Videoverarbeitungsjobs, die über dieses Projekt ausgeführt werden, Ihr benutzerdefiniertes Vokabular anwenden können. Dies führt zu einer verbesserten Extraktionsgenauigkeit für Ihre domänenspezifischen Begriffe sowohl in der Standardausgabe als auch in der benutzerdefinierten Blueprint-Ausgabe.

Überlegungen zur Verwendung von benutzerdefiniertem Wortschatz:

  • Konzentrieren Sie sich auf domänenspezifische Begriffe, die häufig falsch erkannt werden

  • Fügen Sie häufig verwendete Varianten und Schreibweisen wichtiger Begriffe hinzu

  • Organisieren Sie den Wortschatz nach Sprachen, um ihn besser verwalten zu können

  • Priorisieren Sie branchenspezifischen Jargon- und Fachbegriffen

  • Fügen Sie Akronyme und Abkürzungen hinzu, die in Ihrer Domain häufig verwendet werden