View a markdown version of this page

Bibliothek zur Datenautomatisierung - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bibliothek zur Datenautomatisierung

Mit der AWS Bedrock Data Automation Library können Sie das Verständnis von BDA für Ihre Inhalte verbessern und genauere Erkenntnisse aus Ihren Daten gewinnen. Eine Data Automation Library dient als Container, der Entitäten speichert und mit BDA-Projekten verknüpft werden kann, um die Extraktionsgenauigkeit für mehrere Entitätstypen und Modalitäten für Ihre spezifischen Anwendungsfälle zu verbessern. Derzeit unterstützt die Data Automation Library benutzerdefiniertes Vokabular, um die Extraktionsgenauigkeit für Audio- und Videoinhalte zu verbessern. Einschränkungen im Zusammenhang mit dieser Funktion finden Sie auf der Seite Kontingente und Beschränkungen.

Wichtigste Vorteile

  1. Verbesserte Genauigkeit: Passen Sie die Erkennung an Ihre spezifischen Bedürfnisse an.

  2. Modalitätsübergreifende Unterstützung: Verbessern Sie die Audio- und Videoanalyse.

  3. Flexibles Management: Einfache Erstellung, Aktualisierung und Zuordnung zu Projekten.

  4. Wiederverwendbare Ressourcen: Erstellen Sie Bibliotheken einmal und verwenden Sie sie für mehrere Projekte.

  5. Einfache Integration: Einfacher API-gesteuerter Workflow für die Bibliotheksverwaltung.

So funktioniert die Datenautomatisierungsbibliothek

Sie können eine Datenautomatisierungsbibliothek erstellen und sie mit domänenspezifischen Entitäten füllen, sodass BDA Ihr benutzerdefiniertes Wissen bei der Inhaltsverarbeitung anwenden und die Extraktionsgenauigkeit in Ihren Anwendungsfällen verbessern kann. Sie können eine Bibliothek einem BDA-Projekt zuordnen, sodass alle im Rahmen dieses Projekts verarbeiteten Jobs automatisch die Entitäten der Bibliothek nutzen können, ohne dass eine zusätzliche Konfiguration pro Job erforderlich ist.

Wenn die Aufnahme abgeschlossen ist, wird ein Ordner mit dem Namen der Job-ID in der S3-URI erstellt, die in der Aufnahme-API-Anfrage angegeben ist. Sowohl das Eingabemanifest als auch die endgültigen Aufnahmeergebnisse werden in diesen Ordner hochgeladen. Wenn beispielsweise der in der Anfrage angegebene Ausgabe-Bucket s3://my-bucket/outputs/ und die jobId das Eingabemanifest ist 328c43e7-d226-41c9-9acb-e71a37022b99 und die endgültigen Aufnahmeergebnisse hochgeladen werden s3://my-bucket/outputs/328c43e7-d226-41c9-9acb-e71a37022b99

Grundlegender Arbeitsablauf:

  1. Bibliothek erstellen — Wird verwendet CreateDataAutomationLibrary, um einen leeren Bibliothekscontainer zu initialisieren.

  2. Entitäten zu Ihrer Bibliothek hinzufügen — Verwenden Sie diese Option InvokeDataAutomationLibraryIngestionJob, um Ihre domänenspezifischen Entitäten hinzuzufügen.

  3. Die Bibliothek einem Projekt zuordnen — Verknüpfen Sie die Bibliothek während der Projekterstellung mit CreateDataAutomationProjectoder aktualisieren Sie ein vorhandenes Projekt mit. UpdateDataAutomationProject

  4. Verarbeiten Sie Ihre Inhalte — Führen Sie Jobs InvokeDataAutomationAsyncmithilfe des zugehörigen Projekts aus, um eine verbesserte Extraktionsgenauigkeit auf Ihre gesamten Inhalte anzuwenden.

Die wichtigsten Konzepte

Bibliothek zur Datenautomatisierung

Ein Container, der Entitäten eines oder mehrerer Typen speichert. Bibliotheken können an mehrere Data Automation-Projekte angehängt und für verschiedene Workloads wiederverwendet werden.

Entitätstyp der Datenautomatisierungsbibliothek

Der Typ des in der Bibliothek gespeicherten Inhalts. Derzeit wird nur der Entitätstyp VOCABULARY unterstützt.

Entität der Datenautomatisierungsbibliothek

Eine bestimmte Instanz innerhalb eines Entitätstyps. Bei Benutzerdefiniertem Wortschatz stellt eine Entität eine Sammlung von Wörtern und Ausdrücken für eine bestimmte Sprache dar.

Aufnahmejob für die Datenautomatisierungsbibliothek

Ein asynchroner Vorgang, der Entitäten in einer Bibliothek hinzufügt, aktualisiert oder löscht. Jobs werden sequentiell verarbeitet, um die Datenkonsistenz zu gewährleisten.

Zuordnung zum Projekt

Die Verbindung zwischen einer Bibliothek und einem BDA-Projekt. Wenn Sie eine Bibliothek mit einem Projekt verknüpfen, wenden alle im Rahmen dieses Projekts verarbeiteten Jobs die Entitäten der Bibliothek an, um die Extraktionsgenauigkeit Ihrer Inhalte zu verbessern. Beachten Sie, dass ein Projekt nur einer Bibliothek zugeordnet werden kann, eine Bibliothek jedoch mehreren Projekten zugeordnet werden kann.

Navigieren Sie in der BDA-Konsole zur Seite Data Automation Library

  1. Navigieren Sie zum Amazon Bedrock-Service.

  2. Wählen Sie im Seitenleistenmenü „Datenautomatisierung“ aus.

  3. Wählen Sie „Bibliotheken verwalten“

Regionale Verfügbarkeit

Die Data Automation Library ist in den folgenden AWS-Regionen verfügbar:

Name der Region

Regionscode

USA Ost (Nord-Virginia)

us-east-1

USA West (Oregon)

us-west-2

Europa (Irland)

eu-west-1

Europa (London)

eu-west-2

Europa (Frankfurt)

eu-central-1

Asien-Pazifik (Mumbai)

ap-south-1

Asien-Pazifik (Sydney)

ap-southeast-2