Projekte in Bedrock Data Automation - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Projekte in Bedrock Data Automation

Eine Möglichkeit, Dateien mit Amazon Bedrock Data Automation (BDA) zu verarbeiten, besteht darin, ein Projekt zu erstellen. Ein Projekt ist eine Gruppierung von Standard- und benutzerdefinierten Ausgabekonfigurationen. Standardausgaben sind in Projekten erforderlich, benutzerdefinierte Ausgaben sind jedoch optional. Wenn Sie die InvokeDataAutomationAsync-API mit einem Projekt-ARN aufrufen, wird die Datei automatisch mit den in diesem Projekt definierten Konfigurationseinstellungen verarbeitet. Die Ausgabe wird dann basierend auf der Konfiguration des Projekts generiert.

Einem Projekt kann eine Phase zugewiesen werden, LIVE oder DEVELOPMENT. Jede Phase ist eine eindeutige und veränderbare Version des Projekts. Das bedeutet, dass Sie die DEVELOPMENT-Phase für Bearbeitungen oder Tests verwenden und in der LIVE-Phase Kundenanfragen verarbeiten können. DEVELOPMENT-Projekte können nicht in der Konsole aufgerufen werden und müssen über die API geändert und aufgerufen werden.

Ein Projekt ermöglicht es Ihnen, eine einzelne Ressource für mehrere Dateitypen zu verwenden. Beispielsweise wird eine Audiodatei, die mit dem Projektnamen „ABC“ an BDA gesendet wird, mit der Standard-Audioausgabekonfiguration des Projekts „ABC“ verarbeitet. Ein Dokument, Das mit dem Projektnamen „ABC“ an BDA gesendet wird, wird mit der Standard-Ausgabekonfiguration für Dokumente des Projekts „ABC“ verarbeitet.

Projekte bieten Ihnen mehr Flexibilität bei der Einrichtung von Standardausgaben. Jede Standardausgabe hat ihre eigenen konfigurierbaren Optionen, z. B. Transkripte oder Zusammenfassungen, und Projekte ermöglichen es Ihnen, diese Optionen so zu ändern, dass sie besser zu Ihrem Anwendungsfall passen. Sie können ein Projekt auch mit Vorlagen für Dokumente, Audio und Bilder konfigurieren, um eine benutzerdefinierte Ausgabe zu definieren. Ein Projekt, das für die Generierung einer benutzerdefinierten Ausgabe konfiguriert ist, generiert automatisch auch eine Standardausgabe.

In den folgenden Abschnitten werden einige Beispiele für die Verwendung von Projekten beschrieben.

Verwenden von Projekten mit der Standardausgabe

Betrachten Sie einen Anwendungsfall, in dem Sie nur Transkript-Zusammenfassungen Ihrer vollständigen Audio- und Videodateien extrahieren möchten. Wenn Sie Audio- und Videodateien an BDA senden, erhalten Sie standardmäßig die Transkript-Zusammenfassungen zusammen mit vollständigen Transkripten, Zusammenfassungen auf Szenenebene, erkanntem Text und anderen Informationen. Für diesen Anwendungsfall möchten Sie nicht die zusätzliche Zeit und Ressourcen aufwenden, um Informationen zu erfassen, die Sie nicht benötigen. Also können Sie für diesen Anwendungsfall ein Standardausgabeprojekt so konfigurieren, dass nur die Zusammenfassungsfunktion für Audio- und Videodateien aktiviert wird.

Erstellen Sie dazu mithilfe der API oder in der Konsole ein Projekt und ändern Sie die Standardausgabeeinstellungen für Audio und Video. Aktivieren Sie für Videos die Option Zusammenfassung des gesamten Videos, stellen Sie jedoch sicher, dass andere Extraktionen (z. B. vollständiges Audio-Transkript, Szenenzusammenfassungen, Inhaltsmoderation usw.) deaktiviert sind. Wiederholen Sie diese Konfiguration für Audioinhalte. Nachdem Sie das Projekt so konfiguriert haben, dass nur Zusammenfassungen generiert werden, speichern Sie das Projekt und notieren Sie sich seinen Amazon-Ressourcennamen (ARN). Dieser ARN kann für die InvokeDataAutomationAsync-Operation verwendet werden, um Dateien in großem Umfang zu verarbeiten. Wenn Sie eine Audio- oder Videodatei an BDA übergeben und den Projekt-ARN angeben, erhalten Sie als Ausgabe nur die Zusammenfassungen für jede der Dateien. Beachten Sie, dass in diesem Beispiel keine Konfiguration für Dokumente oder Bilder durchgeführt wurde. Das bedeutet, dass Sie, wenn Sie ein Bild oder Dokument mit diesem Projekt-ARN an BDA übergeben, für diese Dateitypen die Standardausgabe erhalten.

Verwenden von Projekten mit benutzerdefinierter Ausgabe und Standardausgabe

Gehen wir für diesen Anwendungsfall davon aus, dass Sie Standardausgabe-Zusammenfassungen für Dokumente und Audiodateien generieren und außerdem benutzerdefinierte Felder aus Ihren Dokumenten extrahieren möchten. Nachdem Sie ein Projekt erstellt haben, konfigurieren Sie die Standardausgabe für Audio so, dass Vollständige Audiozusammenfassung aktiviert ist, und stellen Sie sicher, dass andere Extraktionen nicht aktiviert sind. Wiederholen Sie diese Konfiguration der Standardausgabe für Dokumente. Anschließend können Sie die benutzerdefinierte Ausgabe für Dokumente konfigurieren, indem Sie eine neue Vorlage oder eine bereits vorhandene Vorlage aus dem globalen BDA-Katalog hinzufügen. Für Dokumente, die mit diesem Projekt-ARN an BDA übergeben werden, werden die Zusammenfassungen des vollständigen Dokuments der Standardausgabe und die Ausgabe der Vorlage für die definierten benutzerdefinierten Felder generiert. Für Audiodateien, die mit diesem Projekt-ARN an BDA übergeben werden, werden vollständige Zusammenfassungen generiert.

Bei der Verarbeitung von Dokumenten sollten Sie möglicherweise mehrere Vorlagen für verschiedene Arten von Dokumenten verwenden, die an Ihr Projekt übergeben werden. An ein Projekt können bis zu 40 Dokumentvorlagen angehängt werden. BDA ordnet Ihre Dokumente automatisch der entsprechenden Vorlage zu, die in Ihrem Projekt konfiguriert ist, und generiert anhand dieser Vorlage eine benutzerdefinierte Ausgabe. Außerdem können Sie auch mehrere Dokumente gleichzeitig übergeben. Wenn Sie eine Datei übergeben, die mehrere Dokumente enthält, können Sie das Dokument bei der Erstellung Ihres Projekts aufteilen. Falls Sie sich dafür entscheiden, scannt BDA die Datei und teilt sie je nach Kontext in einzelne Dokumente auf. Diese einzelnen Dokumente werden dann zur Verarbeitung der passenden Vorlage zugeordnet.

Derzeit wird für Bilder nur eine Vorlagendefinition pro Projekt unterstützt. Die Bilddateitypen JPG und PNG können aufgrund ihres Inhalts als Bilder oder als gescannte Dokumente behandelt werden. Wir empfehlen Ihnen, bei der Verarbeitung der benutzerdefinierten Ausgabe für Dokumente eine benutzerdefinierte Vorlage für Bilder zu erstellen, damit BDA die gewünschte Ausgabe für Bilddateien bereitstellt, die Text enthalten.

Für Audiodateien wird ebenfalls nur eine Vorlagendefinition pro Projekt unterstützt.