Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Vorlagen
Vorlagen sind Artefakte, mit denen Sie Ihre Geschäftslogik für die Dateiverarbeitung konfigurieren können. Jede Vorlage besteht aus einer Liste von Feldnamen, die Sie extrahieren können, dem Datenformat, in dem die Antwort für das Feld extrahiert werden soll (z. B. Zeichenfolge, Zahl oder Boolean), sowie einem Kontext in natürlicher Sprache für jedes Feld, durch den Sie Regeln zur Datennormalisierung und Validierung angeben können. Sie können für jede Dateiklasse, die Sie verarbeiten möchten, eine Vorlage erstellen, beispielsweise für ein W2-Formular, eine Gehaltsabrechnung oder einen Ausweis. Vorlagen können mit der Konsole oder der API erstellt werden. Jeder Blueprint, den Sie erstellen, ist eine AWS Ressource mit eigener Blueprint-ID und ARN.
Wenn Sie eine Vorlage für die Extraktion verwenden, können Sie eine Katalog-Vorlage oder eine benutzerdefinierte Vorlage nutzen. Wenn Sie bereits wissen, aus welcher Art von Datei Sie extrahieren möchten, bieten Katalog-Vorlagen einen vordefinierten Ausgangspunkt. Sie können benutzerdefinierte Vorlagen für Dateien erstellen, die nicht im Katalog enthalten sind. Beim Erstellen einer Vorlage können Sie verschiedene Methoden verwenden. Sie können eine Vorlage über den Vorlagen-Prompt erstellen, Sie können ihn manuell erstellen, indem Sie individuelle Felder hinzufügen, oder Sie können den JSON-Code einer Vorlage mit dem JSON Editor erstellen. Diese können in Ihrem Konto gespeichert und geteilt werden.
Anmerkung
Audio-Vorlagen können nicht mit Vorlagen-Prompts erstellt werden.
Die maximale Größe einer Vorlage beträgt 100 000 Zeichen im JSON-Format. Für Blueprints, die mit der InvokeDataAutomationAsyncAPI verwendet werden sollen, beträgt die maximale Anzahl von Feldern pro Blueprint 100. Für Blueprints, die mit der InvokeDataAutomationAPI verwendet werden sollen, beträgt die maximale Anzahl von Feldern pro Blueprint 15.
Anmerkung
Wenn Sie Vorlagen verwenden, nutzen Sie vermutlich auch Prompts, entweder in Feldern oder für die Vorlagen-Erstellung. Erlauben Sie nur vertrauenswürdigen Quellen, die Eingabeaufforderung zu kontrollieren. Amazon Bedrockist nicht dafür verantwortlich, die Absicht des Blueprints zu überprüfen.
Detaillierte Vorlagen-Anleitung
Nehmen wir ein Ausweisdokument, beispielsweise einen Reisepass, als Bespiel und gehen wir die Vorlage für dieses Dokument Schritt für Schritt durch.
Hier ist eine Beispiel-Vorlage für dieses Ausweisdokument, den wir mit der Konsole erstellt haben.
Im Kern ist eine Vorlage eine Datenstruktur, die Felder enthält, die wiederum die von der benutzerdefinierten BDA-Ausgabe extrahierten Informationen enthalten. Es gibt zwei Arten von Feldern – Explizite und implizite –, die sich in der Extraktionstabelle befinden. Explizite Extraktionen werden für klar formulierte Informationen verwendet, die im Dokument ersichtlich sind. Implizite Extraktionen werden für Informationen verwendet, die aufgrund ihrer Darstellung im Dokument transformiert werden müssen. Sie können beispielsweise die Bindestriche aus einer Sozialversicherungsnummer entfernen und so 111-22-3333 in 111223333 konvertieren. Felder enthalten bestimmte grundlegende Komponenten:
-
Feldname: Dies ist ein Name, den Sie für jedes Feld angeben können, das Sie aus dem Dokument extrahieren möchten. Sie können den Namen verwenden, den Sie für das Feld in ihrem nachgelagerten System nutzen, beispielsweise
Place_BirthoderPlace_of_birth. -
Beschreibung: Dies ist eine Eingabe, die für jedes Feld in der Vorlage Kontext in natürlicher Sprache bereitstellt, um die einzuhaltenden Regeln zur Datennormalisierung oder Validierung zu beschreiben. Zum Beispiel
Date of birth in YYYY-MM-DD formatoderIs the year of birth before 1992?. Sie können den Prompt auch zum Iterieren der Vorlage und zum Verbessern der Genauigkeit der BDA-Antwort nutzen. Die Bereitstellung eines detaillierten Prompt, der das von Ihnen benötigte Feld beschreibt, unterstützt die zugrunde liegenden Modelle dabei, ihre Genauigkeit zu verbessern. Prompts können bis zu 300 Zeichen lang sein. -
Ergebnisse: Die von BDA extrahierten Informationen, basierend auf dem Prompt und dem Feldnamen
-
Typ: Das Datenformat, das die Antwort für das Feld verwenden soll. Wir unterstützen Zeichenfolgen, Zahlen, boolesche Werte, Zeichenfolgen-Arrays und Zahlen-Arrays.
-
Konfidenzwert: Gibt in Prozent an, wie sicher sich die BDA-Funktion hinsichtlich der Genauigkeit Ihrer Extraktion ist. Audiovorlagen geben keinen Konfidenzwert zurück.
-
Extraktionstypen: Die Art der Extraktion, entweder explizit oder abgeleitet
-
Seitennummer: Die Seite des Dokuments, auf der das Ergebnis gefunden wurde. Audio- und Videovorlagen geben keine Seitenzahlen zurück.
Neben einfachen Feldern bietet die benutzerdefinierte BDA-Ausgabe auch mehrere Optionen für Anwendungsfälle, auf die Sie möglicherweise bei der Dokumentextraktion stoßen: Tabellenfelder, Gruppen und benutzerdefinierte Typen.
Tabellenfelder
Wenn Sie ein Feld erstellen, können Sie sich dafür entscheiden, anstelle eines Basisfelds ein Tabellenfeld zu erstellen. Sie können dieses Feld genau wie die anderen auch benennen und einen Prompt bereitstellen. Sie können auch Spaltenfelder angeben. Diese Felder haben einen Spaltennamen, eine Spaltenbeschreibung und einen Spaltentyp. Wenn ein Tabellenfeld in der Extraktionstabelle angezeigt wird, sind die Spaltenergebnisse unterhalb des Tabellennamens gruppiert. Tabellenfelder können maximal 15 Unterfelder haben.
Gruppen
Eine Gruppe ist eine Struktur, die verwendet wird, um mehrere Ergebnisse innerhalb Ihrer Extraktion an einem zentralen Ort zu organisieren. Wenn Sie eine Gruppe erstellen, geben Sie der Gruppe einen Namen und können Felder in dieser Gruppe erstellen und platzieren. Diese Gruppe ist in Ihrer Extraktionstabelle markiert. Darunter werden die Felder aufgeführt, die sich in der Gruppe befinden.
Benutzerdefinierte Typen
Sie können einen benutzerdefinierten Typ erstellen, während Sie eine Vorlage im Blueprint-Playground bearbeiten. Jedes Feld kann ein benutzerdefinierter Typ sein. Dieser Typ hat einen eindeutigen Namen und veranlasst die Erstellung der Felder, aus denen die Erkennung besteht. Ein Beispiel hierfür wäre das Erstellen eines benutzerdefinierten Typs namens Address und das Aufnahmen der Felder „zip_code“, „city_name“, „street_name“ und „state“ in diesen. Dann könnten Sie bei der Bearbeitung eines Dokuments den benutzerdefinierten Typ in einem „company_address“-Feld verwenden. Dieses Feld gibt dann alle Informationen zurück, gruppiert in Zeilen unterhalb des benutzerdefinierten Typs. Sie können bis zu 30 benutzerdefinierte Felder pro Vorlage haben.