Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Dokumente
Mit der Standardausgabe für Dokumente können Sie die Granularität der Antwort festlegen, an der Sie interessiert sind, sowie das Ausgabeformat und das Textformat für die Ausgabe festlegen. Im Folgenden finden Sie einige der Ausgaben, die Sie aktivieren können.
Anmerkung
BDA kann DOCX-Dateien verarbeiten. Um DOCX-Dateien zu verarbeiten, werden sie konvertiert in PDFs. Das bedeutet, dass die Zuordnung von Seitenzahlen für DOCX-Dateien nicht funktioniert. Bilder der konvertierten Datei PDFs werden in Ihren Ausgabe-Bucket hochgeladen, wenn die Option JSON+ und die Seitengranularität ausgewählt sind.
Antwortgranularität
Die Granularität der Antwort bestimmt, welche Art von Antwort Sie bei der Textextraktion eines Dokuments erhalten möchten. Mit jeder Granularitätsebene erhalten Sie mehr separate Antworten, wobei mit „Seite“ der gesamte extrahierte Text zusammen bereitgestellt wird und mit „Wort“ jedes Wort als separate Antwort angezeigt wird. Dies sind die verfügbaren Granularitätsstufen:
-
Granularität auf Seitenebene – Dies ist standardmäßig aktiviert. Durch die Granularität auf Seitenebene wird jede Seite des Dokuments im von Ihnen ausgewählten Textausgabeformat bereitgestellt. Wenn Sie eine PDF-Datei verarbeiten und diese Granularitätsebene aktiviert ist, werden eingebettete Hyperlinks erkannt und zurückgegeben.
-
Granularität auf Elementebene (Layout) – Diese Option ist standardmäßig aktiviert. Stellt den Text des Dokuments im von Ihnen ausgewählten Ausgabeformat bereit, aufgeteilt in verschiedene Elemente. Diese Elemente, z. B. Abbildungen, Tabellen oder Absätze, werden in logischer Lesereihenfolge zurückgegeben, die auf der Struktur des Dokuments basiert. Wenn Sie eine PDF-Datei verarbeiten und diese Granularitätsebene aktiviert ist, werden eingebettete Hyperlinks erkannt und zurückgegeben.
-
Granularität auf Wortebene – Stellt Informationen zu einzelnen Wörtern bereit, ohne dass eine umfassendere Kontextanalyse verwendet wird. Es werden jedes Wort und seine Position auf der Seite bereitgestellt.
Ausgabeeinstellungen
Die Ausgabeeinstellungen bestimmen, wie die heruntergeladenen Ergebnisse strukturiert werden. Diese Einstellung gilt ausschließlich für die Konsole. Dies sind die Optionen für die Ausgabeeinstellungen:
-
JSON – Die Standardausgabestruktur für die Dokumentenanalyse. Stellt eine JSON-Ausgabedatei mit den Informationen aus Ihren Konfigurationseinstellungen bereit.
-
Asynchrone InvokeDataAutomationAsyncAPI: Die JSON-Ausgabe für die Async-API erfolgt nur in S3.
-
InvokeDataAutomationSync-API: Die JSON-Ausgabe kann durch Leveraging auf S3 oder Inline gesetzt werden.
outputconfigurationWenn S3 ausgewählt ist, geht die JSON-Ausgabe nur an S3 (nicht Inline). Wenn S3 nicht bereitgestellt wird, unterstützt die Sync-API-Ausgabe nur JSON inline.
-
-
JSON+-Dateien — Nur für Async-API verfügbar. InvokeDataAutomationAsync Mit dieser Einstellung werden sowohl eine JSON-Ausgabe als auch Dateien generiert, die unterschiedlichen Ausgaben entsprechen. Mit dieser Einstellung erhalten Sie beispielsweise eine Textdatei für die gesamte Textextraktion, eine Markdown-Datei für den Text mit strukturellem Markdown und CSV-Dateien für jede Tabelle, die im Text gefunden wird. Abbildungen in einem Dokument werden ebenso gespeichert wie zugeschnittene Abbildungen und korrigierte Bilder. Wenn Sie eine DOCX-Datei verarbeiten und diese Option ausgewählt haben, wird außerdem die konvertierte PDF-Datei Ihrer DOCX-Datei im Ausgabeordner gespeichert. Diese Ausgaben befinden sich in
standard_output/in Ihrem Ausgabeordner.logical_doc_id/assets/
Anmerkung
-
Die Sync-API gibt außer der JSON-Datei keine weiteren Dateien aus. Das Ausgabe-JSON enthält nur das Textformat, das als Teil des Standardausgabetextformats ausgewählt wurde. Die Sync-API gibt keine Bildausschnitte oder korrigierte Bilder aus.
-
DocX wird von der Sync-API nicht unterstützt.
Textformat
Das Textformat bestimmt die verschiedenen Arten von Text, die über verschiedene Extraktionsvorgänge bereitgestellt werden. Sie können eine beliebige Anzahl der folgenden Optionen für Ihr Textformat auswählen.
-
Klartext – Diese Einstellung ermöglicht eine reine Textausgabe ohne Angabe von Formatierungs- oder anderen Markdown-Elementen.
-
Text mit Markdown – Die Standardausgabeeinstellung für die Standardausgabe. Stellt Text mit integrierten Markdown-Elementen bereit.
-
Text mit HTML – Stellt Text mit HTML-Elementen bereit, die in die Antwort integriert sind.
-
CSV – Stellt eine strukturierte CSV-Ausgabe für Tabellen innerhalb des Dokuments bereit. Dies gibt nur eine Antwort für Tabellen und nicht für andere Elemente des Dokuments zurück.
Begrenzungsrahmen und generative Felder
Für Dokumente gibt es zwei Antwortoptionen, deren Ausgabe auf der Grundlage der ausgewählten Granularität geändert wird. Dies sind Begrenzungsrahmen und generative Felder. Wenn Sie „Begrenzungsrahmen“ auswählen, erhalten Sie eine visuelle Markierung des Elements oder Worts, auf das Sie in der Dropdown-Liste der Konsolenantwort klicken. Auf diese Weise können Sie bestimmte Elemente Ihrer Antwort leichter finden. Begrenzungsrahmen werden in Ihrem JSON-Code als Koordinaten der vier Ecken des Felds zurückgegeben.
Wenn Sie „Generative Felder“ auswählen, wird eine Zusammenfassung des Dokuments generiert, sowohl in einer Version mit 10 Wörtern als auch in einer Version mit 250 Wörtern. Wenn Sie dann Elemente als Antwortgranularität auswählen, generieren Sie für jede im Dokument gefundene Abbildung eine beschreibende Überschrift. Zu Abbildungen gehören z. B. Diagramme, Grafiken und Bilder.
JSON für zusätzliche Dateiformat-Metadaten
Wenn Sie Ihre zusätzlichen Dateien über das Flag „Zusätzliche Dateiformate“ erhalten, erhalten Sie eine JSON-Datei für alle entschlüsselten Bilder, die extrahiert wurden. BDA korrigiert gedrehte Bilder, indem es eine Homographie verwendet, um das Bild in einem 90-Grad-Winkel zu drehen. Ein JSON-Beispiel finden Sie unten:
"asset_metadata": { "rectified_image": "s3://bucket/prefix.png", "rectified_image_width_pixels": 1700, "rectified_image_height_pixels": 2200, "corners": [ [ 0.006980135689736235, -0.061692718505859376 ], [ 1.10847711439684, 0.00673927116394043 ], [ 0.994479346419327, 1.050548828125 ], [ -0.11249661383904497, 0.9942819010416667 ] ] }
Ecken stehen für die erkannten Ecken eines Bilds, anhand derer eine Homographie des Dokuments erstellt wird. Diese Homographie wird verwendet, um das Bild zu drehen und gleichzeitig seine anderen Eigenschaften beizubehalten.