Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verstehen von Dokumenten
Anmerkung
Diese Dokumentation bezieht sich auf Amazon Nova Version 1. Den Leitfaden zum Verständnis von Amazon Nova 2-Dokumenten finden Sie unter Document Understanding.
Die Funktion zum Verstehen von Dokumenten von Amazon Nova ermöglicht es IhnenPDFs, ganze Dokumente (Word-Dateien, Tabellen usw.) in Ihre Aufforderung aufzunehmen und Fragen oder Anfragen zu deren Inhalt zu stellen. Die multimodalen Verständnismodelle von Nova (Lite, Pro, Premier) können sowohl den Text als auch die visuellen Elemente (wie Diagramme oder Tabellen) in diesen Dokumenten interpretieren. Dies ermöglicht Anwendungsfälle wie die Beantwortung von Fragen, die Zusammenfassung und Analyse umfangreicher Berichte oder gescannter Dokumente. Zu den wichtigsten Funktionen gehören ein sehr großes Kontextfenster (1—2 Mio. Tokens) für umfangreiche Dokumente und die Möglichkeit, mehrere Dokumente in einer Abfrage zu verarbeiten.
Amazon Nova unterscheidet zwischen zwei Arten von Dokumenteneingaben:
-
Textbasierte Dokumenttypen (z. B. TXT, CSV, Markdown, HTML, DOC): Diese werden hauptsächlich aufgrund ihres Textinhalts verarbeitet. Nova wird sich darauf konzentrieren, den Text in diesen Dokumenten zu verstehen und Informationen daraus zu extrahieren.
-
Medienbasierte Dokumenttypen (z. B. PDF, DOCX): Diese Dateien können komplexe Layouts, Bilder, Diagramme oder eingebettete Grafiken enthalten. Bei medienbasierten Dokumenten verarbeitet Nova sowohl die visuellen als auch die textuellen Elemente. Nova verwendet visuelles Verständnis, um visuelle Inhalte — wie Diagramme, Tabellen, Diagramme oder Screenshots — zusammen mit dem Text des Dokuments zu interpretieren.
JPEG2000 und JBIG2 werden in PDF-Dateien in Amazon Nova nicht unterstützt.
Zu den unterstützten Dateiformaten gehören gängige Dokumenttypen: Nur-Text- und strukturierte Textdateien (CSV, TXT), Tabellenkalkulationen (XLS/XLSX), HTML/Markdown, Word documents (DOC/DOCX) und PDF-Dateien. Für Bilder in Dokumenten werden Standardbildformate (PNG, JPG, GIF, WebP) verarbeitet, obwohl sie bestimmte Bildkodierungen (CYMK, SVG) PDFs enthalten, nicht unterstützt werden.
| Einschränkung | Limit |
|---|---|
|
Maximale Anzahl von Dokumenten |
Bis zu 5 Dokumente pro Anfrage (gilt sowohl für den direkten Upload als auch für Amazon S3) |
|
Textbasierte Dokumentengröße |
Jedes Textdokument (z. B. .txt, .csv, .md, .html, .doc) muss ≤ 4,5 MB groß sein |
|
Medienbasierte Dokumentgröße |
Für PDF- und DOCX-Dateien gibt es keine individuelle Dateigrößenbeschränkung, aber:
|
|
PDF-Inhalte werden nicht unterstützt |
PDFs Bilder, die CMYK-Farbprofile oder SVG-Bilder enthalten, werden nicht unterstützt |