Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Multimodale Unterstützung für Amazon Nova
Amazon Nova Understanding Models sind multimodale Verständnismodelle, d. h. sie unterstützen multimodale Eingaben wie Bilder, Videos und Dokumente, um anhand der bereitgestellten Inhalte Fragen abzuleiten und zu beantworten. Die Amazon Nova-Modelle sind mit neuartigen Bildverarbeitungsfunktionen ausgestattet, die es dem Modell ermöglichen, Bilder, Dokumente und Videos zu verstehen und zu analysieren und so Anwendungsfälle für multimodales Verständnis zu realisieren.
Im folgenden Abschnitt werden Richtlinien für die Arbeit mit Bildern, Dokumenten und Videos in Amazon Nova beschrieben. Dazu gehören die angewandten Vorverarbeitungsstrategien, Codebeispiele und relevante Einschränkungen, die es zu berücksichtigen gilt.
Themen
Unterstützter Inhaltstyp nach Modalität
Die folgenden Informationen beschreiben die von der Mediendatei unterstützten Dateiformate und die akzeptierte Eingabemethode.
Typ der Mediendatei |
Unterstützte Dateiformate |
Eingabemethode |
Strategie zum Analysieren |
---|---|---|---|
Image |
PNG, JPG, JPEG, GIF, WebP |
Base64 Amazon-S3-URI |
Bild, Sehen, Verstehen |
Text-Dokument (Nur Converse API) |
CSV, XLS, XLSX, HTML, TXT, MD, DOC |
Bytes Amazon-S3-URI |
Nur Textverständnis aus dem Dokument. |
Mediendokument (Nur Converse API) |
PDF, DOCX |
Bytes Amazon-S3-URI |
Text mit verschachteltem Bildverständnis |
Video |
MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP |
Base64 Amazon-S3-URI |
Verständnis von Videovision |
Anmerkung
Sie können bis zu fünf Dateien von Ihrem Computer oder 1000 Dateien von Amazon S3 hinzufügen. Jede Datei darf nicht mehr als 1 GB groß sein, wenn sie von Amazon S3 hochgeladen wird. Die Gesamtgröße der hochgeladenen Dateien darf 25 MB beim Hochladen von Ihrem Computer oder 2 GB beim Hochladen von Amazon S3 nicht überschreiten.
Da 25 MB das gesamte Nutzlastlimit sind, stellen Sie sicher, dass Sie den Base64-Overhead berücksichtigen. Denken Sie bei der Arbeit daran, dass Bibliotheken und Frameworks den Arbeitsspeicher beibehalten und sich übergebene Medieninhalte schnell summieren können. Bei der Verwendung von Video s3Location
sollte die Angabe von viele Speicherprobleme beheben.
Anmerkung
Die Verarbeitung großer Videos und Dokumente nimmt unabhängig von der Eingabemethode Zeit in Anspruch. Wenn das boto3 SDK beim Warten auf eine Antwort von eine Zeitüberschreitung eintritt, stellen Sie sicher Amazon Bedrock, dass Sie einen geeigneten read_timeout-Wert