Multimodale Unterstützung für Amazon Nova - Amazon Nova

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Multimodale Unterstützung für Amazon Nova

Amazon Nova Understanding Models sind multimodale Verständnismodelle, d. h. sie unterstützen multimodale Eingaben wie Bilder, Videos und Dokumente, um anhand der bereitgestellten Inhalte Fragen abzuleiten und zu beantworten. Die Amazon Nova-Modelle sind mit neuartigen Bildverarbeitungsfunktionen ausgestattet, die es dem Modell ermöglichen, Bilder, Dokumente und Videos zu verstehen und zu analysieren und so Anwendungsfälle für multimodales Verständnis zu realisieren.

Im folgenden Abschnitt werden Richtlinien für die Arbeit mit Bildern, Dokumenten und Videos in Amazon Nova beschrieben. Dazu gehören die angewandten Vorverarbeitungsstrategien, Codebeispiele und relevante Einschränkungen, die es zu berücksichtigen gilt.

Unterstützter Inhaltstyp nach Modalität

Die folgenden Informationen beschreiben die von der Mediendatei unterstützten Dateiformate und die akzeptierte Eingabemethode.

Typ der Mediendatei

Unterstützte Dateiformate

Eingabemethode

Strategie zum Analysieren

Image

PNG, JPG, JPEG, GIF, WebP

Base64

Amazon-S3-URI

Bild, Sehen, Verstehen

Text-Dokument

(Nur Converse API)

CSV, XLS, XLSX, HTML, TXT, MD, DOC

Bytes

Amazon-S3-URI

Nur Textverständnis aus dem Dokument.

Mediendokument

(Nur Converse API)

PDF, DOCX

Bytes

Amazon-S3-URI

Text mit verschachteltem Bildverständnis

Video

MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP

Base64

Amazon-S3-URI

Verständnis von Videovision

Anmerkung

Sie können bis zu fünf Dateien von Ihrem Computer oder 1000 Dateien von Amazon S3 hinzufügen. Jede Datei darf nicht mehr als 1 GB groß sein, wenn sie von Amazon S3 hochgeladen wird. Die Gesamtgröße der hochgeladenen Dateien darf 25 MB beim Hochladen von Ihrem Computer oder 2 GB beim Hochladen von Amazon S3 nicht überschreiten.

Da 25 MB das gesamte Nutzlastlimit sind, stellen Sie sicher, dass Sie den Base64-Overhead berücksichtigen. Denken Sie bei der Arbeit daran, dass Bibliotheken und Frameworks den Arbeitsspeicher beibehalten und sich übergebene Medieninhalte schnell summieren können. Bei der Verwendung von Video s3Location sollte die Angabe von viele Speicherprobleme beheben.

Anmerkung

Die Verarbeitung großer Videos und Dokumente nimmt unabhängig von der Eingabemethode Zeit in Anspruch. Wenn das boto3 SDK beim Warten auf eine Antwort von eine Zeitüberschreitung eintritt, stellen Sie sicher Amazon Bedrock, dass Sie einen geeigneten read_timeout-Wert gesetzt haben und boto3 auf mindestens Version 1.38 aktualisiert haben.