Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Problembehebung multimodaler Wissensdatenbanken
Dieser Abschnitt enthält Anleitungen zur Lösung häufiger Probleme, die bei der Arbeit mit multimodalen Wissensdatenbanken auftreten. Die Informationen zur Fehlerbehebung sind nach allgemeinen Einschränkungen, häufigen Fehlerszenarien mit ihren Ursachen und Lösungen sowie Empfehlungen zur Leistungsoptimierung gegliedert. Verwenden Sie diese Informationen, um Probleme bei der Einrichtung, Aufnahme oder Abfrage Ihrer multimodalen Inhalte zu diagnostizieren und zu beheben.
Allgemeine Einschränkungen
Beachten Sie bei der Arbeit mit multimodalen Wissensdatenbanken die folgenden aktuellen Einschränkungen:
-
Dateigrößenbeschränkungen: Maximal 1,5 GB pro Videodatei, 1 GB pro Audiodatei (Nova Multimodal Embeddings) oder 1,5 GB pro Datei (BDA)
-
Dateien pro Aufnahmeauftrag: Maximal 15.000 Dateien pro Auftrag (Nova Multimodal Embeddings) oder 1.000 Dateien pro Auftrag (BDA)
-
Abfragegrenzwerte: Maximal ein Bild pro Abfrage
-
Einschränkungen bei Datenquellen: Nur Amazon S3 und benutzerdefinierte Datenquellen unterstützen multimodale Inhalte
-
Einschränkungen beim BDA-Chunking: Wenn Sie Bedrock Data Automation mit Chunking mit fester Größe verwenden, werden die Einstellungen für den Prozentsatz der Überlappung nicht auf Audio- und Videoinhalte angewendet
-
Grenzwerte für gleichzeitige BDA-Jobs: Standardlimit von 20 gleichzeitigen BDA-Jobs. Bei umfangreicher Verarbeitung sollten Sie erwägen, eine Erhöhung des Servicekontingents zu beantragen
-
Einschränkungen des Reranker-Modells: Reranker-Modelle werden für multimodale Inhalte nicht unterstützt
-
Einschränkungen bei der Zusammenfassung: Die Zusammenfassung von Abruf-Antworten, die Nicht-Text-Inhalte enthalten, wird nicht unterstützt
-
Einschränkungen bei der Abfrageeingabe: Eingaben, die sowohl Text als auch Bild enthalten, werden derzeit nicht unterstützt. Sie können entweder Text- oder Bildabfragen verwenden, aber nicht beide gleichzeitig.
-
Guardrail-Bildinhaltsfilter: Wenn Sie Bildabfragen mit einer Leitplanke verwenden, für die Bildinhaltsfilter konfiguriert sind, wird das Eingabebild anhand der Leitplanke bewertet und kann blockiert werden, wenn es die konfigurierten Filtergrenzwerte verletzt
-
Eingabe und Typ stimmen nicht überein: Standardmäßig wird davon ausgegangen, dass es sich bei der Eingabe um Text handelt, wenn der Typ nicht angegeben ist. Wenn Sie andere Modalitäten als Text verwenden, müssen Sie den richtigen Typ angeben
Häufige Fehler und Lösungen
Wenn Sie Probleme mit Ihrer multimodalen Wissensdatenbank haben, sehen Sie sich diese häufigen Szenarien an:
- 4xx-Fehler bei der Verwendung von Bildabfragen
-
Ursache: Es wurde versucht, Bildabfragen mit reinen Texteinbettungsmodellen oder mit BDA verarbeiteten Wissensdatenbanken zu verwenden.
Lösung: Wählen Sie Amazon Nova Multimodal Embeddings, wenn Sie Ihre Wissensdatenbank für die Unterstützung von Bildabfragen erstellen.
- RAG gibt bei multimodalem Inhalt den Fehler 4xx zurück
-
Ursache: Verwendung
RetrieveAndGeneratemit einer Wissensdatenbank, die nur multimodalen Inhalt enthält, und dem Amazon Nova Multimodal Embeddings-Modell.Lösung: Verwenden Sie den BDA-Parser für die RAG-Funktionalität, oder stellen Sie sicher, dass Ihre Wissensdatenbank Textinhalte enthält.
- Fehler: Multimodales Speicherziel erforderlich
-
Ursache: Verwendung von Nova Multimodal Embeddings ohne Konfiguration eines multimodalen Speicherziels.
Lösung: Geben Sie ein multimodales Speicherziel an, wenn Sie Nova Multimodal Embeddings verwenden.
- Datenquelle und multimodaler Speicher verwenden denselben S3-Bucket
-
Ursache: Konfiguration Ihrer Datenquelle und Ihres multimodalen Speicherziels für die Verwendung desselben Amazon S3 S3-Buckets ohne korrekte Inklusionspräfixe.
Lösung: Verwenden Sie entweder separate Buckets für die Datenquelle und den multimodalen Speicher oder konfigurieren Sie Inklusionspräfixe, um zu verhindern, dass extrahierte Mediendateien erneut aufgenommen werden.
- Das Inklusionspräfix darf nicht mit „aws/“ beginnen
-
Ursache: Es wird ein Inklusionspräfix verwendet, das mit „aws/“ beginnt, wenn Ihre Datenquelle und Ihr multimodales Speicherziel denselben Amazon S3 S3-Bucket verwenden.
Lösung: Geben Sie ein anderes Inklusionspräfix an. Der Pfad „aws/“ ist für die Speicherung extrahierter Medien reserviert und kann nicht als Inklusionspräfix verwendet werden, um zu verhindern, dass verarbeitete Inhalte erneut aufgenommen werden.
- Bei der BDA-Aufnahme werden multimodale Inhalte übersprungen
-
Ursache: Die Wissensdatenbank wurde ohne ein multimodales Speicherziel erstellt, dann wurde die BDA-Datenquelle mit multimodalem Inhalt hinzugefügt.
Lösung: Erstellen Sie die Wissensdatenbank mit einem multimodalen Speicherziel neu, das so konfiguriert ist, dass es die BDA-Verarbeitung von Audio-, Video- und Bilddateien ermöglicht.
- Die Wissensdatenbank wurde ohne multimodales Einbettungsmodell erstellt
-
Ursache: Die Wissensdatenbank wurde mit einem reinen Texteinbettungsmodell erstellt, wodurch die multimodalen Funktionen eingeschränkt wurden.
Lösung: Erstellen Sie mit Nova Multimodal Embeddings eine neue Wissensdatenbank, um native multimodale Verarbeitung und bildbasierte Abfragen zu ermöglichen.
Verwaltung vorübergehender Daten mit Amazon S3 S3-Lebenszyklusrichtlinien
Wenn Sie Nova Multimodal Embeddings verwenden, speichert Amazon Bedrock transiente Daten in Ihrem multimodalen Speicherziel und versucht, sie nach Abschluss der Verarbeitung zu löschen. Wir empfehlen, eine Lebenszyklusrichtlinie für den transienten Datenpfad anzuwenden, um sicherzustellen, dass er ordnungsgemäß abgelaufen ist.
Weitere Informationen zu den Lebenszyklusrichtlinien von Amazon S3 finden Sie unter Verwaltung des Lebenszyklus von Objekten im Amazon S3 S3-Benutzerhandbuch.
Leistungsaspekte
Um eine optimale Leistung Ihrer multimodalen Wissensdatenbank zu erzielen, sollten Sie die folgenden Faktoren berücksichtigen:
-
Verarbeitungszeit: Die BDA-Verarbeitung dauert aufgrund der Inhaltskonvertierung länger
-
Abfragelatenz: Bildanfragen haben möglicherweise eine höhere Latenz als Textabfragen
-
Dauer des Chunkings: Längere Audio-/Video-Chunk-Dauern erhöhen die Verarbeitungszeit, können aber die Genauigkeit verbessern