Problembehebung multimodaler Wissensdatenbanken - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Problembehebung multimodaler Wissensdatenbanken

Dieser Abschnitt enthält Anleitungen zur Lösung häufiger Probleme, die bei der Arbeit mit multimodalen Wissensdatenbanken auftreten. Die Informationen zur Fehlerbehebung sind nach allgemeinen Einschränkungen, häufigen Fehlerszenarien mit ihren Ursachen und Lösungen sowie Empfehlungen zur Leistungsoptimierung gegliedert. Verwenden Sie diese Informationen, um Probleme bei der Einrichtung, Aufnahme oder Abfrage Ihrer multimodalen Inhalte zu diagnostizieren und zu beheben.

Allgemeine Einschränkungen

Beachten Sie bei der Arbeit mit multimodalen Wissensdatenbanken die folgenden aktuellen Einschränkungen:

  • Dateigrößenbeschränkungen: Maximal 1,5 GB pro Videodatei, 1 GB pro Audiodatei (Nova Multimodal Embeddings) oder 1,5 GB pro Datei (BDA)

  • Dateien pro Aufnahmeauftrag: Maximal 15.000 Dateien pro Auftrag (Nova Multimodal Embeddings) oder 1.000 Dateien pro Auftrag (BDA)

  • Abfragegrenzwerte: Maximal ein Bild pro Abfrage

  • Einschränkungen bei Datenquellen: Nur Amazon S3 und benutzerdefinierte Datenquellen unterstützen multimodale Inhalte

  • Einschränkungen beim BDA-Chunking: Wenn Sie Bedrock Data Automation mit Chunking mit fester Größe verwenden, werden die Einstellungen für den Prozentsatz der Überlappung nicht auf Audio- und Videoinhalte angewendet

  • Grenzwerte für gleichzeitige BDA-Jobs: Standardlimit von 20 gleichzeitigen BDA-Jobs. Bei umfangreicher Verarbeitung sollten Sie erwägen, eine Erhöhung des Servicekontingents zu beantragen

  • Einschränkungen des Reranker-Modells: Reranker-Modelle werden für multimodale Inhalte nicht unterstützt

  • Einschränkungen bei der Zusammenfassung: Die Zusammenfassung von Abruf-Antworten, die Nicht-Text-Inhalte enthalten, wird nicht unterstützt

  • Einschränkungen bei der Abfrageeingabe: Eingaben, die sowohl Text als auch Bild enthalten, werden derzeit nicht unterstützt. Sie können entweder Text- oder Bildabfragen verwenden, aber nicht beide gleichzeitig.

  • Guardrail-Bildinhaltsfilter: Wenn Sie Bildabfragen mit einer Leitplanke verwenden, für die Bildinhaltsfilter konfiguriert sind, wird das Eingabebild anhand der Leitplanke bewertet und kann blockiert werden, wenn es die konfigurierten Filtergrenzwerte verletzt

  • Eingabe und Typ stimmen nicht überein: Standardmäßig wird davon ausgegangen, dass es sich bei der Eingabe um Text handelt, wenn der Typ nicht angegeben ist. Wenn Sie andere Modalitäten als Text verwenden, müssen Sie den richtigen Typ angeben

Häufige Fehler und Lösungen

Wenn Sie Probleme mit Ihrer multimodalen Wissensdatenbank haben, sehen Sie sich diese häufigen Szenarien an:

4xx-Fehler bei der Verwendung von Bildabfragen

Ursache: Es wurde versucht, Bildabfragen mit reinen Texteinbettungsmodellen oder mit BDA verarbeiteten Wissensdatenbanken zu verwenden.

Lösung: Wählen Sie Amazon Nova Multimodal Embeddings, wenn Sie Ihre Wissensdatenbank für die Unterstützung von Bildabfragen erstellen.

RAG gibt bei multimodalem Inhalt den Fehler 4xx zurück

Ursache: Verwendung RetrieveAndGenerate mit einer Wissensdatenbank, die nur multimodalen Inhalt enthält, und dem Amazon Nova Multimodal Embeddings-Modell.

Lösung: Verwenden Sie den BDA-Parser für die RAG-Funktionalität, oder stellen Sie sicher, dass Ihre Wissensdatenbank Textinhalte enthält.

Fehler: Multimodales Speicherziel erforderlich

Ursache: Verwendung von Nova Multimodal Embeddings ohne Konfiguration eines multimodalen Speicherziels.

Lösung: Geben Sie ein multimodales Speicherziel an, wenn Sie Nova Multimodal Embeddings verwenden.

Datenquelle und multimodaler Speicher verwenden denselben S3-Bucket

Ursache: Konfiguration Ihrer Datenquelle und Ihres multimodalen Speicherziels für die Verwendung desselben Amazon S3 S3-Buckets ohne korrekte Inklusionspräfixe.

Lösung: Verwenden Sie entweder separate Buckets für die Datenquelle und den multimodalen Speicher oder konfigurieren Sie Inklusionspräfixe, um zu verhindern, dass extrahierte Mediendateien erneut aufgenommen werden.

Das Inklusionspräfix darf nicht mit „aws/“ beginnen

Ursache: Es wird ein Inklusionspräfix verwendet, das mit „aws/“ beginnt, wenn Ihre Datenquelle und Ihr multimodales Speicherziel denselben Amazon S3 S3-Bucket verwenden.

Lösung: Geben Sie ein anderes Inklusionspräfix an. Der Pfad „aws/“ ist für die Speicherung extrahierter Medien reserviert und kann nicht als Inklusionspräfix verwendet werden, um zu verhindern, dass verarbeitete Inhalte erneut aufgenommen werden.

Bei der BDA-Aufnahme werden multimodale Inhalte übersprungen

Ursache: Die Wissensdatenbank wurde ohne ein multimodales Speicherziel erstellt, dann wurde die BDA-Datenquelle mit multimodalem Inhalt hinzugefügt.

Lösung: Erstellen Sie die Wissensdatenbank mit einem multimodalen Speicherziel neu, das so konfiguriert ist, dass es die BDA-Verarbeitung von Audio-, Video- und Bilddateien ermöglicht.

Die Wissensdatenbank wurde ohne multimodales Einbettungsmodell erstellt

Ursache: Die Wissensdatenbank wurde mit einem reinen Texteinbettungsmodell erstellt, wodurch die multimodalen Funktionen eingeschränkt wurden.

Lösung: Erstellen Sie mit Nova Multimodal Embeddings eine neue Wissensdatenbank, um native multimodale Verarbeitung und bildbasierte Abfragen zu ermöglichen.

Verwaltung vorübergehender Daten mit Amazon S3 S3-Lebenszyklusrichtlinien

Wenn Sie Nova Multimodal Embeddings verwenden, speichert Amazon Bedrock transiente Daten in Ihrem multimodalen Speicherziel und versucht, sie nach Abschluss der Verarbeitung zu löschen. Wir empfehlen, eine Lebenszyklusrichtlinie für den transienten Datenpfad anzuwenden, um sicherzustellen, dass er ordnungsgemäß abgelaufen ist.

Console
Um eine Lebenszyklusregel mit der Konsole zu erstellen
  1. Öffnen Sie die Amazon S3-Konsole.

  2. Navigieren Sie zu dem multimodalen Speicherziel, das Sie für Ihre Knowledge Base konfiguriert haben.

  3. Wählen Sie die Registerkarte Verwaltung und dann Lebenszyklusregel erstellen aus.

  4. Geben Sie als Namen der Lebenszyklusregel einTransient Data Deletion.

  5. Wählen Sie unter Filtertyp die Option Den Geltungsbereich dieser Regel mithilfe eines oder mehrerer Filter einschränken aus.

  6. Geben Sie unter Präfix den transienten Datenpfad für Ihre Wissensdatenbank und Datenquelle ein.

    Ersetzen Sie die Platzhalterwerte im folgenden Präfix durch Ihre tatsächlichen Identifikatoren:

    aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data
    Wichtig

    Wenden Sie Lebenszyklusrichtlinien nicht auf den gesamten Bucket oder auf das Präfix „aws/“ an, da dadurch Ihr multimodaler Inhalt gelöscht wird und Abruffehler auftreten. Verwenden Sie nur den oben angegebenen spezifischen transienten Datenpfad.

  7. Wählen Sie unter Aktionen für Lebenszyklusregeln die Option Aktuelle Versionen von Objekten ablaufen lassen aus.

  8. Geben Sie für Tage nach der Objekterstellung den Wert ein1.

  9. Wählen Sie Regel erstellen aus.

AWS CLI
Um eine Lebenszyklusregel zu erstellen, verwenden Sie AWS CLI
  1. Erstellen Sie eine JSON-Datei lifecycle-policy.json mit dem folgenden Inhalt.

    Ersetzen Sie die Platzhalterwerte durch Ihre tatsächlichen Bezeichner:

    • knowledge-base-id- Ihre Wissensdatenbank-ID

    • data-source-id- Ihre Datenquellen-ID

    { "Rules": [ { "ID": "TransientDataDeletion", "Status": "Enabled", "Filter": { "Prefix": "aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data" }, "Expiration": { "Days": 1 } } ] }
  2. Wenden Sie die Lebenszyklusrichtlinie auf Ihren Bucket an. Ersetzen Sie your-multimodal-storage-bucket durch den tatsächlichen Namen Ihres Buckets.

    aws s3api put-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket \ --lifecycle-configuration file://lifecycle-policy.json
  3. Stellen Sie sicher, dass die Lebenszyklus-Richtlinie angewendet wurde:

    aws s3api get-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket

Weitere Informationen zu den Lebenszyklusrichtlinien von Amazon S3 finden Sie unter Verwaltung des Lebenszyklus von Objekten im Amazon S3 S3-Benutzerhandbuch.

Leistungsaspekte

Um eine optimale Leistung Ihrer multimodalen Wissensdatenbank zu erzielen, sollten Sie die folgenden Faktoren berücksichtigen:

  • Verarbeitungszeit: Die BDA-Verarbeitung dauert aufgrund der Inhaltskonvertierung länger

  • Abfragelatenz: Bildanfragen haben möglicherweise eine höhere Latenz als Textabfragen

  • Dauer des Chunkings: Längere Audio-/Video-Chunk-Dauern erhöhen die Verarbeitungszeit, können aber die Genauigkeit verbessern