Allgemeine Einschränkungen Häufige Fehler und Lösungen Verwaltung vorübergehender Daten mit Amazon S3 S3-Lebenszyklusrichtlinien Leistungsaspekte

Fehlerbehebung bei multimodalen Wissensdatenbanken

Dieser Abschnitt enthält Anleitungen zur Lösung häufiger Probleme, die bei der Arbeit mit multimodalen Wissensdatenbanken auftreten. Die Informationen zur Fehlerbehebung sind nach allgemeinen Einschränkungen, häufigen Fehlerszenarien mit ihren Ursachen und Lösungen sowie Empfehlungen zur Leistungsoptimierung gegliedert. Verwenden Sie diese Informationen, um Probleme bei der Einrichtung, Aufnahme oder Abfrage Ihrer multimodalen Inhalte zu diagnostizieren und zu beheben.

Allgemeine Einschränkungen

Beachten Sie bei der Arbeit mit multimodalen Wissensdatenbanken die folgenden aktuellen Einschränkungen:

Dateigrößenbeschränkungen: Maximal 1,5 GB pro Videodatei, 1 GB pro Audiodatei (Nova Multimodal Embeddings) oder 1,5 GB pro Datei (BDA)
Dateien pro Aufnahmeauftrag: Maximal 15.000 Dateien pro Auftrag (Nova Multimodal Embeddings) oder 1.000 Dateien pro Auftrag (BDA)
Abfragegrenzwerte: Maximal ein Bild pro Abfrage
Einschränkungen bei Datenquellen: Nur Amazon S3 und benutzerdefinierte Datenquellen unterstützen multimodale Inhalte
Einschränkungen beim BDA-Chunking: Wenn Sie Bedrock Data Automation mit Chunking mit fester Größe verwenden, werden die Einstellungen für den Prozentsatz der Überlappung nicht auf Audio- und Videoinhalte angewendet
Grenzwerte für gleichzeitige BDA-Jobs: Standardlimit von 20 gleichzeitigen BDA-Jobs. Bei umfangreicher Verarbeitung sollten Sie erwägen, eine Erhöhung des Servicekontingents zu beantragen
Einschränkungen des Reranker-Modells: Reranker-Modelle werden für multimodale Inhalte nicht unterstützt
Einschränkungen bei der Zusammenfassung: Die Zusammenfassung von Abruf-Antworten, die Nicht-Text-Inhalte enthalten, wird nicht unterstützt
Einschränkungen bei der Abfrageeingabe: Eingaben, die sowohl Text als auch Bild enthalten, werden derzeit nicht unterstützt. Sie können entweder Text- oder Bildabfragen verwenden, aber nicht beide gleichzeitig.
Guardrail-Bildinhaltsfilter: Wenn Sie Bildabfragen mit einer Leitplanke verwenden, für die Bildinhaltsfilter konfiguriert sind, wird das Eingabebild anhand der Leitplanke bewertet und kann blockiert werden, wenn es die konfigurierten Filtergrenzwerte verletzt
Eingabe und Typ stimmen nicht überein: Standardmäßig wird davon ausgegangen, dass es sich bei der Eingabe um Text handelt, wenn der Typ nicht angegeben ist. Wenn Sie andere Modalitäten als Text verwenden, müssen Sie den richtigen Typ angeben

Häufige Fehler und Lösungen

Wenn Sie Probleme mit Ihrer multimodalen Wissensdatenbank haben, sehen Sie sich diese häufigen Szenarien an:

4xx-Fehler bei der Verwendung von Bildabfragen

Ursache: Es wird versucht, Bildabfragen mit reinen Texteinbettungsmodellen oder BDA-processed Wissensdatenbanken zu verwenden.

Lösung: Wählen Sie Amazon Nova Multimodal Embeddings, wenn Sie Ihre Wissensdatenbank für die Unterstützung von Bildabfragen erstellen.

RAG gibt bei multimodalem Inhalt den Fehler 4xx zurück

Ursache: Verwendung RetrieveAndGenerate mit einer Wissensdatenbank, die nur multimodalen Inhalt enthält, und dem Amazon Nova Multimodal Embeddings-Modell.

Lösung: Verwenden Sie den BDA-Parser für die RAG-Funktionalität, oder stellen Sie sicher, dass Ihre Wissensdatenbank Textinhalte enthält.

Fehler: Multimodales Speicherziel erforderlich

Ursache: Verwendung von Nova Multimodal Embeddings ohne Konfiguration eines multimodalen Speicherziels.

Lösung: Geben Sie ein multimodales Speicherziel an, wenn Sie Nova Multimodal Embeddings verwenden.

Datenquelle und multimodaler Speicher verwenden denselben S3-Bucket

Ursache: Konfiguration Ihrer Datenquelle und Ihres multimodalen Speicherziels für die Verwendung desselben Amazon S3 S3-Buckets ohne korrekte Inklusionspräfixe.

Lösung: Verwenden Sie entweder separate Buckets für die Datenquelle und den multimodalen Speicher oder konfigurieren Sie Inklusionspräfixe, um zu verhindern, dass extrahierte Mediendateien erneut aufgenommen werden.

Das Inklusionspräfix darf nicht mit „aws/“ beginnen

Ursache: Es wird ein Inklusionspräfix verwendet, das mit „aws/“ beginnt, wenn Ihre Datenquelle und Ihr multimodales Speicherziel denselben Amazon S3 S3-Bucket verwenden.

Lösung: Geben Sie ein anderes Inklusionspräfix an. Der Pfad „aws/“ ist für die Speicherung extrahierter Medien reserviert und kann nicht als Inklusionspräfix verwendet werden, um zu verhindern, dass verarbeitete Inhalte erneut aufgenommen werden.

Bei der BDA-Aufnahme werden multimodale Inhalte übersprungen

Ursache: Die Wissensdatenbank wurde ohne ein multimodales Speicherziel erstellt, dann wurde die BDA-Datenquelle mit multimodalem Inhalt hinzugefügt.

Lösung: Re-create Die Wissensdatenbank mit einem multimodalen Speicherziel, das so konfiguriert ist, dass es die BDA-Verarbeitung von Audio-, Video- und Bilddateien ermöglicht.

Wissensdatenbank, die ohne multimodales Einbettungsmodell erstellt wurde

Ursache: Die Wissensdatenbank wurde mit einem reinen Texteinbettungsmodell erstellt, wodurch die multimodalen Funktionen eingeschränkt wurden.

Lösung: Erstellen Sie mit Nova Multimodal Embeddings eine neue Wissensdatenbank, um native multimodale Verarbeitung und bildbasierte Abfragen zu ermöglichen.

Verwaltung vorübergehender Daten mit Amazon S3 S3-Lebenszyklusrichtlinien

Wenn Sie Nova Multimodal Embeddings verwenden, speichert Amazon Bedrock transiente Daten in Ihrem multimodalen Speicherziel und versucht, sie nach Abschluss der Verarbeitung zu löschen. Wir empfehlen, eine Lebenszyklusrichtlinie für den transienten Datenpfad anzuwenden, um sicherzustellen, dass er ordnungsgemäß abgelaufen ist.

Console

Um eine Lebenszyklusregel mit der Konsole zu erstellen

Öffnen Sie die Amazon S3-Konsole.
Navigieren Sie zu dem multimodalen Speicherziel, das Sie für Ihre Knowledge Base konfiguriert haben.
Wählen Sie die Registerkarte Verwaltung und dann Lebenszyklusregel erstellen aus.
Geben Sie als Namen der Lebenszyklusregel einTransient Data Deletion.
Wählen Sie unter Filtertyp die Option Den Geltungsbereich dieser Regel mithilfe eines oder mehrerer Filter einschränken aus.
Geben Sie unter Präfix den transienten Datenpfad für Ihre Wissensdatenbank und Datenquelle ein.

Ersetzen Sie die Platzhalterwerte im folgenden Präfix durch Ihre tatsächlichen Identifikatoren:
```
aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data
```
Wichtig
Wenden Sie Lebenszyklusrichtlinien nicht auf den gesamten Bucket oder auf das Präfix „aws/“ an, da dadurch Ihr multimodaler Inhalt gelöscht wird und Abruffehler auftreten. Verwenden Sie nur den oben angegebenen spezifischen transienten Datenpfad.
Wählen Sie unter Aktionen für Lebenszyklusregeln die Option Aktuelle Versionen von Objekten ablaufen lassen aus.
Geben Sie für Tage nach der Objekterstellung den Wert ein1.
Wählen Sie Regel erstellen aus.

AWS CLI

Um eine Lebenszyklusregel mit dem zu erstellen AWS CLI

Erstellen Sie eine JSON-Datei lifecycle-policy.json mit dem folgenden Inhalt.

Ersetzen Sie die Platzhalterwerte durch Ihre tatsächlichen Bezeichner:

knowledge-base-id- Ihre Wissensdatenbank-ID
data-source-id- Ihre Datenquellen-ID


{
    "Rules": [
        {
            "ID": "TransientDataDeletion",
            "Status": "Enabled",
            "Filter": {
                "Prefix": "aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data"
            },
            "Expiration": {
                "Days": 1
            }
        }
    ]
}

Wenden Sie die Lebenszyklusrichtlinie auf Ihren Bucket an. Ersetzen Sie your-multimodal-storage-bucket durch den tatsächlichen Namen Ihres Buckets.


aws s3api put-bucket-lifecycle-configuration \
    --bucket your-multimodal-storage-bucket \
    --lifecycle-configuration file://lifecycle-policy.json

Stellen Sie sicher, dass die Lebenszyklus-Richtlinie angewendet wurde:


aws s3api get-bucket-lifecycle-configuration \
    --bucket your-multimodal-storage-bucket

Weitere Informationen zu den Lebenszyklusrichtlinien von Amazon S3 finden Sie unter Verwaltung des Lebenszyklus von Objekten im Amazon S3 S3-Benutzerhandbuch.

Leistungsaspekte

Für eine optimale Leistung Ihrer multimodalen Wissensdatenbank sollten Sie die folgenden Faktoren berücksichtigen:

Verarbeitungszeit: Die BDA-Verarbeitung dauert aufgrund der Inhaltskonvertierung länger
Abfragelatenz: Bildanfragen haben möglicherweise eine höhere Latenz als Textabfragen
Dauer des Chunkings: Längere audio/video Chunk-Dauern erhöhen die Verarbeitungszeit, können aber die Genauigkeit verbessern

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Wissensdatenbank testen und abfragen

So bauen Sie eine Wissensdatenbank durch eine Verbindung zu einem strukturierten Datenspeicher auf