Risoluzione dei problemi relativi alle basi di conoscenza multimodali - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi relativi alle basi di conoscenza multimodali

Questa sezione fornisce una guida per risolvere i problemi più comuni riscontrati quando si lavora con le basi di conoscenza multimodali. Le informazioni sulla risoluzione dei problemi sono organizzate in base a limitazioni generali, scenari di errore comuni con relative cause e soluzioni e raccomandazioni per l'ottimizzazione delle prestazioni. Utilizzate queste informazioni per diagnosticare e risolvere problemi durante la configurazione, l'inserimento o l'interrogazione dei contenuti multimodali.

Limitazioni generali

Siate consapevoli di queste limitazioni attuali quando lavorate con le knowledge base multimodali:

  • Limiti di dimensione dei file: massimo 1,5 GB per file video, 1 GB per file audio (Nova Multimodal Embeddings) o 1,5 GB per file (BDA)

  • File per processo di inserimento: massimo 15.000 file per processo (Nova Multimodal Embeddings) o 1.000 file per processo (BDA)

  • Limiti di interrogazione: massimo un'immagine per query

  • Restrizioni alle origini dati: solo Amazon S3 e le origini dati personalizzate supportano contenuti multimodali

  • Limitazioni della suddivisione in blocchi BDA: quando si utilizza Bedrock Data Automation con suddivisione in blocchi a dimensione fissa, le impostazioni della percentuale di sovrapposizione non vengono applicate ai contenuti audio e video

  • Limiti di lavori BDA simultanei: limite predefinito di 20 lavori BDA simultanei. Per l'elaborazione su larga scala, prendi in considerazione la possibilità di richiedere un aumento della quota di servizio

  • Limitazioni del modello Reranker: i modelli Reranker non sono supportati per i contenuti multimodali

  • Limiti di riepilogo: il riepilogo delle risposte di recupero contenenti contenuto non testuale non è supportato

  • Limitazioni all'immissione delle query: l'input contenente sia testo che immagine non è attualmente supportato. È possibile utilizzare query di testo o immagini, ma non entrambe contemporaneamente.

  • Filtri di contenuto di immagini Guardrail: quando si utilizzano query di immagini con un guardrail in cui sono configurati filtri per il contenuto delle immagini, l'immagine di input verrà valutata rispetto al guardrail e potrebbe essere bloccata se viola le soglie di filtro configurate

  • Mancata corrispondenza tra input e tipo: per impostazione predefinita, si presume che l'input sia testo quando il tipo non è specificato. Quando si utilizzano modalità diverse dal testo, è necessario specificare il tipo corretto

Errori e soluzioni comuni

Se riscontri problemi con la tua knowledge base multimodale, esamina questi scenari comuni:

Errore 4xx quando si utilizzano interrogazioni di immagini

Causa: tentativo di utilizzare query di immagini con modelli di incorporamento di solo testo o knowledge base elaborate da BDA.

Soluzione: scegli Amazon Nova Multimodal Embeddings quando crei la tua knowledge base per il supporto delle query di immagini.

RAG restituisce un errore 4xx con contenuto multimodale

Causa: utilizzo RetrieveAndGenerate con una knowledge base contenente solo contenuti multimodali e il modello Amazon Nova Multimodal Embeddings.

Soluzione: usa il parser BDA per la funzionalità RAG o assicurati che la tua knowledge base contenga contenuti testuali.

Errore richiesto nella destinazione di archiviazione multimodale

Causa: utilizzo di Nova Multimodal Embeddings senza configurare una destinazione di archiviazione multimodale.

Soluzione: specificare una destinazione di archiviazione multimodale quando si utilizza Nova Multimodal Embeddings.

L'origine dei dati e lo storage multimodale utilizzano lo stesso bucket S3

Causa: configurazione dell'origine dati e della destinazione di storage multimodale per utilizzare lo stesso bucket Amazon S3 senza prefissi di inclusione appropriati.

Soluzione: utilizza bucket separati per l'origine dei dati e lo storage multimodale oppure configura i prefissi di inclusione per impedire la reingestione dei file multimediali estratti.

Il prefisso di inclusione non può iniziare con «aws/»

Causa: utilizzo di un prefisso di inclusione che inizia con «aws/» quando l'origine dati e la destinazione di storage multimodale condividono lo stesso bucket Amazon S3.

Soluzione: specifica un prefisso di inclusione diverso. Il percorso «aws/» è riservato all'archiviazione dei file multimediali estratti e non può essere utilizzato come prefisso di inclusione per evitare di reimportare il contenuto elaborato.

L'ingestione di BDA ignora i contenuti multimodali

Causa: la Knowledge Base è stata creata senza una destinazione di archiviazione multimodale, quindi è stata aggiunta l'origine dati BDA con contenuto multimodale.

Soluzione: ricrea la knowledge base con una destinazione di archiviazione multimodale configurata per consentire l'elaborazione BDA di file audio, video e immagini.

Knowledge base creata senza un modello di incorporamento multimodale

Causa: la Knowledge base è stata creata con un modello di incorporamento di solo testo, che limita le funzionalità multimodali.

Soluzione: create una nuova knowledge base con Nova Multimodal Embeddings per abilitare l'elaborazione multimodale nativa e le query basate su immagini.

Gestione dei dati transitori con le policy del ciclo di vita di Amazon S3

Quando si utilizza Nova Multimodal Embeddings, Amazon Bedrock archivia i dati transitori nella destinazione di archiviazione multimodale e tenta di eliminarli una volta completata l'elaborazione. Ti consigliamo di applicare una politica del ciclo di vita sul percorso temporaneo dei dati per garantire che sia scaduto correttamente.

Console
Per creare una regola del ciclo di vita utilizzando la console
  1. Apri la console Amazon S3.

  2. Passa alla destinazione di archiviazione multimodale che hai configurato per la tua Knowledge Base.

  3. Scegli la scheda Gestione e seleziona Crea regola del ciclo di vita.

  4. Per il nome della regola del ciclo di vita, immettere. Transient Data Deletion

  5. In Tipo di filtro, scegli Limita l'ambito di questa regola utilizzando uno o più filtri.

  6. In Prefix, inserisci il percorso dei dati temporanei per la tua knowledge base e la tua fonte di dati.

    Sostituisci i valori segnaposto nel seguente prefisso con i tuoi identificatori effettivi:

    aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data
    Importante

    Non applicate le policy relative al ciclo di vita all'intero bucket o al prefisso «aws/», poiché ciò eliminerebbe il contenuto multimodale e causerebbe errori di recupero. Utilizza solo lo specifico percorso dei dati transitori mostrato sopra.

  7. In Azioni delle regole del ciclo di vita, seleziona Fai scadere le versioni correnti degli oggetti.

  8. Per Giorni dopo la creazione dell'oggetto, inserisci. 1

  9. Scegli Crea regola.

AWS CLI
Per creare una regola del ciclo di vita utilizzando AWS CLI
  1. Crea un file JSON denominato lifecycle-policy.json con il seguente contenuto.

    Sostituisci i valori segnaposto con i tuoi identificatori effettivi:

    • knowledge-base-id- Il tuo identificatore della knowledge base

    • data-source-id- Il tuo identificatore della fonte di dati

    { "Rules": [ { "ID": "TransientDataDeletion", "Status": "Enabled", "Filter": { "Prefix": "aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data" }, "Expiration": { "Days": 1 } } ] }
  2. Applica la politica del ciclo di vita al tuo bucket. Sostituisci your-multimodal-storage-bucket con il nome effettivo del bucket:

    aws s3api put-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket \ --lifecycle-configuration file://lifecycle-policy.json
  3. Verifica che sia stata applicata la politica del ciclo di vita:

    aws s3api get-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket

Per ulteriori informazioni sulle politiche del ciclo di vita di Amazon S3, consulta Managing the lifecycle of objects nella Amazon S3 User Guide.

Considerazioni sulle prestazioni

Per prestazioni ottimali con la tua knowledge base multimodale, considera questi fattori:

  • Tempo di elaborazione: l'elaborazione BDA richiede più tempo a causa della conversione dei contenuti

  • Latenza delle query: le query di immagini possono avere una latenza maggiore rispetto alle query di testo

  • Durata della suddivisione in blocchi: durate più lunghe dei blocchi audio/video aumentano il tempo di elaborazione ma possono migliorare la precisione