Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Risoluzione dei problemi relativi alle basi di conoscenza multimodali
Questa sezione fornisce una guida per risolvere i problemi più comuni riscontrati quando si lavora con le basi di conoscenza multimodali. Le informazioni sulla risoluzione dei problemi sono organizzate in base a limitazioni generali, scenari di errore comuni con relative cause e soluzioni e raccomandazioni per l'ottimizzazione delle prestazioni. Utilizzate queste informazioni per diagnosticare e risolvere problemi durante la configurazione, l'inserimento o l'interrogazione dei contenuti multimodali.
Limitazioni generali
Siate consapevoli di queste limitazioni attuali quando lavorate con le knowledge base multimodali:
-
Limiti di dimensione dei file: massimo 1,5 GB per file video, 1 GB per file audio (Nova Multimodal Embeddings) o 1,5 GB per file (BDA)
-
File per processo di inserimento: massimo 15.000 file per processo (Nova Multimodal Embeddings) o 1.000 file per processo (BDA)
-
Limiti di interrogazione: massimo un'immagine per query
-
Restrizioni alle origini dati: solo Amazon S3 e le origini dati personalizzate supportano contenuti multimodali
-
Limitazioni della suddivisione in blocchi BDA: quando si utilizza Bedrock Data Automation con suddivisione in blocchi a dimensione fissa, le impostazioni della percentuale di sovrapposizione non vengono applicate ai contenuti audio e video
-
Limiti di lavori BDA simultanei: limite predefinito di 20 lavori BDA simultanei. Per l'elaborazione su larga scala, prendi in considerazione la possibilità di richiedere un aumento della quota di servizio
-
Limitazioni del modello Reranker: i modelli Reranker non sono supportati per i contenuti multimodali
-
Limiti di riepilogo: il riepilogo delle risposte di recupero contenenti contenuto non testuale non è supportato
-
Limitazioni all'immissione delle query: l'input contenente sia testo che immagine non è attualmente supportato. È possibile utilizzare query di testo o immagini, ma non entrambe contemporaneamente.
-
Filtri di contenuto di immagini Guardrail: quando si utilizzano query di immagini con un guardrail in cui sono configurati filtri per il contenuto delle immagini, l'immagine di input verrà valutata rispetto al guardrail e potrebbe essere bloccata se viola le soglie di filtro configurate
-
Mancata corrispondenza tra input e tipo: per impostazione predefinita, si presume che l'input sia testo quando il tipo non è specificato. Quando si utilizzano modalità diverse dal testo, è necessario specificare il tipo corretto
Errori e soluzioni comuni
Se riscontri problemi con la tua knowledge base multimodale, esamina questi scenari comuni:
- Errore 4xx quando si utilizzano interrogazioni di immagini
-
Causa: tentativo di utilizzare query di immagini con modelli di incorporamento di solo testo o knowledge base elaborate da BDA.
Soluzione: scegli Amazon Nova Multimodal Embeddings quando crei la tua knowledge base per il supporto delle query di immagini.
- RAG restituisce un errore 4xx con contenuto multimodale
-
Causa: utilizzo
RetrieveAndGeneratecon una knowledge base contenente solo contenuti multimodali e il modello Amazon Nova Multimodal Embeddings.Soluzione: usa il parser BDA per la funzionalità RAG o assicurati che la tua knowledge base contenga contenuti testuali.
- Errore richiesto nella destinazione di archiviazione multimodale
-
Causa: utilizzo di Nova Multimodal Embeddings senza configurare una destinazione di archiviazione multimodale.
Soluzione: specificare una destinazione di archiviazione multimodale quando si utilizza Nova Multimodal Embeddings.
- L'origine dei dati e lo storage multimodale utilizzano lo stesso bucket S3
-
Causa: configurazione dell'origine dati e della destinazione di storage multimodale per utilizzare lo stesso bucket Amazon S3 senza prefissi di inclusione appropriati.
Soluzione: utilizza bucket separati per l'origine dei dati e lo storage multimodale oppure configura i prefissi di inclusione per impedire la reingestione dei file multimediali estratti.
- Il prefisso di inclusione non può iniziare con «aws/»
-
Causa: utilizzo di un prefisso di inclusione che inizia con «aws/» quando l'origine dati e la destinazione di storage multimodale condividono lo stesso bucket Amazon S3.
Soluzione: specifica un prefisso di inclusione diverso. Il percorso «aws/» è riservato all'archiviazione dei file multimediali estratti e non può essere utilizzato come prefisso di inclusione per evitare di reimportare il contenuto elaborato.
- L'ingestione di BDA ignora i contenuti multimodali
-
Causa: la Knowledge Base è stata creata senza una destinazione di archiviazione multimodale, quindi è stata aggiunta l'origine dati BDA con contenuto multimodale.
Soluzione: ricrea la knowledge base con una destinazione di archiviazione multimodale configurata per consentire l'elaborazione BDA di file audio, video e immagini.
- Knowledge base creata senza un modello di incorporamento multimodale
-
Causa: la Knowledge base è stata creata con un modello di incorporamento di solo testo, che limita le funzionalità multimodali.
Soluzione: create una nuova knowledge base con Nova Multimodal Embeddings per abilitare l'elaborazione multimodale nativa e le query basate su immagini.
Gestione dei dati transitori con le policy del ciclo di vita di Amazon S3
Quando si utilizza Nova Multimodal Embeddings, Amazon Bedrock archivia i dati transitori nella destinazione di archiviazione multimodale e tenta di eliminarli una volta completata l'elaborazione. Ti consigliamo di applicare una politica del ciclo di vita sul percorso temporaneo dei dati per garantire che sia scaduto correttamente.
Per ulteriori informazioni sulle politiche del ciclo di vita di Amazon S3, consulta Managing the lifecycle of objects nella Amazon S3 User Guide.
Considerazioni sulle prestazioni
Per prestazioni ottimali con la tua knowledge base multimodale, considera questi fattori:
-
Tempo di elaborazione: l'elaborazione BDA richiede più tempo a causa della conversione dei contenuti
-
Latenza delle query: le query di immagini possono avere una latenza maggiore rispetto alle query di testo
-
Durata della suddivisione in blocchi: durate più lunghe dei blocchi audio/video aumentano il tempo di elaborazione ma possono migliorare la precisione