Scrittura di best practice per ottimizzare le applicazioni RAG

Ivan Cui e Samantha Stuart, Amazon Web Services

Luglio 2025 (storia del documento)

I modelli linguistici di grandi dimensioni (LLMs) hanno rivoluzionato il campo dell'intelligenza artificiale grazie alla loro straordinaria capacità di comprendere e generare testi simili a quelli umani. Tuttavia, devono affrontare un limite significativo: possono lavorare solo con le conoscenze contenute nei dati di formazione. È qui che aiuta Retrieval Augmented Generation (RAG). Offre una soluzione che si combina LLMs con fonti di conoscenza esterne, come i dati e i documenti dell'organizzazione. Attraverso un processo in due fasi che prevede il recupero delle informazioni e la generazione di risposte, RAG consente ai sistemi di intelligenza artificiale di accedere e incorporare up-to-date informazioni da varie fonti, ottenendo risposte più accurate e informate che colmano il divario tra la conoscenza dei modelli statici e le esigenze dinamiche di informazione del mondo reale.

Come è possibile ottimizzare i contenuti per il recupero in un'applicazione basata su RAG? Questa guida fornisce le migliori pratiche per aiutarvi a ottimizzare la formattazione e lo stile di scrittura dei contenuti basati su testo nella knowledge base. L'ottimizzazione del contenuto migliora il contesto che aiuta le applicazioni RAG a comprendere con maggiore precisione le informazioni specifiche delle attività. Quando il sistema recupera contenuti altamente pertinenti e accurati, la qualità della risposta del LLM migliora. L'ottimizzazione del processo di distribuzione del contesto a livello di sistema si chiama ingegneria del contesto e costituisce una parte essenziale delle architetture AGENTIC RAG. In agentic RAG, una o più LLMs motivazioni aggiuntive e agisci in base alle richieste di acquisizione prima dell'esecuzione del RAG. Ciò facilita un processo di distribuzione delle informazioni in più fasi. Poiché le architetture RAG diventano sempre più complesse, l'ottimizzazione dei contenuti sorgente rimane il mezzo più diretto per fornire un contesto chiaro. LLMs Queste best practice sono progettate per aiutarvi a massimizzare l'investimento della vostra organizzazione in un'applicazione RAG.

Destinatari principali

Questa guida è destinata agli ingegneri di intelligenza artificiale, ai data scientist, ai data engineer o agli sviluppatori di software che stanno creando applicazioni LLM con uno o più componenti RAG. Per comprendere i concetti e i consigli contenuti in questa guida, è necessario conoscere i database vettoriali e i prompt for. LLMs

Obiettivi

I consigli contenuti in questa guida possono aiutarti a raggiungere i seguenti obiettivi:

Migliora l'accuratezza e la pertinenza delle risposte generate dalle applicazioni RAG fornendo documenti sorgente ben strutturati e semanticamente ricchi, ottimizzati per l'utilizzo e la ridondanza dei token.
Aiuta le applicazioni RAG a comprendere meglio le conoscenze e il contesto specifici del dominio fornendo definizioni e spiegazioni chiare all'interno dei documenti di origine.
Semplifica la manutenzione e gli aggiornamenti della knowledge base per le applicazioni RAG aderendo a linee guida di formattazione e strutturazione coerenti per tutti i documenti di origine.
Migliora la scalabilità delle soluzioni RAG suddividendo documenti monolitici di grandi dimensioni in unità più piccole e autonome che possono essere indicizzate e recuperate in modo efficiente.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Comprendere LLM e RAG