Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creazione di sistemi RAG con Amazon Nova
Nota
Questa documentazione è per Amazon Nova versione 1. Amazon Nova 2 è ora disponibile con nuovi modelli e funzionalità avanzate. Le nuove funzionalità e gli aggiornamenti della documentazione sono pubblicati nella Amazon Nova 2 User Guide. Per informazioni, visita Novità in Amazon Nova 2.
La generazione potenziata da recupero dati (RAG) ottimizza l’output di un modello linguistico di grandi dimensioni (LLM) facendo riferimento a una base di conoscenze autorevole al di fuori delle relative origini dati di addestramento prima che generi una risposta. Questo approccio aiuta a fornire al modello informazioni aggiornate e a basarle su dati proprietari o specifici del dominio. Fornisce inoltre una fonte di informazioni controllabile, che puoi utilizzare per impostare i controlli di accesso a contenuti specifici e risolvere i problemi nelle risposte.
RAG funziona collegando un generatore (spesso un LLM) a un database di contenuti (come un archivio di conoscenze) tramite uno strumento di recupero. Lo strumento di recupero è responsabile della ricerca delle informazioni pertinenti. Nella maggior parte delle applicazioni aziendali, il database dei contenuti è un archivio vettoriale, lo strumento di recupero è un modello di embedding e il generatore è un LLM. Per ulteriori informazioni, consulta Retrieval Augmented Generation
Un sistema RAG dispone di diversi componenti. Questa guida si concentra su come utilizzare Amazon Nova come LLM in qualsiasi sistema RAG.
Puoi utilizzare i modelli Amazon Nova come LLM all’interno di un sistema RAG di testo. Con i modelli Amazon Nova, hai la flessibilità necessaria per creare un sistema RAG con Amazon Bedrock Knowledge base o creare il tuo sistema RAG. Puoi anche associare la tua knowledge base a un agente in Agenti di Amazon Bedrock per aggiungere funzionalità RAG all’agente. Per ulteriori informazioni, consulta Automate tasks in your application using conversational agents.