Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Interrogare una knowledge base e generare risposte basate sui dati recuperati
I guardrail vengono applicati solo all’input e alla risposta generata dal LLM. Non vengono applicati ai riferimenti recuperati dalle knowledge base in fase di runtime.
Dopo aver configurato la knowledge base, è possibile interrogarla e generare risposte basate sui blocchi recuperati dall’origine dati mediante l’operazione API RetrieveAndGenerate. Le risposte vengono restituite con citazioni che rimandano ai dati di origine. È possibile anche utilizzare un modello di riclassificazione al posto del ranker predefinito di Knowledge Base per Amazon Bedrock per classificare i blocchi di origine in base alla pertinenza durante il recupero.
Limitazioni dei contenuti multimodali
RetrieveAndGenerateha un supporto limitato per i contenuti multimodali. Quando si utilizza Nova Multimodal Embeddings, la funzionalità RAG è limitata al solo contenuto testuale. Per un supporto multimodale completo, inclusa l'elaborazione audio e video, utilizzate BDA con modelli di incorporamento del testo. Per informazioni dettagliate, vedi Crea una base di conoscenze per contenuti multimodali.
Le immagini restituite dalla risposta di Retrieve durante il flusso RetrieveAndGenerate sono incluse nel prompt per la generazione della risposta. La risposta di RetrieveAndGenerate non può includere immagini, ma può citare le origini che le contengono.
Per informazioni su come interrogare la knowledge base, scegli la scheda relativa al metodo preferito, quindi segui la procedura:
- Console
-
Come testare la knowledge base
-
Accedi a Console di gestione AWS con un'identità IAM che dispone delle autorizzazioni per utilizzare la console Amazon Bedrock. Quindi, apri la console Amazon Bedrock in https://console.aws.amazon.com/bedrock.
-
Nel riquadro di navigazione a sinistra, scegli Knowledge base.
-
Nella sezione Knowledge base esegui una delle azioni seguenti:
-
Scegli il pulsante di opzione accanto alla knowledge base che desideri testare e seleziona Testa knowledge base. Una finestra di test si espande da destra.
-
Scegli la knowledge base da testare. Una finestra di test si espande da destra.
-
Per generare risposte sulla base delle informazioni recuperate dalla tua knowledge base, attiva Genera risposte per la tua query. Amazon Bedrock genera risposte in base alle origini dati e cita le informazioni fornite con note a piè di pagina.
-
Per scegliere un modello da utilizzare per la generazione delle risposte, scegli Seleziona modello. Quindi seleziona Applica.
-
(Facoltativo) Seleziona l’icona delle configurazioni (
) per aprire Configurazioni. Per informazioni sulle configurazioni, consulta Configurare e personalizzare la generazione di query e risposte.
-
Inserisci una query nella casella di testo della finestra di chat e seleziona Esegui per restituire le risposte dalla knowledge base.
-
Seleziona una nota a piè di pagina per visualizzare un estratto dall’origine citata relativa alla parte specifica della risposta. Scegli il link per accedere all’oggetto S3 che contiene il file.
-
Per visualizzare i dettagli sui blocchi restituiti, seleziona Mostra i dettagli dell’origine.
-
Per visualizzare le configurazioni impostate per la query, espandi Configurazioni delle query.
-
Per visualizzare i dettagli su un blocco di origine, espandilo scegliendo la freccia destra (
) accanto ad esso. Puoi visualizzare le seguenti informazioni:
-
Il testo non elaborato dal blocco di origine. Per copiare questo testo, scegli l’icona di copia (
). Se hai utilizzato Amazon S3 per archiviare i dati, scegli l’icona del link esterno (
) per accedere all’oggetto S3 contenente il file.
-
I metadati associati al blocco di origine, se hai utilizzato Amazon S3 per archiviare i dati. Le attribute/field chiavi e i valori sono definiti nel .metadata.json file associato al documento di origine. Per ulteriori informazioni, consulta la sezione Metadati e filtri in Configurare e personalizzare la generazione di query e risposte.
Opzioni di chat
-
Per utilizzare un modello diverso per la generazione delle risposte, scegli Modifica modello. Se modifichi il modello, il testo nella finestra della chat verrà completamente cancellato.
-
Passa al recupero diretto dei blocchi di origine deselezionando Genera risposte. Se modifichi l’impostazione, il testo nella finestra della chat verrà completamente cancellato.
-
Per cancellare la finestra della chat, seleziona l’icona a forma di scopa (
).
-
Per copiare tutto l’output nella finestra della chat, seleziona l’icona di copia (
).
- API
-
Per interrogare una knowledge base e utilizzare un modello di fondazione per generare risposte basate sui risultati dalle origini dati, invia una richiesta RetrieveAndGenerate con un endpoint di runtime Agent per Amazon Bedrock.
L’API RetrieveAndGenerateStream restituisce i dati in un formato di streaming e consente di accedere alle risposte generate in blocchi senza attendere l’intero risultato.
I seguenti campi sono obbligatori:
La risposta dell’API contiene eventi di citazione. Il membro citation è stato reso obsoleto. Al suo posto, ti consigliamo di utilizzare i campi generatedResponse e retrievedReferences. Come riferimento, consulta CitationEvent.
| Campo |
Descrizione di base |
| input |
Contiene un campo text per specificare la query. |
| retrieveAndGenerateConfigurazione |
Contiene un RetrieveAndGenerateConfiguration, che specifica le configurazioni per il recupero e la generazione. Per ulteriori dettagli, consultare i contenuti che seguono. |
I seguenti campi sono facoltativi:
| Campo |
Caso d’uso |
| sessionId |
Utilizza lo stesso valore di una sessione precedente per continuare tale sessione e mantenerne il contesto per il modello. |
| sessionConfiguration |
Per includere una chiave KMS personalizzata per la crittografia della sessione. |
Includi il campo in. knowledgeBaseConfiguration RetrieveAndGenerateConfiguration Questo campo è mappato su un KnowledgeBaseRetrieveAndGenerateConfigurationoggetto, che contiene i seguenti campi:
Puoi utilizzare un modello di riposizionamento rispetto al modello di classificazione predefinito di Amazon Bedrock Knowledge Bases includendo il rerankingConfiguration campo all'interno di. KnowledgeBaseVectorSearchConfigurationKnowledgeBaseRetrievalConfiguration Il rerankingConfiguration campo è mappato su un VectorSearchRerankingConfigurationoggetto, in cui è possibile specificare il modello di riclassificazione da utilizzare, eventuali campi di richiesta aggiuntivi da includere, gli attributi dei metadati per filtrare i documenti durante la nuova classificazione e il numero di risultati da restituire dopo la nuova classificazione. Per ulteriori informazioni, consulta VectorSearchRerankingConfiguration.
Se il numberOfRerankedResults valore specificato è maggiore del valore in KnowledgeBaseVectorSearchConfiguration, il numero massimo di risultati che verranno restituiti è il numberOfResults valore per. numberOfResults Un’eccezione è rappresentata dall’utilizzo della decomposizione delle query. Per ulteriori informazioni, consulta la sezione Modifiche alle query in Configurare e personalizzare la generazione di query e risposte. Se si utilizza la decomposizione delle query, numberOfRerankedResults può essere fino a cinque volte superiore rispetto a numberOfResults.
La risposta restituisce la risposta generata nel campo output e i blocchi di origine citati come matrice nel campo citations. Ogni oggetto citation include i seguenti campi:
| Campo |
Descrizione di base |
| generatedResponsePart |
Nel campo textResponsePart è incluso il valore text a cui si riferisce la citazione. Il campo span fornisce gli indici per l’inizio e la fine della parte dell’output che contiene una citazione. |
| retrievedReferences |
Una matrice di RetrievedReferenceoggetti, ognuno content dei quali contiene il blocco di origine metadata associato al documento e l'URI o l'URL location del documento nell'origine dati. Se il contenuto è un’immagine, l’URI dei dati del contenuto codificato in base64 viene restituito nel seguente formato: data:image/jpeg;base64,${base64-encoded string}. |
La risposta restituisce anche un valore sessionId che puoi riutilizzare in un’altra richiesta per mantenere la stessa conversazione.
Se hai incluso un valore guardrailConfiguration nella richiesta, il campo guardrailAction segnala se il contenuto è stato bloccato o meno.
Se i dati recuperati contengono immagini, la risposta restituisce anche le seguenti intestazioni di risposta, che contengono i metadati per i blocchi di origine restituiti nella risposta:
Se ricevi un errore che indica che il prompt supera il limite di caratteri durante la generazione delle risposte, puoi abbreviare il prompt nei seguenti modi: