Interrogare una knowledge base e generare risposte basate sui dati recuperati

Importante

I guardrail vengono applicati solo all’input e alla risposta generata dal LLM. Non vengono applicati ai riferimenti recuperati dalle knowledge base in fase di runtime.

Dopo aver configurato la knowledge base, è possibile interrogarla e generare risposte basate sui blocchi recuperati dall’origine dati mediante l’operazione API RetrieveAndGenerate. Le risposte vengono restituite con citazioni che rimandano ai dati di origine. È possibile anche utilizzare un modello di riclassificazione al posto del ranker predefinito di Knowledge Base per Amazon Bedrock per classificare i blocchi di origine in base alla pertinenza durante il recupero.

Limitazioni dei contenuti multimodali

RetrieveAndGenerateha un supporto limitato per i contenuti multimodali. Quando si utilizza Nova Multimodal Embeddings, la funzionalità RAG è limitata al solo contenuto testuale. Per un supporto multimodale completo, inclusa l'elaborazione audio e video, utilizzate BDA con modelli di incorporamento del testo. Per informazioni dettagliate, vedi Crea una base di conoscenze per contenuti multimodali.

Nota

Le immagini restituite dalla risposta di Retrieve durante il flusso RetrieveAndGenerate sono incluse nel prompt per la generazione della risposta. La risposta di RetrieveAndGenerate non può includere immagini, ma può citare le origini che le contengono.

Per informazioni su come interrogare la knowledge base, scegli la scheda relativa al metodo preferito, quindi segui la procedura:

Console

Come testare la knowledge base

Accedi a Console di gestione AWS con un'identità IAM che dispone delle autorizzazioni per utilizzare la console Amazon Bedrock. Quindi, apri la console Amazon Bedrock in https://console.aws.amazon.com/bedrock.
Nel riquadro di navigazione a sinistra, scegli Knowledge base.
Nella sezione Knowledge base esegui una delle azioni seguenti:
- Scegli il pulsante di opzione accanto alla knowledge base che desideri testare e seleziona Testa knowledge base. Una finestra di test si espande da destra.
- Scegli la knowledge base da testare. Una finestra di test si espande da destra.
Per generare risposte sulla base delle informazioni recuperate dalla tua knowledge base, attiva Genera risposte per la tua query. Amazon Bedrock genera risposte in base alle origini dati e cita le informazioni fornite con note a piè di pagina.
Per scegliere un modello da utilizzare per la generazione delle risposte, scegli Seleziona modello. Quindi seleziona Applica.
(Facoltativo) Seleziona l’icona delle configurazioni ( ) per aprire Configurazioni. Per informazioni sulle configurazioni, consulta Configurare e personalizzare la generazione di query e risposte.
Inserisci una query nella casella di testo della finestra di chat e seleziona Esegui per restituire le risposte dalla knowledge base.
Seleziona una nota a piè di pagina per visualizzare un estratto dall’origine citata relativa alla parte specifica della risposta. Scegli il link per accedere all’oggetto S3 che contiene il file.
Per visualizzare i dettagli sui blocchi restituiti, seleziona Mostra i dettagli dell’origine.
- Per visualizzare le configurazioni impostate per la query, espandi Configurazioni delle query.
- Per visualizzare i dettagli su un blocco di origine, espandilo scegliendo la freccia destra ( ) accanto ad esso. Puoi visualizzare le seguenti informazioni:
  - Il testo non elaborato dal blocco di origine. Per copiare questo testo, scegli l’icona di copia ( ). Se hai utilizzato Amazon S3 per archiviare i dati, scegli l’icona del link esterno ( ) per accedere all’oggetto S3 contenente il file.
  - I metadati associati al blocco di origine, se hai utilizzato Amazon S3 per archiviare i dati. Le attribute/field chiavi e i valori sono definiti nel .metadata.json file associato al documento di origine. Per ulteriori informazioni, consulta la sezione Metadati e filtri in Configurare e personalizzare la generazione di query e risposte.

Opzioni di chat

Per utilizzare un modello diverso per la generazione delle risposte, scegli Modifica modello. Se modifichi il modello, il testo nella finestra della chat verrà completamente cancellato.
Passa al recupero diretto dei blocchi di origine deselezionando Genera risposte. Se modifichi l’impostazione, il testo nella finestra della chat verrà completamente cancellato.
Per cancellare la finestra della chat, seleziona l’icona a forma di scopa ( ).
Per copiare tutto l’output nella finestra della chat, seleziona l’icona di copia ( ).

API

Per interrogare una knowledge base e utilizzare un modello di fondazione per generare risposte basate sui risultati dalle origini dati, invia una richiesta RetrieveAndGenerate con un endpoint di runtime Agent per Amazon Bedrock.

L’API RetrieveAndGenerateStream restituisce i dati in un formato di streaming e consente di accedere alle risposte generate in blocchi senza attendere l’intero risultato.

I seguenti campi sono obbligatori:

Nota

La risposta dell’API contiene eventi di citazione. Il membro citation è stato reso obsoleto. Al suo posto, ti consigliamo di utilizzare i campi generatedResponse e retrievedReferences. Come riferimento, consulta CitationEvent.

Campo	Descrizione di base
input	Contiene un campo `text` per specificare la query.
retrieveAndGenerateConfigurazione	Contiene un RetrieveAndGenerateConfiguration, che specifica le configurazioni per il recupero e la generazione. Per ulteriori dettagli, consultare i contenuti che seguono.

I seguenti campi sono facoltativi:

Campo	Caso d’uso
sessionId	Utilizza lo stesso valore di una sessione precedente per continuare tale sessione e mantenerne il contesto per il modello.
sessionConfiguration	Per includere una chiave KMS personalizzata per la crittografia della sessione.

Includi il campo in. knowledgeBaseConfiguration RetrieveAndGenerateConfiguration Questo campo è mappato su un KnowledgeBaseRetrieveAndGenerateConfigurationoggetto, che contiene i seguenti campi:

I seguenti campi sono obbligatori:

Campo	Descrizione di base
knowledgeBaseId	L’ID della knowledge base da interrogare.
modelArn	L’ARN del modello di fondazione o il profilo di inferenza da utilizzare per la generazione.

I seguenti campi sono facoltativi:

Campo	Caso d’uso
retrievalConfiguration	Per includere configurazioni di query per personalizzare la ricerca vettoriale. Per ulteriori informazioni, consulta KnowledgeBaseRetrievalConfiguration.
orchestrationConfiguration	Per specificare le configurazioni relative al modo in cui il modello elabora il prompt prima del recupero e della generazione. Per ulteriori informazioni, consulta OrchestrationConfiguration.
generationConfiguration	Per specificare le configurazioni per la generazione di risposte. Per ulteriori informazioni, consulta GenerationConfiguration.

Puoi utilizzare un modello di riposizionamento rispetto al modello di classificazione predefinito di Amazon Bedrock Knowledge Bases includendo il rerankingConfiguration campo all'interno di. KnowledgeBaseVectorSearchConfiguration KnowledgeBaseRetrievalConfiguration Il rerankingConfiguration campo è mappato su un VectorSearchRerankingConfigurationoggetto, in cui è possibile specificare il modello di riclassificazione da utilizzare, eventuali campi di richiesta aggiuntivi da includere, gli attributi dei metadati per filtrare i documenti durante la nuova classificazione e il numero di risultati da restituire dopo la nuova classificazione. Per ulteriori informazioni, consulta VectorSearchRerankingConfiguration.

Nota

Se il numberOfRerankedResults valore specificato è maggiore del valore in KnowledgeBaseVectorSearchConfiguration, il numero massimo di risultati che verranno restituiti è il numberOfResults valore per. numberOfResults Un’eccezione è rappresentata dall’utilizzo della decomposizione delle query. Per ulteriori informazioni, consulta la sezione Modifiche alle query in Configurare e personalizzare la generazione di query e risposte. Se si utilizza la decomposizione delle query, numberOfRerankedResults può essere fino a cinque volte superiore rispetto a numberOfResults.

La risposta restituisce la risposta generata nel campo output e i blocchi di origine citati come matrice nel campo citations. Ogni oggetto citation include i seguenti campi:

Campo	Descrizione di base
generatedResponsePart	Nel campo `textResponsePart` è incluso il valore `text` a cui si riferisce la citazione. Il campo `span` fornisce gli indici per l’inizio e la fine della parte dell’output che contiene una citazione.
retrievedReferences	Una matrice di RetrievedReferenceoggetti, ognuno `content` dei quali contiene il blocco di origine `metadata` associato al documento e l'URI o l'URL `location` del documento nell'origine dati. Se il contenuto è un’immagine, l’URI dei dati del contenuto codificato in base64 viene restituito nel seguente formato: `data:image/jpeg;base64,${base64-encoded string}`.

La risposta restituisce anche un valore sessionId che puoi riutilizzare in un’altra richiesta per mantenere la stessa conversazione.

Se hai incluso un valore guardrailConfiguration nella richiesta, il campo guardrailAction segnala se il contenuto è stato bloccato o meno.

Se i dati recuperati contengono immagini, la risposta restituisce anche le seguenti intestazioni di risposta, che contengono i metadati per i blocchi di origine restituiti nella risposta:

x-amz-bedrock-kb-byte-content-source: contiene l’URI Amazon S3 dell’immagine.
x-amz-bedrock-kb-description: contiene la stringa con codifica base64 per l’immagine.

Nota

Non puoi filtrare in base a queste intestazioni di risposta dei metadati durante la configurazione dei filtri dei metadati.

Nota

Se ricevi un errore che indica che il prompt supera il limite di caratteri durante la generazione delle risposte, puoi abbreviare il prompt nei seguenti modi:

Riduci il numero massimo di risultati recuperati (in questo modo si abbrevia ciò che viene inserito per il segnaposto $search_results$ in Modelli di prompt della knowledge base: orchestrazione e generazione).
Ricrea l’origine dati con una strategia di chunking che utilizza blocchi più piccoli (in questo modo si abbrevia ciò che viene inserito per il segnaposto $search_results$ in Modelli di prompt della knowledge base: orchestrazione e generazione).
Abbrevia il modello di prompt.
Abbrevia la query dell’utente (in questo modo si abbrevia ciò che viene compilato per il segnaposto $query$ in Modelli di prompt della knowledge base: orchestrazione e generazione).

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Interrogare una knowledge base e recuperare dei dati

Generazione di una query per dati strutturati