Interrogare una knowledge base e generare risposte basate sui dati recuperati - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Interrogare una knowledge base e generare risposte basate sui dati recuperati

Importante

I guardrail vengono applicati solo all’input e alla risposta generata dal LLM. Non vengono applicati ai riferimenti recuperati dalle knowledge base in fase di runtime.

Dopo aver configurato la knowledge base, è possibile interrogarla e generare risposte basate sui blocchi recuperati dall’origine dati mediante l’operazione API RetrieveAndGenerate. Le risposte vengono restituite con citazioni che rimandano ai dati di origine. È possibile anche utilizzare un modello di riclassificazione al posto del ranker predefinito di Knowledge Base per Amazon Bedrock per classificare i blocchi di origine in base alla pertinenza durante il recupero.

Limitazioni dei contenuti multimodali

RetrieveAndGenerateha un supporto limitato per i contenuti multimodali. Quando si utilizza Nova Multimodal Embeddings, la funzionalità RAG è limitata al solo contenuto testuale. Per un supporto multimodale completo, inclusa l'elaborazione audio e video, utilizzate BDA con modelli di incorporamento del testo. Per informazioni dettagliate, vedi Crea una base di conoscenze per contenuti multimodali.

Nota

Le immagini restituite dalla risposta di Retrieve durante il flusso RetrieveAndGenerate sono incluse nel prompt per la generazione della risposta. La risposta di RetrieveAndGenerate non può includere immagini, ma può citare le origini che le contengono.

Per informazioni su come interrogare la knowledge base, scegli la scheda relativa al metodo preferito, quindi segui la procedura:

Console
Come testare la knowledge base
  1. Accedi a Console di gestione AWS con un'identità IAM che dispone delle autorizzazioni per utilizzare la console Amazon Bedrock. Quindi, apri la console Amazon Bedrock in https://console.aws.amazon.com/bedrock.

  2. Nel riquadro di navigazione a sinistra, scegli Knowledge base.

  3. Nella sezione Knowledge base esegui una delle azioni seguenti:

    • Scegli il pulsante di opzione accanto alla knowledge base che desideri testare e seleziona Testa knowledge base. Una finestra di test si espande da destra.

    • Scegli la knowledge base da testare. Una finestra di test si espande da destra.

  4. Per generare risposte sulla base delle informazioni recuperate dalla tua knowledge base, attiva Genera risposte per la tua query. Amazon Bedrock genera risposte in base alle origini dati e cita le informazioni fornite con note a piè di pagina.

  5. Per scegliere un modello da utilizzare per la generazione delle risposte, scegli Seleziona modello. Quindi seleziona Applica.

  6. (Facoltativo) Seleziona l’icona delle configurazioni ( Three horizontal sliders with adjustable circular controls for settings or parameters. ) per aprire Configurazioni. Per informazioni sulle configurazioni, consulta Configurare e personalizzare la generazione di query e risposte.

  7. Inserisci una query nella casella di testo della finestra di chat e seleziona Esegui per restituire le risposte dalla knowledge base.

  8. Seleziona una nota a piè di pagina per visualizzare un estratto dall’origine citata relativa alla parte specifica della risposta. Scegli il link per accedere all’oggetto S3 che contiene il file.

  9. Per visualizzare i dettagli sui blocchi restituiti, seleziona Mostra i dettagli dell’origine.

    • Per visualizzare le configurazioni impostate per la query, espandi Configurazioni delle query.

    • Per visualizzare i dettagli su un blocco di origine, espandilo scegliendo la freccia destra ( Play button icon with a triangular shape pointing to the right. ) accanto ad esso. Puoi visualizzare le seguenti informazioni:

      • Il testo non elaborato dal blocco di origine. Per copiare questo testo, scegli l’icona di copia ( Icon representing a crop or resize function, with two overlapping rectangles. ). Se hai utilizzato Amazon S3 per archiviare i dati, scegli l’icona del link esterno ( Icon of a square with an arrow pointing outward from its top-right corner. ) per accedere all’oggetto S3 contenente il file.

      • I metadati associati al blocco di origine, se hai utilizzato Amazon S3 per archiviare i dati. Le attribute/field chiavi e i valori sono definiti nel .metadata.json file associato al documento di origine. Per ulteriori informazioni, consulta la sezione Metadati e filtri in Configurare e personalizzare la generazione di query e risposte.

Opzioni di chat
  • Per utilizzare un modello diverso per la generazione delle risposte, scegli Modifica modello. Se modifichi il modello, il testo nella finestra della chat verrà completamente cancellato.

  • Passa al recupero diretto dei blocchi di origine deselezionando Genera risposte. Se modifichi l’impostazione, il testo nella finestra della chat verrà completamente cancellato.

  • Per cancellare la finestra della chat, seleziona l’icona a forma di scopa ( Magnifying glass icon with a checkmark inside, symbolizing search or inspection. ).

  • Per copiare tutto l’output nella finestra della chat, seleziona l’icona di copia ( Icon representing a crop or resize function, with two overlapping rectangles. ).

API

Per interrogare una knowledge base e utilizzare un modello di fondazione per generare risposte basate sui risultati dalle origini dati, invia una richiesta RetrieveAndGenerate con un endpoint di runtime Agent per Amazon Bedrock.

L’API RetrieveAndGenerateStream restituisce i dati in un formato di streaming e consente di accedere alle risposte generate in blocchi senza attendere l’intero risultato.

I seguenti campi sono obbligatori:

Nota

La risposta dell’API contiene eventi di citazione. Il membro citation è stato reso obsoleto. Al suo posto, ti consigliamo di utilizzare i campi generatedResponse e retrievedReferences. Come riferimento, consulta CitationEvent.

Campo Descrizione di base
input Contiene un campo text per specificare la query.
retrieveAndGenerateConfigurazione Contiene un RetrieveAndGenerateConfiguration, che specifica le configurazioni per il recupero e la generazione. Per ulteriori dettagli, consultare i contenuti che seguono.

I seguenti campi sono facoltativi:

Campo Caso d’uso
sessionId Utilizza lo stesso valore di una sessione precedente per continuare tale sessione e mantenerne il contesto per il modello.
sessionConfiguration Per includere una chiave KMS personalizzata per la crittografia della sessione.

Includi il campo in. knowledgeBaseConfiguration RetrieveAndGenerateConfiguration Questo campo è mappato su un KnowledgeBaseRetrieveAndGenerateConfigurationoggetto, che contiene i seguenti campi:

  • I seguenti campi sono obbligatori:

    Campo Descrizione di base
    knowledgeBaseId L’ID della knowledge base da interrogare.
    modelArn L’ARN del modello di fondazione o il profilo di inferenza da utilizzare per la generazione.
  • I seguenti campi sono facoltativi:

    Campo Caso d’uso
    retrievalConfiguration Per includere configurazioni di query per personalizzare la ricerca vettoriale. Per ulteriori informazioni, consulta KnowledgeBaseRetrievalConfiguration.
    orchestrationConfiguration Per specificare le configurazioni relative al modo in cui il modello elabora il prompt prima del recupero e della generazione. Per ulteriori informazioni, consulta OrchestrationConfiguration.
    generationConfiguration Per specificare le configurazioni per la generazione di risposte. Per ulteriori informazioni, consulta GenerationConfiguration.

Puoi utilizzare un modello di riposizionamento rispetto al modello di classificazione predefinito di Amazon Bedrock Knowledge Bases includendo il rerankingConfiguration campo all'interno di. KnowledgeBaseVectorSearchConfigurationKnowledgeBaseRetrievalConfiguration Il rerankingConfiguration campo è mappato su un VectorSearchRerankingConfigurationoggetto, in cui è possibile specificare il modello di riclassificazione da utilizzare, eventuali campi di richiesta aggiuntivi da includere, gli attributi dei metadati per filtrare i documenti durante la nuova classificazione e il numero di risultati da restituire dopo la nuova classificazione. Per ulteriori informazioni, consulta VectorSearchRerankingConfiguration.

Nota

Se il numberOfRerankedResults valore specificato è maggiore del valore in KnowledgeBaseVectorSearchConfiguration, il numero massimo di risultati che verranno restituiti è il numberOfResults valore per. numberOfResults Un’eccezione è rappresentata dall’utilizzo della decomposizione delle query. Per ulteriori informazioni, consulta la sezione Modifiche alle query in Configurare e personalizzare la generazione di query e risposte. Se si utilizza la decomposizione delle query, numberOfRerankedResults può essere fino a cinque volte superiore rispetto a numberOfResults.

La risposta restituisce la risposta generata nel campo output e i blocchi di origine citati come matrice nel campo citations. Ogni oggetto citation include i seguenti campi:

Campo Descrizione di base
generatedResponsePart Nel campo textResponsePart è incluso il valore text a cui si riferisce la citazione. Il campo span fornisce gli indici per l’inizio e la fine della parte dell’output che contiene una citazione.
retrievedReferences Una matrice di RetrievedReferenceoggetti, ognuno content dei quali contiene il blocco di origine metadata associato al documento e l'URI o l'URL location del documento nell'origine dati. Se il contenuto è un’immagine, l’URI dei dati del contenuto codificato in base64 viene restituito nel seguente formato: data:image/jpeg;base64,${base64-encoded string}.

La risposta restituisce anche un valore sessionId che puoi riutilizzare in un’altra richiesta per mantenere la stessa conversazione.

Se hai incluso un valore guardrailConfiguration nella richiesta, il campo guardrailAction segnala se il contenuto è stato bloccato o meno.

Se i dati recuperati contengono immagini, la risposta restituisce anche le seguenti intestazioni di risposta, che contengono i metadati per i blocchi di origine restituiti nella risposta:

  • x-amz-bedrock-kb-byte-content-source: contiene l’URI Amazon S3 dell’immagine.

  • x-amz-bedrock-kb-description: contiene la stringa con codifica base64 per l’immagine.

Nota

Non puoi filtrare in base a queste intestazioni di risposta dei metadati durante la configurazione dei filtri dei metadati.

Nota

Se ricevi un errore che indica che il prompt supera il limite di caratteri durante la generazione delle risposte, puoi abbreviare il prompt nei seguenti modi: