Interrogare una knowledge base e recuperare dei dati

Importante

I guardrail vengono applicati solo all’input e alla risposta generata dal LLM. Non vengono applicati ai riferimenti recuperati dalle knowledge base in fase di runtime.

Dopo aver configurato la knowledge base, è possibile interrogarla e recuperare dai dati di origine blocchi pertinenti alla query utilizzando l’operazione dell’API Retrieve. È possibile anche utilizzare un modello di riclassificazione al posto del ranker predefinito di Knowledge Base per Amazon Bedrock per classificare i blocchi di origine in base alla pertinenza durante il recupero.

Per informazioni su come interrogare la knowledge base, scegliere la scheda relativa al metodo preferito, poi seguire la procedura:

Console

Come testare la knowledge base

Accedi a Console di gestione AWS con un'identità IAM che dispone delle autorizzazioni per utilizzare la console Amazon Bedrock. Quindi, apri la console Amazon Bedrock all'indirizzo https://console.aws.amazon.com/bedrock.
Nel riquadro di navigazione a sinistra, scegli Knowledge base.
Nella sezione Knowledge base esegui una delle azioni seguenti:
- Scegli il pulsante di opzione accanto alla knowledge base che desideri testare e seleziona Testa knowledge base. Una finestra di test si espande da destra.
- Scegli la knowledge base da testare. Una finestra di test si espande da destra.
Per restituire informazioni recuperate direttamente dalla tua knowledge base, disattiva Genera risposte per la tua query nella finestra di test.
(Facoltativo) Seleziona l’icona delle configurazioni ( ) per aprire Configurazioni. Per informazioni sulle configurazioni, consulta Configurare e personalizzare la generazione di query e risposte.
Inserisci una query nella casella di testo della finestra di chat e seleziona Esegui per restituire le risposte dalla knowledge base.
I blocchi di origine vengono restituiti direttamente in ordine di pertinenza. Le immagini estratte dall’origine dati possono anche essere restituite come blocco di origine.
Per visualizzare i dettagli sui blocchi restituiti, seleziona Mostra i dettagli dell’origine.
- Per visualizzare le configurazioni impostate per la query, espandi Configurazioni delle query.
- Per visualizzare i dettagli su un blocco di origine, espandilo scegliendo la freccia destra ( ) accanto ad esso. Puoi visualizzare le seguenti informazioni:
  - Il testo non elaborato dal blocco di origine. Per copiare questo testo, scegli l’icona di copia ( ). Se hai utilizzato Amazon S3 per archiviare i dati, scegli l’icona del link esterno ( ) per accedere all’oggetto S3 contenente il file.
  - I metadati associati al blocco di origine, se hai utilizzato Amazon S3 per archiviare i dati. Le attribute/field chiavi e i valori sono definiti nel .metadata.json file associato al documento di origine. Per ulteriori informazioni, consulta la sezione Metadati e filtri in Configurare e personalizzare la generazione di query e risposte.

Opzioni di chat

Passa alla generazione di risposte in base ai blocchi di origine recuperati attivando Genera risposte. Se modifichi l’impostazione, il testo nella finestra della chat verrà completamente cancellato.
Per cancellare la finestra della chat, seleziona l’icona a forma di scopa ( ).
Per copiare tutto l’output nella finestra della chat, seleziona l’icona di copia ( ).

API

Per interrogare una knowledge base e restituire solo il testo pertinente dalle origini dati, invia una richiesta Retrieve con un endpoint di runtime di Agent per Amazon Bedrock.

I seguenti campi sono obbligatori:

Campo	Descrizione di base
conoscenza BaseId	Consente di specificare la knowledge base da interrogare.
retrievalQuery	Contiene un campo `text` per specificare la query.
guardrailsConfiguration	Includi campi guardrailsConfiguration come `guardrailsId` e `guardrailsVersion` per utilizzare il guardrail nella richiesta

I seguenti campi sono facoltativi:

Campo	Caso d’uso
nextToken	Consente di restituire il batch di risposte successivo (vedi campi di risposta di seguito).
retrievalConfiguration	Per includere configurazioni di query per personalizzare la ricerca vettoriale. Per ulteriori informazioni, consulta KnowledgeBaseVectorSearchConfiguration.

Puoi utilizzare un modello di riclassificazione rispetto al modello di classificazione predefinito di Amazon Bedrock Knowledge Bases includendo il rerankingConfiguration campo nel. KnowledgeBaseVectorSearchConfiguration Il rerankingConfiguration campo è mappato su un VectorSearchRerankingConfigurationoggetto, in cui è possibile specificare il modello di riclassificazione da utilizzare, eventuali campi di richiesta aggiuntivi da includere, gli attributi dei metadati per filtrare i documenti durante la nuova classificazione e il numero di risultati da restituire dopo la nuova classificazione. Per ulteriori informazioni, consulta VectorSearchRerankingConfiguration.

Nota

Se il numberOfRerankedResults valore specificato è maggiore del valore in KnowledgeBaseVectorSearchConfiguration, il numero massimo di risultati che verranno restituiti è il numberOfResults valore per. numberOfResults Un’eccezione è rappresentata dall’utilizzo della decomposizione delle query. Per ulteriori informazioni, vedere la sezione Modifiche alle query in Configurare e personalizzare la generazione di query e risposte. Se si utilizza la decomposizione delle query, numberOfRerankedResults può essere fino a cinque volte superiore rispetto a numberOfResults.

La risposta restituisce i blocchi di origine dall'origine dati come matrice di KnowledgeBaseRetrievalResultoggetti nel retrievalResults campo. Ciascuno KnowledgeBaseRetrievalResultcontiene i seguenti campi:

Campo	Description
contenuto	Contiene un blocco di origine di testo in `text` o un blocco di origine di immagine nel campo `byteContent`. Se il contenuto è un’immagine, l’URI dei dati del contenuto codificato in base64 viene restituito nel seguente formato: `data:image/jpeg;base64,${base64-encoded string}`.
metadati	Contiene ogni attributo di metadati come chiave e il valore dei metadati come valore JSON a cui la chiave è mappata.
location	Contiene l’URI o l’URL del documento a cui appartiene il blocco di origine.
score	Il punteggio di pertinenza del documento. utilizzabile per analizzare la classifica dei risultati.

Se il numero di blocchi di origine supera quello che può essere contenuto nella risposta, nel campo nextToken viene restituito un valore. Usa quel valore in un’altra richiesta per restituire il successivo batch di risultati.

Se i dati recuperati contengono immagini, la risposta restituisce anche le seguenti intestazioni di risposta, che contengono i metadati per i blocchi di origine restituiti nella risposta:

x-amz-bedrock-kb-byte-content-source: contiene l’URI Amazon S3 dell’immagine.
x-amz-bedrock-kb-description: contiene la stringa con codifica base64 per l’immagine.

Nota

Non puoi filtrare in base a queste intestazioni di risposta dei metadati durante la configurazione dei filtri dei metadati.

Interrogazioni multimodali

Per le knowledge base che utilizzano modelli di incorporamento multimodali, è possibile eseguire query con testo o immagini. Il retrievalQuery campo supporta un multimodalInputList campo per le interrogazioni sulle immagini:

Nota

Per una guida completa sulla configurazione e l'utilizzo delle basi di conoscenza multimodali, inclusa la scelta tra gli approcci Nova e BDA, vedere. Crea una base di conoscenze per contenuti multimodali

È possibile eseguire interrogazioni con immagini utilizzando il campo: multimodalInputList


{
    "knowledgeBaseId": "EXAMPLE123", 
    "retrievalQuery": {
        "multimodalInputList": [
            {
                "content": {
                    "byteContent": "base64-encoded-image-data"
                },
                "modality": "IMAGE"
            }
        ]
    }
}

Oppure puoi eseguire una query solo con testo utilizzando il text campo:


{
    "knowledgeBaseId": "EXAMPLE123",
    "retrievalQuery": {
        "text": "Find similar shoes"
    }
}

Schemi di interrogazione multimodali comuni

Di seguito sono riportati alcuni modelli di interrogazione comuni:

Image-to-image ricerca: Carica un'immagine per trovare immagini visivamente simili. Esempio: carica una foto di una scarpa Nike rossa per trovare scarpe simili nel tuo catalogo prodotti.
Text-based ricerca: Utilizza le query di testo per trovare contenuti pertinenti. Esempio: «Trova scarpe simili» per cercare nel catalogo dei prodotti utilizzando descrizioni testuali.
Ricerca visiva di documenti: Cerca grafici, diagrammi o elementi visivi all'interno dei documenti. Esempio: carica un'immagine del grafico per trovare grafici simili nella tua raccolta di documenti.

Scelta tra Nova e BDA per contenuti multimodali

Quando lavori con contenuti multimodali, scegli il tuo approccio in base al tipo di contenuto e ai modelli di query:

Matrice decisionale Nova vs BDA
Content Type	Usa Nova Multimodal Embeddings	Usa il parser Bedrock Data Automation (BDA)
Contenuti video	Concentrazione sulla narrazione visiva (sport, pubblicità, dimostrazioni), domande sugli elementi visivi, contenuti vocali minimi	Domande importanti speech/narration (presentazioni, riunioni, tutorial), domande sui contenuti parlati, necessitano di trascrizioni
Contenuti audio	Identificazione di musica o effetti sonori, analisi audio non vocale	Podcast, interviste, riunioni, qualsiasi contenuto il cui discorso richieda la trascrizione
Contenuto dell'immagine	Ricerche di similarità visiva, recupero da immagine a immagine, analisi dei contenuti visivi	Estrazione del testo dalle immagini, elaborazione dei documenti, requisiti OCR

Nota

Gli incorporamenti multimodali Nova non possono elaborare direttamente i contenuti vocali. Se i tuoi file audio o video contengono importanti informazioni vocali, usa prima il parser BDA per convertire il parlato in testo, oppure scegli invece un modello di incorporamento del testo.

Limitazioni delle interrogazioni multimodali

Di seguito sono riportate alcune limitazioni relative alle interrogazioni multimodali:

Massimo un'immagine per query nella versione corrente
Le query di immagini sono supportate solo con modelli di incorporamento multimodali (Titan G1 o Cohere Embed v3)
RetrieveAndGenerate L'API non è supportata per le knowledge base con modelli di incorporamento multimodali e bucket di contenuti S3
Se si fornisce una query di immagine a una knowledge base utilizzando modelli di incorporamento di solo testo, verrà restituito un errore 4xx

Struttura di risposta API multimodale

Le risposte di recupero per i contenuti multimodali includono metadati aggiuntivi:

URI di origine: indica la posizione originale del bucket S3
URI supplementare: indica la copia nel bucket di archiviazione multimodale
Metadati timestamp: inclusi per i blocchi video e audio per consentire un posizionamento preciso della riproduzione

Nota

Quando utilizzi l'API o l'SDK, dovrai gestire il recupero dei file e la navigazione con timestamp nell'applicazione. La console gestisce questa operazione automaticamente con una riproduzione video migliorata e una navigazione automatica con timestamp.

Nota

Se ricevi un errore che indica che il prompt supera il limite di caratteri durante la generazione delle risposte, puoi abbreviare il prompt nei seguenti modi:

Riduci il numero massimo di risultati recuperati (in questo modo si accorcia ciò che viene inserito per il segnaposto $search_results$ in Modelli di prompt della Knowledge Base: generazione dell'orchestrazione &).
Ricrea l’origine dati con una strategia di suddivisione in blocchi che utilizza blocchi più piccoli (in questo modo si accorcia ciò che viene inserito per il segnaposto $search_results$ in Modelli di prompt della Knowledge Base: generazione dell'orchestrazione &).
Abbrevia il modello di prompt.
Abbrevia la query dell’utente (in questo modo si accorcia ciò che viene compilato per il segnaposto $query$ in Modelli di prompt della Knowledge Base: generazione dell'orchestrazione &).

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Test della knowledge base con query e risposte

Interrogare una knowledge base e generare risposte