Interrogare una knowledge base e recuperare dei dati - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Interrogare una knowledge base e recuperare dei dati

Importante

I guardrail vengono applicati solo all’input e alla risposta generata dal LLM. Non vengono applicati ai riferimenti recuperati dalle knowledge base in fase di runtime.

Dopo aver configurato la knowledge base, è possibile interrogarla e recuperare dai dati di origine blocchi pertinenti alla query utilizzando l’operazione dell’API Retrieve. È possibile anche utilizzare un modello di riclassificazione al posto del ranker predefinito di Knowledge Base per Amazon Bedrock per classificare i blocchi di origine in base alla pertinenza durante il recupero.

Per informazioni su come interrogare la knowledge base, scegliere la scheda relativa al metodo preferito, poi seguire la procedura:

Console
Come testare la knowledge base
  1. Accedi a Console di gestione AWS con un'identità IAM che dispone delle autorizzazioni per utilizzare la console Amazon Bedrock. Quindi, apri la console Amazon Bedrock in https://console.aws.amazon.com/bedrock.

  2. Nel riquadro di navigazione a sinistra, scegli Knowledge base.

  3. Nella sezione Knowledge base esegui una delle azioni seguenti:

    • Scegli il pulsante di opzione accanto alla knowledge base che desideri testare e seleziona Testa knowledge base. Una finestra di test si espande da destra.

    • Scegli la knowledge base da testare. Una finestra di test si espande da destra.

  4. Per restituire informazioni recuperate direttamente dalla tua knowledge base, disattiva Genera risposte per la tua query nella finestra di test.

  5. (Facoltativo) Seleziona l’icona delle configurazioni ( Three horizontal sliders with adjustable circular controls for settings or parameters. ) per aprire Configurazioni. Per informazioni sulle configurazioni, consulta Configurare e personalizzare la generazione di query e risposte.

  6. Inserisci una query nella casella di testo della finestra di chat e seleziona Esegui per restituire le risposte dalla knowledge base.

  7. I blocchi di origine vengono restituiti direttamente in ordine di pertinenza. Le immagini estratte dall’origine dati possono anche essere restituite come blocco di origine.

  8. Per visualizzare i dettagli sui blocchi restituiti, seleziona Mostra i dettagli dell’origine.

    • Per visualizzare le configurazioni impostate per la query, espandi Configurazioni delle query.

    • Per visualizzare i dettagli su un blocco di origine, espandilo scegliendo la freccia destra ( Play button icon with a triangular shape pointing to the right. ) accanto ad esso. Puoi visualizzare le seguenti informazioni:

      • Il testo non elaborato dal blocco di origine. Per copiare questo testo, scegli l’icona di copia ( Icon representing a crop or resize function, with two overlapping rectangles. ). Se hai utilizzato Amazon S3 per archiviare i dati, scegli l’icona del link esterno ( Icon of a square with an arrow pointing outward from its top-right corner. ) per accedere all’oggetto S3 contenente il file.

      • I metadati associati al blocco di origine, se hai utilizzato Amazon S3 per archiviare i dati. Le attribute/field chiavi e i valori sono definiti nel .metadata.json file associato al documento di origine. Per ulteriori informazioni, consulta la sezione Metadati e filtri in Configurare e personalizzare la generazione di query e risposte.

Opzioni di chat
  • Passa alla generazione di risposte in base ai blocchi di origine recuperati attivando Genera risposte. Se modifichi l’impostazione, il testo nella finestra della chat verrà completamente cancellato.

  • Per cancellare la finestra della chat, seleziona l’icona a forma di scopa ( Magnifying glass icon with a checkmark inside, symbolizing search or inspection. ).

  • Per copiare tutto l’output nella finestra della chat, seleziona l’icona di copia ( Icon representing a crop or resize function, with two overlapping rectangles. ).

API

Per interrogare una knowledge base e restituire solo il testo pertinente dalle origini dati, invia una richiesta Retrieve con un endpoint di runtime di Agent per Amazon Bedrock.

I seguenti campi sono obbligatori:

Campo Descrizione di base
knowledgeBaseId Consente di specificare la knowledge base da interrogare.
retrievalQuery Contiene un campo text per specificare la query.
guardrailsConfiguration Includi campi guardrailsConfiguration come guardrailsId e guardrailsVersion per utilizzare il guardrail nella richiesta

I seguenti campi sono facoltativi:

Campo Caso d’uso
nextToken Consente di restituire il batch di risposte successivo (vedi campi di risposta di seguito).
retrievalConfiguration Per includere configurazioni di query per personalizzare la ricerca vettoriale. Per ulteriori informazioni, consulta KnowledgeBaseVectorSearchConfiguration.

Puoi utilizzare un modello di riclassificazione rispetto al modello di classificazione predefinito di Amazon Bedrock Knowledge Bases includendo il rerankingConfiguration campo nel. KnowledgeBaseVectorSearchConfiguration Il rerankingConfiguration campo è mappato su un VectorSearchRerankingConfigurationoggetto, in cui è possibile specificare il modello di riclassificazione da utilizzare, eventuali campi di richiesta aggiuntivi da includere, gli attributi dei metadati per filtrare i documenti durante la nuova classificazione e il numero di risultati da restituire dopo la nuova classificazione. Per ulteriori informazioni, consulta VectorSearchRerankingConfiguration.

Nota

Se il numberOfRerankedResults valore specificato è maggiore del valore in KnowledgeBaseVectorSearchConfiguration, il numero massimo di risultati che verranno restituiti è il numberOfResults valore per. numberOfResults Un’eccezione è rappresentata dall’utilizzo della decomposizione delle query. Per ulteriori informazioni, vedere la sezione Modifiche alle query in Configurare e personalizzare la generazione di query e risposte. Se si utilizza la decomposizione delle query, numberOfRerankedResults può essere fino a cinque volte superiore rispetto a numberOfResults.

La risposta restituisce i blocchi di origine dall'origine dati come matrice di KnowledgeBaseRetrievalResultoggetti nel retrievalResults campo. Ciascuno KnowledgeBaseRetrievalResultcontiene i seguenti campi:

Campo Description
contenuto Contiene un blocco di origine di testo in text o un blocco di origine di immagine nel campo byteContent. Se il contenuto è un’immagine, l’URI dei dati del contenuto codificato in base64 viene restituito nel seguente formato: data:image/jpeg;base64,${base64-encoded string}.
metadati Contiene ogni attributo di metadati come chiave e il valore dei metadati come valore JSON a cui la chiave è mappata.
location Contiene l’URI o l’URL del documento a cui appartiene il blocco di origine.
score Il punteggio di pertinenza del documento. utilizzabile per analizzare la classifica dei risultati.

Se il numero di blocchi di origine supera quello che può essere contenuto nella risposta, nel campo nextToken viene restituito un valore. Usa quel valore in un’altra richiesta per restituire il successivo batch di risultati.

Se i dati recuperati contengono immagini, la risposta restituisce anche le seguenti intestazioni di risposta, che contengono i metadati per i blocchi di origine restituiti nella risposta:

  • x-amz-bedrock-kb-byte-content-source: contiene l’URI Amazon S3 dell’immagine.

  • x-amz-bedrock-kb-description: contiene la stringa con codifica base64 per l’immagine.

Interrogazioni multimodali

Per le knowledge base che utilizzano modelli di incorporamento multimodali, è possibile eseguire query con testo o immagini. Il retrievalQuery campo supporta un multimodalInputList campo per le interrogazioni sulle immagini:

Nota

Per una guida completa sulla configurazione e l'utilizzo delle basi di conoscenza multimodali, inclusa la scelta tra gli approcci Nova e BDA, vedere. Crea una base di conoscenze per contenuti multimodali

È possibile eseguire interrogazioni con immagini utilizzando il campo: multimodalInputList

{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }

Oppure puoi eseguire una query solo con testo utilizzando il text campo:

{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "text": "Find similar shoes" } }
Schemi di interrogazione multimodali comuni

Di seguito sono riportati alcuni modelli di interrogazione comuni:

Image-to-image ricerca

Carica un'immagine per trovare immagini visivamente simili. Esempio: carica una foto di una scarpa Nike rossa per trovare scarpe simili nel tuo catalogo prodotti.

Ricerca basata su testo

Utilizza le interrogazioni di testo per trovare contenuti pertinenti. Esempio: «Trova scarpe simili» per cercare nel catalogo dei prodotti utilizzando descrizioni testuali.

Ricerca visiva di documenti

Cerca grafici, diagrammi o elementi visivi all'interno dei documenti. Esempio: carica un'immagine del grafico per trovare grafici simili nella tua raccolta di documenti.

Scelta tra Nova e BDA per contenuti multimodali

Quando lavori con contenuti multimodali, scegli il tuo approccio in base al tipo di contenuto e ai modelli di query:

Matrice decisionale Nova vs BDA
Content Type Usa Nova Multimodal Embeddings Usa il parser Bedrock Data Automation (BDA)
Contenuti video Concentrazione sulla narrazione visiva (sport, pubblicità, dimostrazioni), domande sugli elementi visivi, contenuti vocali minimi Domande importanti speech/narration (presentazioni, riunioni, tutorial), domande sui contenuti parlati, necessitano di trascrizioni
Contenuti audio Identificazione di musica o effetti sonori, analisi audio non vocale Podcast, interviste, riunioni, qualsiasi contenuto il cui discorso richieda la trascrizione
Contenuto dell'immagine Ricerche per somiglianza visiva, image-to-image recupero, analisi dei contenuti visivi Estrazione del testo dalle immagini, elaborazione dei documenti, requisiti OCR
Nota

Gli incorporamenti multimodali Nova non possono elaborare direttamente i contenuti vocali. Se i tuoi file audio o video contengono importanti informazioni vocali, usa prima il parser BDA per convertire il parlato in testo, oppure scegli invece un modello di incorporamento del testo.

Limitazioni delle interrogazioni multimodali

Di seguito sono riportate alcune limitazioni relative alle interrogazioni multimodali:

  • Massimo un'immagine per query nella versione corrente

  • Le query di immagini sono supportate solo con modelli di incorporamento multimodali (Titan G1 o Cohere Embed v3)

  • RetrieveAndGenerate L'API non è supportata per le knowledge base con modelli di incorporamento multimodali e bucket di contenuti S3

  • Se si fornisce una query di immagine a una knowledge base utilizzando modelli di incorporamento di solo testo, verrà restituito un errore 4xx

Struttura di risposta API multimodale

Le risposte di recupero per i contenuti multimodali includono metadati aggiuntivi:

  • URI di origine: indica la posizione originale del bucket S3

  • URI supplementare: indica la copia nel bucket di archiviazione multimodale

  • Metadati timestamp: inclusi per i blocchi video e audio per consentire un posizionamento preciso della riproduzione

Nota

Quando utilizzi l'API o l'SDK, dovrai gestire il recupero dei file e la navigazione con timestamp nell'applicazione. La console gestisce questa operazione automaticamente con una riproduzione video migliorata e una navigazione automatica con timestamp.

Nota

Se ricevi un errore che indica che il prompt supera il limite di caratteri durante la generazione delle risposte, puoi abbreviare il prompt nei seguenti modi: