Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Interrogare una knowledge base e recuperare dei dati
Importante
I guardrail vengono applicati solo all’input e alla risposta generata dal LLM. Non vengono applicati ai riferimenti recuperati dalle knowledge base in fase di runtime.
Dopo aver configurato la knowledge base, è possibile interrogarla e recuperare dai dati di origine blocchi pertinenti alla query utilizzando l’operazione dell’API Retrieve. È possibile anche utilizzare un modello di riclassificazione al posto del ranker predefinito di Knowledge Base per Amazon Bedrock per classificare i blocchi di origine in base alla pertinenza durante il recupero.
Per informazioni su come interrogare la knowledge base, scegliere la scheda relativa al metodo preferito, poi seguire la procedura:
- Console
-
Come testare la knowledge base
-
Accedi a Console di gestione AWS con un'identità IAM che dispone delle autorizzazioni per utilizzare la console Amazon Bedrock. Quindi, apri la console Amazon Bedrock in https://console.aws.amazon.com/bedrock.
-
Nel riquadro di navigazione a sinistra, scegli Knowledge base.
-
Nella sezione Knowledge base esegui una delle azioni seguenti:
-
Scegli il pulsante di opzione accanto alla knowledge base che desideri testare e seleziona Testa knowledge base. Una finestra di test si espande da destra.
-
Scegli la knowledge base da testare. Una finestra di test si espande da destra.
-
-
Per restituire informazioni recuperate direttamente dalla tua knowledge base, disattiva Genera risposte per la tua query nella finestra di test.
-
(Facoltativo) Seleziona l’icona delle configurazioni (
) per aprire Configurazioni. Per informazioni sulle configurazioni, consulta Configurare e personalizzare la generazione di query e risposte. -
Inserisci una query nella casella di testo della finestra di chat e seleziona Esegui per restituire le risposte dalla knowledge base.
-
I blocchi di origine vengono restituiti direttamente in ordine di pertinenza. Le immagini estratte dall’origine dati possono anche essere restituite come blocco di origine.
-
Per visualizzare i dettagli sui blocchi restituiti, seleziona Mostra i dettagli dell’origine.
-
Per visualizzare le configurazioni impostate per la query, espandi Configurazioni delle query.
-
Per visualizzare i dettagli su un blocco di origine, espandilo scegliendo la freccia destra (
) accanto ad esso. Puoi visualizzare le seguenti informazioni:-
Il testo non elaborato dal blocco di origine. Per copiare questo testo, scegli l’icona di copia (
). Se hai utilizzato Amazon S3 per archiviare i dati, scegli l’icona del link esterno (
) per accedere all’oggetto S3 contenente il file. -
I metadati associati al blocco di origine, se hai utilizzato Amazon S3 per archiviare i dati. Le attribute/field chiavi e i valori sono definiti nel
.metadata.jsonfile associato al documento di origine. Per ulteriori informazioni, consulta la sezione Metadati e filtri in Configurare e personalizzare la generazione di query e risposte.
-
-
Opzioni di chat
-
Passa alla generazione di risposte in base ai blocchi di origine recuperati attivando Genera risposte. Se modifichi l’impostazione, il testo nella finestra della chat verrà completamente cancellato.
-
Per cancellare la finestra della chat, seleziona l’icona a forma di scopa (
). -
Per copiare tutto l’output nella finestra della chat, seleziona l’icona di copia (
).
-
- API
-
Per interrogare una knowledge base e restituire solo il testo pertinente dalle origini dati, invia una richiesta Retrieve con un endpoint di runtime di Agent per Amazon Bedrock.
I seguenti campi sono obbligatori:
Campo Descrizione di base knowledgeBaseId Consente di specificare la knowledge base da interrogare. retrievalQuery Contiene un campo textper specificare la query.guardrailsConfiguration Includi campi guardrailsConfiguration come guardrailsIdeguardrailsVersionper utilizzare il guardrail nella richiestaI seguenti campi sono facoltativi:
Campo Caso d’uso nextToken Consente di restituire il batch di risposte successivo (vedi campi di risposta di seguito). retrievalConfiguration Per includere configurazioni di query per personalizzare la ricerca vettoriale. Per ulteriori informazioni, consulta KnowledgeBaseVectorSearchConfiguration. Puoi utilizzare un modello di riclassificazione rispetto al modello di classificazione predefinito di Amazon Bedrock Knowledge Bases includendo il
rerankingConfigurationcampo nel. KnowledgeBaseVectorSearchConfiguration IlrerankingConfigurationcampo è mappato su un VectorSearchRerankingConfigurationoggetto, in cui è possibile specificare il modello di riclassificazione da utilizzare, eventuali campi di richiesta aggiuntivi da includere, gli attributi dei metadati per filtrare i documenti durante la nuova classificazione e il numero di risultati da restituire dopo la nuova classificazione. Per ulteriori informazioni, consulta VectorSearchRerankingConfiguration.Nota
Se il
numberOfRerankedResultsvalore specificato è maggiore del valore in KnowledgeBaseVectorSearchConfiguration, il numero massimo di risultati che verranno restituiti è ilnumberOfResultsvalore per.numberOfResultsUn’eccezione è rappresentata dall’utilizzo della decomposizione delle query. Per ulteriori informazioni, vedere la sezione Modifiche alle query in Configurare e personalizzare la generazione di query e risposte. Se si utilizza la decomposizione delle query,numberOfRerankedResultspuò essere fino a cinque volte superiore rispetto anumberOfResults.La risposta restituisce i blocchi di origine dall'origine dati come matrice di KnowledgeBaseRetrievalResultoggetti nel
retrievalResultscampo. Ciascuno KnowledgeBaseRetrievalResultcontiene i seguenti campi:Campo Description contenuto Contiene un blocco di origine di testo in texto un blocco di origine di immagine nel campobyteContent. Se il contenuto è un’immagine, l’URI dei dati del contenuto codificato in base64 viene restituito nel seguente formato:data:image/jpeg;base64,.${base64-encoded string}metadati Contiene ogni attributo di metadati come chiave e il valore dei metadati come valore JSON a cui la chiave è mappata. location Contiene l’URI o l’URL del documento a cui appartiene il blocco di origine. score Il punteggio di pertinenza del documento. utilizzabile per analizzare la classifica dei risultati. Se il numero di blocchi di origine supera quello che può essere contenuto nella risposta, nel campo
nextTokenviene restituito un valore. Usa quel valore in un’altra richiesta per restituire il successivo batch di risultati.Se i dati recuperati contengono immagini, la risposta restituisce anche le seguenti intestazioni di risposta, che contengono i metadati per i blocchi di origine restituiti nella risposta:
-
x-amz-bedrock-kb-byte-content-source: contiene l’URI Amazon S3 dell’immagine. -
x-amz-bedrock-kb-description: contiene la stringa con codifica base64 per l’immagine.
Interrogazioni multimodali
Per le knowledge base che utilizzano modelli di incorporamento multimodali, è possibile eseguire query con testo o immagini. Il
retrievalQuerycampo supporta unmultimodalInputListcampo per le interrogazioni sulle immagini:Nota
Per una guida completa sulla configurazione e l'utilizzo delle basi di conoscenza multimodali, inclusa la scelta tra gli approcci Nova e BDA, vedere. Crea una base di conoscenze per contenuti multimodali
È possibile eseguire interrogazioni con immagini utilizzando il campo:
multimodalInputList{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }Oppure puoi eseguire una query solo con testo utilizzando il
textcampo:{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "text": "Find similar shoes" } }Schemi di interrogazione multimodali comuni
Di seguito sono riportati alcuni modelli di interrogazione comuni:
- Image-to-image ricerca
-
Carica un'immagine per trovare immagini visivamente simili. Esempio: carica una foto di una scarpa Nike rossa per trovare scarpe simili nel tuo catalogo prodotti.
- Ricerca basata su testo
-
Utilizza le interrogazioni di testo per trovare contenuti pertinenti. Esempio: «Trova scarpe simili» per cercare nel catalogo dei prodotti utilizzando descrizioni testuali.
- Ricerca visiva di documenti
-
Cerca grafici, diagrammi o elementi visivi all'interno dei documenti. Esempio: carica un'immagine del grafico per trovare grafici simili nella tua raccolta di documenti.
Scelta tra Nova e BDA per contenuti multimodali
Quando lavori con contenuti multimodali, scegli il tuo approccio in base al tipo di contenuto e ai modelli di query:
Matrice decisionale Nova vs BDA Content Type Usa Nova Multimodal Embeddings Usa il parser Bedrock Data Automation (BDA) Contenuti video Concentrazione sulla narrazione visiva (sport, pubblicità, dimostrazioni), domande sugli elementi visivi, contenuti vocali minimi Domande importanti speech/narration (presentazioni, riunioni, tutorial), domande sui contenuti parlati, necessitano di trascrizioni Contenuti audio Identificazione di musica o effetti sonori, analisi audio non vocale Podcast, interviste, riunioni, qualsiasi contenuto il cui discorso richieda la trascrizione Contenuto dell'immagine Ricerche per somiglianza visiva, image-to-image recupero, analisi dei contenuti visivi Estrazione del testo dalle immagini, elaborazione dei documenti, requisiti OCR Nota
Gli incorporamenti multimodali Nova non possono elaborare direttamente i contenuti vocali. Se i tuoi file audio o video contengono importanti informazioni vocali, usa prima il parser BDA per convertire il parlato in testo, oppure scegli invece un modello di incorporamento del testo.
Limitazioni delle interrogazioni multimodali
Di seguito sono riportate alcune limitazioni relative alle interrogazioni multimodali:
-
Massimo un'immagine per query nella versione corrente
-
Le query di immagini sono supportate solo con modelli di incorporamento multimodali (Titan G1 o Cohere Embed v3)
-
RetrieveAndGenerate L'API non è supportata per le knowledge base con modelli di incorporamento multimodali e bucket di contenuti S3
-
Se si fornisce una query di immagine a una knowledge base utilizzando modelli di incorporamento di solo testo, verrà restituito un errore 4xx
Struttura di risposta API multimodale
Le risposte di recupero per i contenuti multimodali includono metadati aggiuntivi:
-
URI di origine: indica la posizione originale del bucket S3
-
URI supplementare: indica la copia nel bucket di archiviazione multimodale
-
Metadati timestamp: inclusi per i blocchi video e audio per consentire un posizionamento preciso della riproduzione
Nota
Quando utilizzi l'API o l'SDK, dovrai gestire il recupero dei file e la navigazione con timestamp nell'applicazione. La console gestisce questa operazione automaticamente con una riproduzione video migliorata e una navigazione automatica con timestamp.
-
Nota
Se ricevi un errore che indica che il prompt supera il limite di caratteri durante la generazione delle risposte, puoi abbreviare il prompt nei seguenti modi:
-
Riduci il numero massimo di risultati recuperati (in questo modo si accorcia ciò che viene inserito per il segnaposto $search_results$ in Modelli di prompt della knowledge base: orchestrazione e generazione).
-
Ricrea l’origine dati con una strategia di suddivisione in blocchi che utilizza blocchi più piccoli (in questo modo si accorcia ciò che viene inserito per il segnaposto $search_results$ in Modelli di prompt della knowledge base: orchestrazione e generazione).
-
Abbrevia il modello di prompt.
-
Abbrevia la query dell’utente (in questo modo si accorcia ciò che viene compilato per il segnaposto $query$ in Modelli di prompt della knowledge base: orchestrazione e generazione).