Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Query sui vettori
È possibile eseguire una query di similarità con l'operazione QueryVectorsAPI, in cui si specifica il vettore di query, il numero di risultati pertinenti da restituire (i primi K vicini più vicini) e l'indice ARN. Inoltre, si possono utilizzare i filtri di metadati in una query per cercare solo i vettori che corrispondono al filtro. Se si effettua una richiesta di filtro in base a un campo di metadati non filtrabili, la richiesta restituirà un errore 400 Bad
Request. Per ulteriori informazioni sul filtro dei metadati, consulta Filtro dei metadati.
Nella risposta, per impostazione predefinita vengono restituite le chiavi del vettore. Facoltativamente, è possibile includere nella risposta la distanza e i metadati.
Quando si genera il vettore di query, è necessario utilizzare lo stesso modello di embedding vettoriale utilizzato per generare i vettori iniziali archiviati nell’indice vettoriale. Ad esempio, se si utilizza il modello Embedding di testo Amazon Titan V2 in Amazon Bedrock per generare embedding vettoriali dei documenti, è necessario utilizzare lo stesso modello di embedding per convertire una domanda in un vettore di query. Inoltre, Amazon Bedrock Knowledge Bases fornisce un flusso di lavoro end-to-end RAG completamente gestito in cui Amazon Bedrock recupera automaticamente i dati dalla fonte di dati S3, converte i contenuti in blocchi di testo, genera incorporamenti e li archivia nel tuo indice vettoriale. È quindi possibile eseguire query sulla knowledge base e ottenere risposte basate sui blocchi recuperati dai dati di origine. Per ulteriori informazioni su come eseguire query sui vettori da una knowledge base per Amazon Bedrock nella console, consulta (Facoltativo) Integrazione di S3 Vectors con Knowledge Base per Amazon Bedrock.
Inoltre, lo strumento open source della CLI di Amazon S3 Vectors Embed offre un modo semplificato per eseguire ricerche semantiche dalla riga di comando. Questo strumento open source semplifica il processo di query gestendo sia la generazione di embedding vettoriali con i modelli di fondazione di Amazon Bedrock sia l’esecuzione di operazioni di ricerca semantica sugli indici vettoriali S3. Per ulteriori informazioni sull’utilizzo di questo strumento per effettuare query sui dati vettoriali, consulta Creazione di embedding vettoriali ed esecuzione di ricerche semantiche con s3vectors-embed-cli.
S3 Vectors offre tempi di risposta inferiori al secondo per le query a freddo, sfruttando il throughput elastico di Amazon S3 per eseguire ricerche efficienti su milioni di vettori. Ciò lo rende estremamente conveniente per i carichi di lavoro con richieste poco frequenti. Per le query più frequenti, S3 Vectors è in grado di fornire tempi di risposta di appena 100 ms, a vantaggio dei carichi di lavoro con modelli di query ripetuti o frequenti.
Per l’esecuzione di query di somiglianza per gli embedding vettoriali, diversi fattori possono influire sulle prestazioni di richiamata medie, tra cui il modello di embedding vettoriale, la dimensione del set di dati vettoriali (il numero di vettori e le dimensioni) e la distribuzione delle query. S3 Vectors offre una richiamata media superiore al 90% per la maggior parte dei set di dati. La richiamata media misura la qualità dei risultati delle query. Una richiamata media del 90% significa che la risposta contiene il 90% dei vettori effettivi più vicini (dati acquisiti) archiviati nell’indice vettoriale relativo al vettore di query. Tuttavia, poiché le prestazioni effettive possono variare a seconda dei casi d’uso specifici, è consigliabile eseguire test personalizzati con dati e query rappresentativi per verificare che S3 Vectors soddisfi i requisiti di richiamata.