View a markdown version of this page

Panoramica dei database vettoriali - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Panoramica dei database vettoriali

Un database vettoriale è un sistema specializzato che archivia e interroga vettori ad alta dimensione in modo efficiente. Questi database sono fondamentali per le applicazioni Retrieval Augmented Generation (RAG).

I database vettoriali gestiscono la conversione e l'archiviazione dei dati nei seguenti modi:

  • Gli oggetti (come audio, immagini e file di testo) vengono convertiti in vettori utilizzando modelli di incorporamento.

  • I vettori vengono archiviati in formati di dati specializzati.

  • I database vettoriali consentono ricerche rapide di similarità.

I database vettoriali offrono diversi vantaggi chiave rispetto ai database tradizionali, il che li rende particolarmente adatti per le moderne sfide legate ai dati. Sono ottimizzati specificamente per le operazioni vettoriali e gestiscono dati ad alta dimensione in modo efficiente. Sono inoltre specializzati nelle ricerche di similarità che i database tradizionali non riescono a gestire. Oltre a queste funzionalità di base, i database vettoriali sono progettati per soddisfare le esigenze in continua evoluzione delle applicazioni ML e di intelligenza artificiale generativa. Eccellono nello storage vettoriale su larga scala e utilizzano il calcolo distribuito per bilanciare i carichi di lavoro su più nodi. Ciò offre scalabilità e prestazioni man mano che i volumi di dati crescono.

Il diagramma seguente mostra un'implementazione RAG:

  1. Il contenuto, ad esempio documenti o file di testo PDFs, viene inserito nel modello di incorporamento come dati grezzi per l'elaborazione.

  2. Il modello di incorporamento trasforma i dati grezzi in vettori numerici, che rappresentano il significato semantico del contenuto.

  3. Gli incorporamenti vettoriali generati vengono archiviati in un database vettoriale ottimizzato per l'archiviazione e il recupero di vettori ad alta dimensione.

  4. Le applicazioni possono ora interrogare il database vettoriale in risposta a casi d'uso come la ricerca semantica e la raccomandazione di contenuti.

Il modello di incorporamento converte i contenuti in incorporamenti vettoriali archiviati nel database vettoriale per rispondere alle domande.

La scelta di un database vettoriale inappropriato per una soluzione RAG può portare a difficoltà e limitazioni significative, tra cui:

  • Scarse prestazioni delle query

  • Colli di bottiglia in termini di scalabilità

  • Sfide legate all'ingestione dei dati

  • Mancanza di funzionalità avanzate, come il filtraggio e il posizionamento

  • Difficoltà di integrazione con altri sistemi

  • Problemi di persistenza e durabilità

  • Problemi di concorrenza e coerenza in ambienti con più utenti

  • Costi di licenza più elevati o vincolo al fornitore

  • Supporto e risorse limitati per la community

  • Potenziali rischi per la sicurezza e la conformità