Le migliori pratiche per S3 Vectors

Amazon S3 Vectors offre uno storage vettoriale personalizzato e a costi ottimizzati per l'utilizzo da parte di applicazioni abilitate all'intelligenza artificiale e la ricerca semantica dei contenuti archiviati in Amazon S3. Progettato per fornire elasticità e durata a livello S3 per l'archiviazione di set di dati vettoriali con prestazioni di query inferiori al secondo, S3 Vectors è ideale per le applicazioni che devono creare e far crescere indici vettoriali. Con S3 Vectors puoi utilizzare un set dedicato di operazioni API per archiviare, accedere ed eseguire query di somiglianza su dati vettoriali senza dover fornire alcuna infrastruttura. Per ulteriori informazioni, consulta Lavorare con vettori S3 e bucket vettoriali.

Per garantire il massimo vantaggio da S3 Vectors, ti consigliamo di eseguire le seguenti best practice.

Inserimento ed eliminazione di vettori: L'applicazione può raggiungere almeno cinque PutVectors DeleteVectorsrichieste al secondo per indice vettoriale. Se superi i tassi di richiesta, potresti ricevere un 429 TooManyRequestsException errore. Per massimizzare la velocità di trasmissione delle richieste e ottimizzarne la velocità e l'efficienza, consigliamo di inserire ed eliminare i vettori in batch di grandi dimensioni, fino a un massimo di 500 vettori per richiesta API. Per ulteriori informazioni, consulta Indici vettoriali.
Accesso e interrogazione dei vettori in un indice vettoriale S3: La tua applicazione può raggiungere centinaia di QueryVectors ListVectorsrichieste al secondo per indice vettoriale S3. GetVectors Se superi i tassi di richiesta, potresti ricevere un 429 TooManyRequestsException errore. Ti consigliamo di utilizzare un meccanismo di riprova e di configurare l'applicazione per inviare meno richieste.
Scalabilità tra indici vettoriali: Per migliorare le prestazioni delle query per indice vettoriale, prendete in considerazione la possibilità di configurare l'applicazione in modo da dividere i vettori tra più indici vettoriali, quando possibile. Ad esempio, se disponi di carichi di lavoro multi-tenant e l'applicazione esegue query su ciascun tenant in modo indipendente, valuta la possibilità di archiviare i vettori di ciascun tenant in un indice vettoriale separato. Per ulteriori informazioni, consulta Indici vettoriali.
Implementazione della multi-tenancy con indici vettoriali separati: È possibile ottenere la multi-tenancy organizzando i dati vettoriali utilizzando un unico indice vettoriale per ogni tenant. Puoi utilizzare le policy IAM e bucket per limitare l'accesso di ogni tenant solo all'indice vettoriale designato. Questo approccio aiuta a mantenere l'isolamento dei dati e semplifica la gestione eliminando la necessità di creare bucket separati per ogni tenant. Per ulteriori informazioni, consulta Gestione delle identità e degli accessi in S3 Vectors.
Configurazione di campi di metadati non filtrabili per indici vettoriali: Quando crei un indice vettoriale, configura i campi di metadati che non richiedono il filtraggio come chiavi di metadati non filtrabili. Ad esempio, memorizza blocchi di testo per gli incorporamenti vettoriali come campi di metadati non filtrabili quando ne hai bisogno solo come riferimento. Per ulteriori informazioni, consulta Metadati non filtrabili.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Limitazioni e restrizioni

Creazione e ricerca di incorporamenti vettoriali con s3vectors-embed-cli