Indicizzazione dei dati vettoriali e unione forzata - OpenSearch Servizio Amazon

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Indicizzazione dei dati vettoriali e unione forzata

Dopo aver creato un indice vettoriale accelerato da GPU sul dominio o sulla raccolta, puoi aggiungere dati vettoriali e ottimizzare l'indice utilizzando operazioni standard. OpenSearch L'accelerazione GPU migliora automaticamente sia le prestazioni di indicizzazione che le operazioni di unione forzata, velocizzando la creazione e la manutenzione di applicazioni di ricerca vettoriale su larga scala senza richiedere modifiche ai flussi di lavoro esistenti.

Indicizzazione dei dati vettoriali

Indicizza i dati vettoriali come faresti normalmente. L'accelerazione GPU si applica automaticamente alle operazioni di indicizzazione e unione forzata. L'esempio seguente mostra come aggiungere documenti vettoriali all'indice utilizzando l'API bulk. Ogni documento contiene un campo vettoriale con valori numerici e contenuto testuale associato:

POST _bulk {"index": {"_index": "my-vector-index"}} {"vector_field": [0.1, 0.2, 0.3, ...], "text": "Sample document 1"} {"index": {"_index": "my-vector-index"}} {"vector_field": [0.4, 0.5, 0.6, ...], "text": "Sample document 2"}

Operazioni di unione forzata

L'accelerazione tramite GPU si applica anche alle operazioni di unione forzata, che possono ridurre significativamente il tempo necessario per ottimizzare gli indici vettoriali. Tieni presente che le operazioni di unione forzata non sono supportate nelle raccolte. L'esempio seguente dimostra come ottimizzare l'indice vettoriale consolidando tutti i segmenti in un unico segmento:

POST my-vector-index/_forcemerge?max_num_segments=1