View a markdown version of this page

Indexação de dados vetoriais e mesclagem forçada - OpenSearch Serviço Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Indexação de dados vetoriais e mesclagem forçada

Depois de criar um índice vetorial acelerado por GPU em seu domínio ou coleção, você pode adicionar dados vetoriais e otimizar seu índice usando operações padrão. OpenSearch A aceleração da GPU aprimora automaticamente o desempenho da indexação e as operações de mesclagem forçada, tornando mais rápido criar e manter aplicativos de pesquisa vetorial em grande escala sem exigir alterações nos fluxos de trabalho existentes.

Indexação de dados vetoriais

Indexe dados vetoriais como você faria normalmente. A aceleração da GPU se aplica automaticamente às operações de indexação e mesclagem forçada. O exemplo a seguir demonstra como adicionar documentos vetoriais ao seu índice usando a API em massa. Cada documento contém um campo vetorial com valores numéricos e conteúdo de texto associado:

POST _bulk {"index": {"_index": "my-vector-index"}} {"vector_field": [0.1, 0.2, 0.3, ...], "text": "Sample document 1"} {"index": {"_index": "my-vector-index"}} {"vector_field": [0.4, 0.5, 0.6, ...], "text": "Sample document 2"}

Operações de fusão forçada

A aceleração da GPU também se aplica às operações de mesclagem forçada, o que pode reduzir significativamente o tempo necessário para otimizar os índices vetoriais. Observe que as operações de mesclagem forçada não são suportadas em coleções. O exemplo a seguir demonstra como otimizar seu índice vetorial consolidando todos os segmentos em um único segmento:

POST my-vector-index/_forcemerge?max_num_segments=1