View a markdown version of this page

索引向量数据并强制合并 - 亚马逊 OpenSearch 服务

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

索引向量数据并强制合并

在域名或集合上创建了 GPU 加速的向量索引后,您可以使用标准操作添加矢量数据并优化索引。 OpenSearch GPU-Acceleration 可自动增强索引性能和强制合并操作,从而无需更改现有工作流程即可更快地构建和维护大型矢量搜索应用程序。

为矢量数据编制索引

像往常一样索引矢量数据。GPU 加速会自动应用于索引和强制合并操作。以下示例演示如何使用批量 API 向索引中添加矢文档。每个文档都包含一个包含数值和相关文本内容的矢量字段:

POST _bulk {"index": {"_index": "my-vector-index"}} {"vector_field": [0.1, 0.2, 0.3, ...], "text": "Sample document 1"} {"index": {"_index": "my-vector-index"}} {"vector_field": [0.4, 0.5, 0.6, ...], "text": "Sample document 2"}

强制合并操作

GPU 加速也适用于强制合并操作,这可以显著缩短优化向量索引所需的时间。请注意,集合不支持强制合并操作。以下示例演示如何通过将所有分段合并为一个分段来优化向量索引:

POST my-vector-index/_forcemerge?max_num_segments=1