벡터 데이터 인덱싱 및 강제 병합

도메인 또는 컬렉션에 GPU 가속 벡터 인덱스를 생성한 후에는 벡터 데이터를 추가하고 표준 OpenSearch 작업을 사용하여 인덱스를 최적화할 수 있습니다. GPU 가속화는 인덱싱 성능과 강제 병합 작업을 모두 자동으로 개선하므로 기존 워크플로를 변경하지 않고도 대규모 벡터 검색 애플리케이션을 더 빠르게 구축하고 유지할 수 있습니다.

벡터 데이터 인덱싱

평소와 같이 벡터 데이터를 인덱싱합니다. GPU 가속화는 인덱싱 및 강제 병합 작업에 자동으로 적용됩니다. 다음 예제에서는 대량 API를 사용하여 인덱스에 벡터 문서를 추가하는 방법을 보여줍니다. 각 문서에는 숫자 값과 관련 텍스트 콘텐츠가 포함된 벡터 필드가 포함되어 있습니다.


POST _bulk
{"index": {"_index": "my-vector-index"}}
{"vector_field": [0.1, 0.2, 0.3, ...], "text": "Sample document 1"}
{"index": {"_index": "my-vector-index"}}
{"vector_field": [0.4, 0.5, 0.6, ...], "text": "Sample document 2"}

강제 병합 작업

GPU 가속화는 강제 병합 작업에도 적용되므로 벡터 인덱스를 최적화하는 데 필요한 시간을 크게 줄일 수 있습니다. 강제 병합 작업은 컬렉션에서 지원되지 않습니다. 다음 예제에서는 모든 세그먼트를 단일 세그먼트로 통합하여 벡터 인덱스를 최적화하는 방법을 보여줍니다.


POST my-vector-index/_forcemerge?max_num_segments=1

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

GPU 가속 벡터 인덱스 생성

OpenSearch 대시보드