View a markdown version of this page

벡터 데이터 인덱싱 및 강제 병합 - Amazon OpenSearch Service

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

벡터 데이터 인덱싱 및 강제 병합

도메인 또는 컬렉션에 GPU 가속 벡터 인덱스를 생성한 후에는 벡터 데이터를 추가하고 표준 OpenSearch 작업을 사용하여 인덱스를 최적화할 수 있습니다. GPU 가속화는 인덱싱 성능과 강제 병합 작업을 모두 자동으로 개선하므로 기존 워크플로를 변경하지 않고도 대규모 벡터 검색 애플리케이션을 더 빠르게 구축하고 유지할 수 있습니다.

벡터 데이터 인덱싱

평소와 같이 벡터 데이터를 인덱싱합니다. GPU 가속화는 인덱싱 및 강제 병합 작업에 자동으로 적용됩니다. 다음 예제에서는 대량 API를 사용하여 인덱스에 벡터 문서를 추가하는 방법을 보여줍니다. 각 문서에는 숫자 값과 관련 텍스트 콘텐츠가 포함된 벡터 필드가 포함되어 있습니다.

POST _bulk {"index": {"_index": "my-vector-index"}} {"vector_field": [0.1, 0.2, 0.3, ...], "text": "Sample document 1"} {"index": {"_index": "my-vector-index"}} {"vector_field": [0.4, 0.5, 0.6, ...], "text": "Sample document 2"}

강제 병합 작업

GPU 가속화는 강제 병합 작업에도 적용되므로 벡터 인덱스를 최적화하는 데 필요한 시간을 크게 줄일 수 있습니다. 강제 병합 작업은 컬렉션에서 지원되지 않습니다. 다음 예제에서는 모든 세그먼트를 단일 세그먼트로 통합하여 벡터 인덱스를 최적화하는 방법을 보여줍니다.

POST my-vector-index/_forcemerge?max_num_segments=1