기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
파생 소스를 사용하여 스토리지 저장
기본적으로 OpenSearch Serverless는 원본 JSON 문서 본문이 포함된 _source 필드에 수집된 각 문서를 저장하고 검색을 위해 개별 필드를 인덱싱합니다. _source 필드는 검색할 수 없지만 가져오기 및 검색과 같은 가져오기 요청을 실행할 때 전체 문서를 반환할 수 있도록 보존됩니다. 파생 소스가 활성화되면 OpenSearch Serverless는 _source 필드 저장을 건너뛰고 대신 검색, 가져오기, mget, 재인덱스 또는 업데이트 작업 중에 온디맨드로 동적으로 필드를 재구성합니다. 파생 소스 설정을 사용하면 스토리지 사용량을 최대 50% 줄일 수 있습니다.
구성
인덱스에 대한 파생 소스를 구성하려면 index.derived_source.enabled 설정을 사용하여 인덱스를 생성합니다.
PUT my-index1 { "settings": { "index": { "derived_source": { "enabled": true } } } }
중요 고려 사항
-
특정 필드 유형만 지원됩니다. 지원되는 필드 및 제한 사항 목록은 OpenSearch 설명서를
참조하세요. 파생 소스와 지원되지 않는 필드를 사용하여 인덱스를 생성하면 인덱스 생성이 실패합니다. 파생 소스 지원 인덱스에서 지원되지 않는 필드가 있는 문서를 수집하려고 하면 수집이 실패합니다. 인덱스에 추가될 필드 유형을 알고 있는 경우에만이 기능을 사용합니다. -
설정은 정적 설정
index.derived_source.enabled입니다. 인덱스가 생성된 후에는 변경할 수 없습니다.
쿼리 응답에 대한 제한 사항
파생 소스가 활성화되면 쿼리 응답이 생성되고 반환되는 방식에 특정 제한이 적용됩니다.
-
여러 형식이 지정된 날짜 필드는 원래 수집된 형식에 관계없이 요청된 모든 문서에 대해 항상 목록의 첫 번째 형식을 사용합니다.
-
Geopoint 값은 고정된
{"lat": lat_val, "lon": lon_val}형식으로 반환되며 정밀도가 떨어질 수 있습니다. -
다중 값 배열이 정렬되고 키워드 필드가 중복 제거될 수 있습니다.
자세한 내용은 OpenSearch 블로그
성능 벤치마킹
nyc_taxi 데이터 세트를 사용한 벤치마크 테스트를 기반으로 파생 소스는 기준과 비교하여 인덱스 크기를 58% 줄였습니다.
| 지표 | 파생 소스 |
|---|---|
| 인덱스 크기 축소 | 58.3% |
| 인덱싱 처리량 변경 | 3.7% |
| p90 지연 시간 변경 인덱싱 | 6.9% |
| 매치 전체 쿼리 p90 지연 시간 개선 | 19% |
| 범위 쿼리 p90 지연 시간 개선 | -18.8% |
| 거리 금액 p90 Agg 지연 시간 개선 | -7.3% |
자세한 내용은 OpenSearch 블로그