Amazon OpenSearch Service 데이터 소스의 쿼리 성능 최적화 - Amazon OpenSearch Service

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon OpenSearch Service 데이터 소스의 쿼리 성능 최적화

외부 데이터 소스에 액세스할 경우 Amazon OpenSearch Service의 쿼리 성능이 저하될 수 있습니다. 이는 네트워크 지연 시간, 데이터 변환 또는 대용량 데이터 볼륨과 같은 요인 때문일 수 있습니다. 성능을 개선하려면 사용 사례에 따라 적절한 양의 데이터를 인덱싱하는 것이 좋습니다.

  • Amazon S3에서 직접 쿼리 속도 개선(인덱스 건너뛰기)

  • Security Lake에서 대시보드 시각화 구축(구체화된 뷰)

  • Security Lake에서 오프라인 검토 또는 성능 개선을 위해 인덱싱된 뷰를 사용하여 쿼리 결과 수집(구체화된 뷰)

쿼리 예를 포함하여 가속화된 쿼리에 대한 자세한 내용은 오픈 소스 설명서의 Optimize query performance using OpenSearch indexing을 참조하세요.

건너뛰기 인덱스

건너뛰기 인덱스는 Amazon S3에 저장된 데이터의 메타데이터만 수집합니다. 인덱스를 건너뛴 테이블을 쿼리하면 쿼리 플래너가 모든 파티션 및 파일을 스캔하지 않고 인덱스를 사용하여 데이터를 효율적으로 찾을 수 있도록 쿼리를 다시 작성합니다. 이 접근 방식은 저장된 데이터의 정확한 위치를 좁히는 데 도움이 됩니다.

건너뛰기 인덱스를 생성하는 방법에는 두 가지가 있습니다. 첫 번째 방법은 데이터 소스 세부 정보 내에서 건너뛰기 인덱스를 자동 생성하는 것입니다. 두 번째는 쿼리 워크벤치에서 SQL 문을 사용하여 건너뛰기 인덱스를 수동으로 생성하는 것입니다.

데이터 소스에서 건너뛰기 인덱스를 자동 생성하려면 대시보드 관리데이터 가속화로 이동한 다음, 데이터베이스 및 테이블을 선택합니다(최신 데이터베이스 및 테이블을 가져오려면 새로 고쳐야 할 수 있음). 그런 다음 생성을 선택하여 건너뛰기 인덱스를 자동 생성하거나 인덱싱하려는 각 필드를 수동으로 선택하고 가속(인덱스 유형 건너뛰기)을 지정할 수 있습니다. 마지막으로 가속 생성을 선택하여 새 건너뛰기 인덱스를 채우는 반복 작업을 생성합니다.

인덱스 건너뛰기는 Amazon S3 데이터 소스에 대해서만 지원됩니다.

쿼리 워크벤치를 사용하여 인덱스 건너뛰기를 설정하는 방법에 대한 자세한 내용은 OpenSearch 설명서의 인덱스 건너뛰기를 참조하세요.

구체화된 뷰

구체화된 뷰는 집계와 같은 복잡한 쿼리를 사용하여 OpenSearch Dashboards 시각화를 지원합니다. 쿼리를 기반으로 데이터의 하위 집합을 수집하여 OpenSearch 인덱스에 저장합니다. 그러면 사용자가 이 인덱스를 사용하여 시각화를 생성할 수 있습니다.

구체화된 뷰는 Amazon S3 및 Security Lake 데이터 소스에 대해 지원됩니다.

Query Workbench를 사용하여 구체화된 뷰를 설정하는 방법에 대한 자세한 내용은 OpenSearch 설명서의 구체화된 뷰를 참조하세요.

커버링 인덱스

커버링 인덱스는 테이블의 지정된 열에서 데이터를 수집하며, OpenSearch는 이 데이터를 기반으로 새 인덱스를 생성합니다. 이 새 인덱스를 시각화와 기타 OpenSearch 기능(예: 이상 탐지 또는 지리 공간 분석)에 사용할 수 있습니다.

커버링 인덱스는 Amazon S3 데이터 소스에 대해서만 지원됩니다.

커버링 인덱스 설정에 대한 자세한 내용은 OpenSearch 설명서의 커버링 인덱스를 참조하세요.