

# Iceberg 테이블의 쿼리 성능 최적화
<a name="iceberg-column-statistics"></a>

Apache Iceberg는 대규모 분석 데이터세트를 위한 고성능 오픈 테이블 형식입니다. AWS Glue에서는 Iceberg 테이블의 각 열에 대한 고유 값의 수(NDV) 계산 및 업데이트를 지원합니다. 이러한 통계를 통해 대규모 데이터세트를 사용하는 데이터 엔지니어와 과학자의 쿼리 최적화, 데이터 관리 및 성능 효율성을 높일 수 있습니다.

 AWS Glue에서는 Iceberg 테이블의 각 열에 있는 고유 값의 수를 추정하고 Iceberg 테이블 스냅샷과 연결된 Amazon S3의 [Puffin](https://iceberg.apache.org/puffin-spec/) 파일에 저장합니다. Puffin은 인덱스, 통계, 스케치와 같은 메타데이터를 저장하도록 설계된 Iceberg 파일 형식입니다. 스냅샷과 연결된 Puffin 파일에 스케치를 저장하면 트랜잭션 일관성을 유지하면서 NDV 통계를 최신으로 유지할 수 있습니다.

AWS Glue 콘솔 또는 AWS CLI를 사용하여 열 통계 생성 작업을 실행하도록 구성할 수 있습니다. 프로세스를 시작하면 백그라운드에서 AWS Glue가 Spark 작업을 시작하고 데이터 카탈로그의 AWS Glue 테이블 메타데이터를 업데이트합니다. AWS Glue 콘솔 또는 AWS CLI를 사용하거나 [GetColumnStatisticsForTable](https://docs.aws.amazon.com/glue/latest/webapi/API_GetColumnStatisticsForTable.html) API 작업을 직접적으로 호출하여 열 통계를 볼 수 있습니다.

**참고**  
AWS Lake Formation 권한을 사용하여 테이블에 대한 액세스를 제어하는 경우 열 통계 작업에서 맡은 역할을 수행하려면 통계를 생성하기 위한 전체 테이블 액세스 권한이 필요합니다.

**Topics**
+ [열 통계 생성을 위한 사전 요구 사항](iceberg-column-stats-prereqs.md)
+ [Iceberg 테이블의 열 통계 생성](iceberg-generate-column-stats.md)
+ [다음 사항도 참조하세요.](#see-also-iceberg-stats)

## 다음 사항도 참조하세요.
<a name="see-also-iceberg-stats"></a>
+ [열 통계 보기](view-column-stats.md)
+ [컬럼 통계 태스크 실행 보기](view-stats-run.md)
+ [열 통계 작업 실행 중지](stop-stats-run.md)
+ [컬럼 통계 삭제](delete-column-stats.md)