View a markdown version of this page

열 통계 생성 일정 관리 - AWS Glue

열 통계 생성 일정 관리

AWS Glue에서 열 통계 생성에 대한 일정 업데이트, 시작, 중지, 삭제와 같은 일정 운영 작업을 관리할 수 있습니다. AWS Glue 콘솔, AWS CLI 또는 AWS Glue 열 통계 API 작업을 사용하여 이러한 태스크를 수행할 수 있습니다.

열 통계 생성 일정 업데이트

일정이 생성된 후 열 통계 생성 태스크를 트리거하도록 일정을 업데이트할 수 있습니다. AWS Glue 콘솔, AWS CLI를 사용하거나 UpdateColumnStatisticsTaskSettings 작업을 실행하여 테이블의 일정을 업데이트할 수 있습니다. 일정 유형(온디맨드 또는 예약)과 같은 기존 일정 파라미터 및 기타 선택적 파라미터를 수정할 수 있습니다.

AWS Management Console
열 통계 생성 태스크 설정을 업데이트하는 방법
  1. AWS Glue 콘솔(https://console.aws.amazon.com/glue/)에 로그인합니다.

  2. 테이블 목록에서 업데이트하려는 테이블을 선택하세요.

  3. 테이블 세부 정보 페이지의 하단 섹션에서 열 통계를 선택하세요.

  4. 작업에서 편집을 선택하여 일정을 업데이트하세요.

  5. 일정을 원하는 대로 변경하고 저장을 선택하세요.

AWS CLI

콘솔에서 AWS Glue의 통계 생성 기능을 사용하지 않는 경우 update-column-statistics-task-settings 명령을 사용하여 일정을 수동으로 업데이트할 수 있습니다. 다음 예에서는 AWS CLI를 이용하여 열 통계를 업데이트하는 방법을 보여 줍니다.

aws glue update-column-statistics-task-settings \ --database-name 'database_name' \ --table-name 'table_name' \ --role arn:aws:iam::123456789012:role/stats_role \ --schedule 'cron(0 0-5 16 * * ?)' \ --column-name-list 'col-1' \ --sample-size '20.0' \ --catalog-id '123456789012'\ --security-configuration 'test-security'

열 통계 생성 일정 중지

증분 통계가 더 이상 필요하지 않은 경우 예약된 생성을 중지하여 리소스와 비용을 절약할 수 있습니다. 일정을 일시 중지해도 이전에 생성된 통계에는 영향을 주지 않습니다. 사용자에게 편한 시간에 일정을 재개할 수 있습니다.

AWS Management Console
열 통계 생성 태스크 일정을 중지하는 방법
  1. AWS Glue 콘솔에서 데이터 카탈로그에서 테이블을 선택합니다.

  2. 열 통계가 있는 테이블을 선택합니다.

  3. 테이블 세부정보 페이지에서 열 통계를 선택합니다.

  4. 작업에서 예약된 생성, 일시 중지를 선택하세요.

  5. 일시 중지를 선택하여 확인하세요.

AWS CLI

AWS CLI를 사용하여 열 통계 태스크 실행 일정을 중지하려면 다음 명령을 사용할 수 있습니다.

aws glue stop-column-statistics-task-run-schedule \ --database-name ''database_name' \ --table-name 'table_name'

database_nametable_name을 열 통계 태스크 실행 일정을 중지하려는 데이터베이스 및 테이블의 실제 이름으로 바꾸세요.

열 통계 생성 일정 재개

통계 생성 일정을 일시 중지한 경우 AWS Glue는 사용자에게 편한 시간에 일정을 재개할 수 있습니다. AWS Glue 콘솔, AWS CLI 또는 StartColumnStatisticsTaskRunSchedule 작업을 사용하여 일정을 재개할 수 있습니다.

AWS Management Console
열 통계 생성 일정을 재개하는 방법
  1. AWS Glue 콘솔에서 데이터 카탈로그에서 테이블을 선택합니다.

  2. 열 통계가 있는 테이블을 선택합니다.

  3. 테이블 세부정보 페이지에서 열 통계를 선택합니다.

  4. 작업에서 예약된 생성을 선택하고 재개를 선택하세요.

  5. 재개를 선택하여 확인하세요.

AWS CLI

database_nametable_name을 열 통계 태스크 실행 일정을 중지하려는 데이터베이스 및 테이블의 실제 이름으로 바꾸세요.

aws glue start-column-statistics-task-run-schedule \ --database-name 'database_name' \ --table-name 'table_name'

열 통계 생성 일정 삭제

최적의 쿼리 성능을 위해 일반적으로 최신 통계를 유지하는 것이 좋지만 자동 생성 일정을 제거하는 것이 도움이 될 수 있는 특정 사용 사례가 있습니다.

  • 데이터가 비교적 정적으로 유지되는 경우 기존 열 통계는 장기간 정확하게 유지되므로 자주 업데이트할 필요성이 줄어듭니다. 일정을 삭제하면 변경되지 않은 데이터에 대한 통계 재생성과 관련된 불필요한 리소스 소비 및 오버헤드를 방지할 수 있습니다.

  • 통계 생성에 대한 수동 제어가 선호되는 경우 자동 일정을 삭제하면 관리자는 특정 간격으로 또는 중요한 데이터 변경 후 열 통계를 선택적으로 업데이트하여 유지 관리 전략 및 리소스 할당 요구 사항에 맞게 프로세스를 조정할 수 있습니다.

AWS Management Console
열 통계 생성 일정을 삭제하는 방법
  1. AWS Glue 콘솔에서 데이터 카탈로그에서 테이블을 선택합니다.

  2. 열 통계가 있는 테이블을 선택합니다.

  3. 테이블 세부정보 페이지에서 열 통계를 선택합니다.

  4. 작업에서 예약된 생성, 삭제를 차례로 선택하세요.

  5. 삭제를 선택하여 확인하세요.

AWS CLI

database_nametable_name을 열 통계 태스크 실행 일정을 중지하려는 데이터베이스 및 테이블의 실제 이름으로 바꾸세요.

DeleteColumnStatisticsForTable API 작업 또는 AWS CLI를 사용하여 열 통계 일정을 삭제할 수 있습니다. 다음 예제에서는 AWS Command Line Interface(AWS CLI)를 사용하여 열 통계 생성 일정을 삭제하는 방법을 보여줍니다.

aws glue delete-column-statistics-task-settings \ --database-name 'database_name' \ --table-name 'table_name'