마이그레이션 옵션 요약 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

마이그레이션 옵션 요약

이 표에는 각 마이그레이션 옵션의 주요 특성과 고려 사항이 요약되어 있습니다.

Feature

인플레이스 마이그레이션

스냅샷

인플레이스 마이그레이션

마이그레이션

전체 데이터 마이그레이션

CTAS 또는 (CREATE TABLE + INSERT)

마이그레이션 프로세스의 일환으로 데이터 레이아웃 개선

  • 데이터 재정렬

아니요

아니요

  • 파티셔닝 변경(예: Iceberg 숨겨진 파티셔닝 사용)

아니요

아니요

  • 테이블 스키마 변경

아니요

아니요

  • 파일 크기 최적화

아니요

아니요

  • 데이터를 추가하기 전에 기존 데이터의 스키마를 검증합니다.

아니요

아니요

지원되는 파일 형식

Parquet, Avro, ORC

Parquet, Avro, ORC

Parquet, Avro, ORC, JSON, CSV

Iceberg 테이블로 소스 테이블 대체

아니요

(가 새 테이블을 생성하지만 추가 단계를 통해 소스 테이블을 교체할 수 있음)

(백업 테이블을 생성하고 소스 테이블을 Iceberg 테이블로 대체)

아니요

(새 테이블 생성)

소스 테이블 영향

  • Iceberg 테이블의 파일 삭제 작업(expire_snapshot 작업, 제거로 테이블 삭제)

소스 테이블을 손상시킵니다.

백업 테이블을 손상시킵니다.

안전하고 영향을 받지 않는 소스

Iceberg 테이블 영향

  • 소스 테이블 파일이 제거될 경우의 영향

Iceberg 테이블 손상

Iceberg 테이블 손상

Iceberg 테이블에 미치는 영향 없음

  • 소스 테이블 위치에 새 파일이 추가될 경우의 영향

새 테이블에 표시되지 않음

( 파티션을와 통합해야 함add_files)

새 테이블에 표시되지 않음

( 파티션을와 통합해야 함add_files)

새 테이블에 표시되지 않음

(INSERT INTO새 테이블 필요)

비용

낮음

낮음

더 높음(전체 데이터 재작성)

마이그레이션 속도

빠른

빠른

느림

Amazon S3 Tables로 마이그레이션하는 데 사용할 수 있습니다.

아니요

아니요

수동 DDL 필요

아니요

(스키마 및 파티션은 소스 테이블에서 복사됨)

아니요

(스키마 및 파티션은 소스 테이블에서 복사됨)

CTAS를 사용하는 경우 파티셔닝만 지정하면 됩니다.

최적 사용

데이터를 다시 작성하지 않고도 빠르게 마이그레이션할 수 있으므로 테스트 또는 점진적 전환을 위해 Hive와 Iceberg를 side-by-side 사용할 수 있습니다.

즉각적인 전환이 허용되는 경우 데이터를 다시 작성하지 않고 Hive 테이블을 제자리에 교체하세요.

데이터 재작성을 통한 전체 Iceberg 최적화. 파티션 또는 스키마를 재설계하거나 레이아웃 및 성능을 개선할 때 적합합니다. 가능하면 항상 권장됩니다.