View a markdown version of this page

Amazon EMR 사용 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon EMR 사용

이 솔루션은 작업의 백그라운드에서 Amazon EMR 클러스터를 사용합니다. 소스 계정의 EMR 클러스터는 소스 Amazon DynamoDB 테이블에서 읽고 대상 S3 버킷에 씁니다. 대상 EMR 클러스터는 대상 S3 버킷에서 읽고 대상 DynamoDB 테이블에 씁니다.

이 접근 방식을 사용하여 DynamoDB 테이블을 복제하려면 소스 계정과 대상 계정 모두에서 Apache Hive로 구성된 EMR 클러스터를 시작해야 합니다. 두 EMR 클러스터 모두 대상 S3 버킷에 대한 읽기/쓰기 권한으로 구성해야 합니다.

장점

  • 이 솔루션은 사용자 지정을 위한 더 많은 옵션을 제공하고 데이터 마이그레이션 프로세스를 더 잘 제어할 수 있습니다.

단점

  • 소스 및 대상에서 Hive 쿼리를 실행하고 데이터를 포함하려면 S3 위치에 외부 테이블을 생성해야 하므로 프로세스가 더 많이 관여합니다.

  • 클러스터를 설정하고 작업 완료 후 종료해야 합니다.