View a markdown version of this page

Amazon EMR 사용 - AWS 권장 가이드

Amazon EMR 사용

이 솔루션은 작업의 백그라운드에서 Amazon EMR 클러스터를 사용합니다. 소스 계정의 EMR 클러스터는 소스 Amazon DynamoDB 테이블에서 읽고 대상 S3 버킷에 씁니다. 대상 EMR 클러스터는 대상 S3 버킷에서 읽고 대상 DynamoDB 테이블에 씁니다.

이 접근 방식을 사용하여 DynamoDB 테이블을 복제하려면 소스 계정과 대상 계정 모두에서 Apache Hive로 구성된 EMR 클러스터를 시작해야 합니다. 두 EMR 클러스터 모두 대상 S3 버킷에 대한 읽기/쓰기 권한으로 구성해야 합니다.

장점

이 솔루션은 사용자 지정을 위한 더 많은 옵션을 제공하고 데이터 마이그레이션 프로세스를 더 잘 제어할 수 있습니다.

단점

소스 및 대상에서 Hive 쿼리를 실행하고 데이터를 포함하려면 S3 위치에 외부 테이블을 생성해야 하므로 프로세스가 더 많이 관여합니다.
클러스터를 설정하고 작업 완료 후 종료해야 합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

DynamoDB Amazon S3 기능 사용

사용자 지정 구현 사용