View a markdown version of this page

使用 Amazon EMR - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Amazon EMR

此解決方案會在任務的幕後使用 Amazon EMR 叢集。來源帳戶中的 EMR 叢集會從來源 Amazon DynamoDB 資料表讀取,並寫入目的地 S3 儲存貯體。目標 EMR 叢集會從目的地 S3 儲存貯體讀取,並寫入目標 DynamoDB 資料表。

若要使用此方法複寫 DynamoDB 資料表,必須在來源和目標帳戶中啟動以 Apache Hive 設定的 EMR 叢集。兩個 EMR 叢集都必須設定目的地 S3 儲存貯體的讀取/寫入許可。

優點

  • 解決方案提供更多自訂選項,並提供更多對資料遷移程序的控制。

缺點

  • 程序會涉及更多,因為它需要在來源和目標上執行 Hive 查詢,並在 S3 位置建立外部資料表以包含資料。

  • 它需要設定叢集,並在任務完成後終止它們。