View a markdown version of this page

使用 Amazon EMR - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon EMR

该解决方案在幕后使用 Amazon EMR 集群来完成这项工作。源账户中的 EMR 集群从源 Amazon DynamoDB 表中读取数据并写入目标 S3 存储桶。目标 EMR 集群从目标 S3 存储桶读取数据并写入目标 DynamoDB 表。

要使用这种方法复制 DynamoDB 表,必须在源账户和目标账户中同时启动配置了 Apache Hive 的 EMR 集群。两个 EMR 集群都必须配置目标 S3 存储桶的读/写权限。

优点

  • 该解决方案提供了更多的自定义选项,并提供了对数据迁移过程的更多控制。

缺点

  • 该过程更加复杂,因为它需要在源和目标上运行 Hive 查询,并在 S3 位置创建一个外部表来包含数据。

  • 它需要设置集群并在任务完成后将其终止。