本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Amazon EMR
该解决方案在幕后使用 Amazon EMR 集群来完成这项工作。源账户中的 EMR 集群从源 Amazon DynamoDB 表中读取数据并写入目标 S3 存储桶。目标 EMR 集群从目标 S3 存储桶读取数据并写入目标 DynamoDB 表。
要使用这种方法复制 DynamoDB 表,必须在源账户和目标账户中同时启动配置了 Apache Hive 的 EMR 集群。两个 EMR 集群都必须配置目标 S3 存储桶的读/写权限。
优点
该解决方案提供了更多的自定义选项,并提供了对数据迁移过程的更多控制。
缺点
该过程更加复杂,因为它需要在源和目标上运行 Hive 查询,并在 S3 位置创建一个外部表来包含数据。
它需要设置集群并在任务完成后将其终止。