View a markdown version of this page

Uso de Amazon EMR - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de Amazon EMR

Esta solución utiliza clústeres de Amazon EMR entre bastidores para el trabajo. Los clústeres de EMR de la cuenta de origen leen la tabla de origen de Amazon DynamoDB y escriben en un bucket de S3 de destino. Los clústeres EMR de destino leen desde el depósito S3 de destino y escriben en la tabla de DynamoDB de destino.

Para replicar las tablas de DynamoDB con este enfoque, los clústeres de EMR configurados con Apache Hive deben lanzarse tanto en la cuenta de origen como en la de destino. Ambos clústeres EMR deben configurarse con permisos de lectura/escritura para el bucket S3 de destino.

Ventajas

  • La solución ofrece más opciones de personalización y proporciona un mayor control sobre el proceso de migración de datos.

Inconvenientes

  • El proceso es más complicado, ya que requiere ejecutar consultas de Hive en el origen y el destino y crear una tabla externa en la ubicación S3 para contener los datos.

  • Requiere configurar los clústeres y terminarlos una vez finalizado el trabajo.