View a markdown version of this page

Utilizzo di Amazon EMR - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di Amazon EMR

Questa soluzione utilizza i cluster Amazon EMR dietro le quinte per il lavoro. I cluster EMR nell'account di origine leggono dalla tabella Amazon DynamoDB di origine e scrivono su un bucket S3 di destinazione. I cluster EMR di destinazione leggono dal bucket S3 di destinazione e scrivono nella tabella DynamoDB di destinazione.

Per replicare le tabelle DynamoDB utilizzando questo approccio, i cluster EMR configurati con Apache Hive devono essere avviati sia nell'account di origine che in quello di destinazione. Entrambi i cluster EMR devono essere configurati con autorizzazioni di lettura/scrittura per il bucket S3 di destinazione.

Vantaggi

  • La soluzione offre più opzioni di personalizzazione e offre un maggiore controllo sul processo di migrazione dei dati.

Svantaggi

  • Il processo è più complesso, perché richiede l'esecuzione di query Hive sull'origine e sulla destinazione e la creazione di una tabella esterna nella posizione S3 per contenere i dati.

  • Richiede la configurazione dei cluster e la loro chiusura dopo il completamento del lavoro.