Integra Amazon EMR con AWS Lake Formation - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Integra Amazon EMR con AWS Lake Formation

AWS Lake Formation è un servizio gestito che ti aiuta a scoprire, catalogare, pulire e proteggere i dati in un data lake Amazon Simple Storage Service (S3). Lake Formation fornisce un accesso granulare a livello di colonna a database e tabelle nel Glue Data Catalog. AWS Per ulteriori informazioni, consulta What is AWS Lake Formation?

Con Amazon EMR versione 6.7.0 e successive, puoi applicare il controllo degli accessi basato su Lake Formation ai processi Spark, Hive e Presto inviati ai cluster Amazon EMR. Per l'integrazione con Lake Formation, devi creare un cluster EMR con un ruolo di runtime. Un ruolo di runtime è un ruolo AWS Identity and Access Management (IAM) che puoi associare ai processi o alle query di Amazon EMR. Amazon EMR utilizza quindi questo ruolo per accedere AWS alle risorse. Per ulteriori informazioni, consulta Ruoli di runtime per le fasi di Amazon EMR.

Funzionamento di Amazon EMR con Lake Formation

Dopo aver integrato Amazon EMR con Lake Formation, puoi eseguire query sui cluster Amazon EMR con l'StepAPI o con AI Studio. SageMaker Quindi, Lake Formation fornisce l'accesso ai dati tramite credenziali temporanee per Amazon EMR. Questo processo è denominato distribuzione di credenziali. Per ulteriori informazioni, consulta What is AWS Lake Formation?

Di seguito è riportata una panoramica generale sul modo in cui Amazon EMR ottiene l'accesso ai dati protetti dalle policy di sicurezza Lake Formation.

In che modo Amazon EMR accede ai dati protetti dalle policy di sicurezza di Lake Formation
  1. Un utente invia una query Amazon EMR per i dati in Lake Formation.

  2. Amazon EMR richiede le credenziali temporanee da Lake Formation per consentire all'utente di accedere ai dati.

  3. Lake Formation restituisce le credenziali temporanee.

  4. Amazon EMR invia la richiesta di query per recuperare dati da Amazon S3.

  5. Amazon EMR riceve i dati da Amazon S3, li filtra e restituisce i risultati in base alle autorizzazioni utente definite in Lake Formation.

Per ulteriori informazioni sull'aggiunta di utenti e gruppi ai policy di Lake Formation, consulta Concessione delle autorizzazioni Data Catalog.

Prerequisiti

Prima di integrare Amazon EMR e Lake Formation, è necessario soddisfare i seguenti requisiti:

  • Attiva l'autorizzazione dei ruoli di runtime sul cluster Amazon EMR.

  • Usa il AWS Glue Data Catalog come archivio di metadati.

  • Definisci e gestisci le autorizzazioni in Lake Formation per accedere a database, tabelle e colonne in AWS Glue Data Catalog. Per ulteriori informazioni, consulta What is AWS Lake Formation?