Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Intégrez Amazon EMR à AWS Lake Formation
AWS Lake Formation est un service géré qui vous permet de découvrir, de cataloguer, de nettoyer et de sécuriser les données dans un lac de données Amazon Simple Storage Service (S3). Lake Formation fournit un accès détaillé au niveau des colonnes aux bases de données et aux tables du Glue AWS Data Catalog. Pour plus d’informations, consultez Qu’est-ce qu’ AWS Lake Formation ?
Avec Amazon EMR version 6.7.0 et versions ultérieures, vous pouvez appliquer un contrôle d'accès basé sur Lake Formation aux tâches Spark, Hive et Presto que vous soumettez aux clusters Amazon EMR. Pour intégrer Lake Formation, vous devez créer un cluster EMR doté d'un rôle d'exécution. Un rôle d'exécution est un rôle AWS Identity and Access Management (IAM) que vous associez à des tâches ou à des requêtes Amazon EMR. Amazon EMR utilise ensuite ce rôle pour accéder AWS aux ressources. Pour de plus amples informations, veuillez consulter Rôles d'exécution pour les étapes Amazon EMR.
Comment Amazon EMR fonctionne avec Lake Formation
Après avoir intégré Amazon EMR à Lake Formation, vous pouvez exécuter des requêtes vers les clusters Amazon EMR à l'aide de l'Step
API ou d'AI Studio. SageMaker Lake Formation fournit ensuite un accès aux données via des informations d'identification temporaires pour Amazon EMR. Ce processus est appelé distributeur d'informations d'identification. Pour plus d’informations, consultez Qu’est-ce qu’ AWS Lake Formation ?
Voici un aperçu de haut niveau de la manière dont Amazon EMR accède aux données protégées par les politiques de sécurité de Lake Formation.

-
Un utilisateur soumet une requête Amazon EMR pour des données dans Lake Formation.
-
Amazon EMR demande des informations d'identification temporaires à Lake Formation pour permettre à l'utilisateur d'accéder aux données.
-
Lake Formation renvoie des informations d'identification temporaires.
-
Amazon EMR envoie la demande de requête pour récupérer les données d'Amazon S3.
-
Amazon EMR reçoit les données d'Amazon S3, les filtre et renvoie les résultats en fonction des autorisations utilisateur définies par l'utilisateur dans Lake Formation.
Pour plus d'informations sur l'ajout d'utilisateurs et de groupes aux politiques de Lake Formation, consultez la section Octroi d'autorisations au catalogue de données.
Prérequis
Vous devez remplir les conditions suivantes avant d'intégrer Amazon EMR et Lake Formation :
-
Activez l'autorisation des rôles d'exécution sur votre cluster Amazon EMR.
-
Utilisez le catalogue de données AWS Glue comme magasin de métadonnées.
-
Définissez et gérez les autorisations dans Lake Formation pour accéder aux bases de données, aux tables et aux colonnes de AWS Glue Data Catalog. Pour plus d’informations, consultez Qu’est-ce qu’ AWS Lake Formation ?