Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Conditions préalables à la connexion du catalogue de données au métastore Hive
Pour connecter le AWS Glue Data Catalog à un métastore Apache Hive externe et configurer les autorisations d'accès aux données, vous devez remplir les conditions suivantes :
Note
Nous recommandons qu'un administrateur de Lake Formation déploie l' AWS SAM application, et seul un utilisateur privilégié utilise la connexion au métastore Hive pour créer les bases de données fédérées correspondantes.
Création des rôles IAM.
Pour déployer l' AWS SAM application
Créez un rôle doté des autorisations nécessaires pour déployer les ressources (fonction Lambda Amazon API Gateway, rôle IAM et AWS Glue connexion) requises pour créer une connexion au métastore Hive.
Pour créer des bases de données fédérées
Les autorisations suivantes sont requises pour les ressources :
-
glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename
-
glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection
-
Enregistrez le site Amazon S3 auprès de Lake Formation.
Pour utiliser Lake Formation afin de gérer et de sécuriser les données de votre lac de données, vous devez enregistrer l'emplacement Amazon S3 contenant les données des tables du métastore Hive auprès de Lake Formation. Lake Formation peut ainsi vendre des informations d'identification à des services AWS d'analyse tels qu'Athena, Redshift Spectrum et Amazon EMR.
Pour plus d'informations sur l'enregistrement d'un site Amazon S3, consultezAjouter un emplacement Amazon S3 à votre lac de données.
Lorsque vous enregistrez l'emplacement Amazon S3, cochez la case Enable Data Catalog Federation pour autoriser Lake Formation à assumer un rôle d'accès aux tables d'une base de données fédérée.
Pour plus d'informations sur l'enregistrement d'un emplacement de données auprès de Lake Formation, consultezConfigurer un emplacement Amazon S3 pour votre lac de données.
-
Utilisez la bonne version d'Amazon EMR.
Pour utiliser Amazon EMR avec les bases de données de métastore Hive fédérées, vous devez disposer de la version 3.x ou supérieure de Hive et de la version 6.x ou supérieure d'Amazon EMR.