Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Requisitos previos para conectar el Catálogo de datos al metaalmacén de Hive
Para conectar AWS Glue Data Catalog a un metaalmacén externo de Apache Hive y configurar los permisos de acceso a los datos, debe cumplir los siguientes requisitos:
nota
Recomendamos que un administrador de Lake Formation despliegue la aplicación de AWS SAM y que solo un usuario privilegiado utilice la conexión del metaalmacén de Hive para crear las bases de datos federadas correspondientes.
Crear roles de IAM.
Para implementar la aplicación de AWS SAM
Cree un rol que tenga los permisos necesarios para implementar los recursos (función de LambdaAmazon API Gateway, rol de IAM y la AWS Glue conexión) necesarios para crear una conexión al metaalmacén de Hive.
Para crear bases de datos federadas
Se necesitan los siguientes permisos en los recursos:
-
glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename -
glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection
-
Registre la ruta de Amazon S3 en Lake Formation.
Para utilizar Lake Formation para gestionar y proteger los datos de su lago de datos, debe registrar la ubicación de Amazon S3 que contiene los datos de las tablas en el metaalmacén de Hive con Lake Formation. Al hacerlo, Lake Formation puede expedir credenciales a los servicios de análisis de AWS, como Athena, Redshift Spectrum y Amazon EMR.
Para obtener más información sobre el registro de una ubicación de Amazon S3, consulte Añadir una ubicación de Amazon S3 a su lago de datos.
Cuando registre la ubicación de Amazon S3, seleccione la casilla de verificación Habilitar la federación del Catálogo de datos para permitir que Lake Formation asuma un rol de acceso a las tablas de una base de datos federada.
Para obtener más información sobre el registro de una ubicación de datos en Lake Formation, consulte Configurar una ubicación de Amazon S3 para el lago de datos.
-
Utilice la versión correcta de Amazon EMR.
Para utilizar Amazon EMR con las bases de datos federadas del metaalmacén de Hive, debe disponer de Hive versión 3.x o superior y Amazon EMR versión 6.x o superior.