Integración de Amazon EMR con Apache Ranger

A partir de Amazon EMR 5.32.0, puede iniciar un clúster que se integre de forma nativa con Apache Ranger. Apache Ranger es un marco de código abierto para habilitar, supervisar y administrar la seguridad integral de los datos en toda la plataforma Hadoop. Para obtener más información, consulte Apache Ranger. Con la integración nativa, puede utilizar su propio Apache Ranger para aplicar un control de acceso a los datos detallado en Amazon EMR.

Esta sección proporciona información general sobre la integración de Amazon EMR con Apache Ranger. También incluye los requisitos previos y los pasos necesarios para lanzar un clúster de Amazon EMR integrado con Apache Ranger.

La integración nativa de Amazon EMR con Apache Ranger ofrece los siguientes beneficios clave:

Fine-grained control de acceso a las bases de datos y tablas de Hive Metastore, lo que le permite definir políticas de filtrado de datos a nivel de base de datos, tablas y columnas para las aplicaciones Apache Spark y Apache Hive. Row-level las aplicaciones de Hive admiten el filtrado y el enmascaramiento de datos.
La posibilidad de utilizar sus políticas de Hive existentes directamente con las aplicaciones de Amazon EMR para Hive.
Control de acceso a los datos de prefijos y objetos de Amazon S3, lo que le permite definir políticas de filtrado de datos para acceder a los datos de S3 mediante el sistema de archivos de EMR.
La capacidad de utilizar los CloudWatch registros para realizar auditorías centralizadas.
Amazon EMR instala y administra los complementos de Apache Ranger en su nombre.

importante

Amazon EMR no admite la integración de Apache Ranger a partir de la versión 7.4 de Amazon EMR. Para obtener más información, consulte Amazon EMR versión 7.4.0.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Acceso basado en rutas S3 mediante Lake Formation para Amazon EMR Spark

Información general de Ranger