Integración de Amazon EMR con Apache Ranger - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Integración de Amazon EMR con Apache Ranger

A partir de Amazon EMR 5.32.0, puede iniciar un clúster que se integre de forma nativa con Apache Ranger. Apache Ranger es un marco de código abierto para habilitar, supervisar y administrar la seguridad integral de los datos en toda la plataforma Hadoop. Para obtener más información, consulte Apache Ranger. Con la integración nativa, puede utilizar su propio Apache Ranger para aplicar un control de acceso a los datos detallado en Amazon EMR.

Esta sección proporciona información general sobre la integración de Amazon EMR con Apache Ranger. También incluye los requisitos previos y los pasos necesarios para lanzar un clúster de Amazon EMR integrado con Apache Ranger.

La integración nativa de Amazon EMR con Apache Ranger ofrece los siguientes beneficios clave:

  • Control de acceso detallado a las bases de datos y tablas del metaalmacén de Hive, que le permite definir políticas de filtrado de datos en bases de datos, tablas y columnas para las aplicaciones Apache Spark y Apache Hive. Las aplicaciones de Hive admiten el filtrado de filas y el enmascaramiento de datos.

  • La posibilidad de utilizar sus políticas de Hive existentes directamente con las aplicaciones de Amazon EMR para Hive.

  • Control de acceso a los datos de prefijos y objetos de Amazon S3, lo que le permite definir políticas de filtrado de datos para acceder a los datos de S3 mediante el sistema de archivos de EMR.

  • La capacidad de utilizar los CloudWatch registros para realizar auditorías centralizadas.

  • Amazon EMR instala y administra los complementos de Apache Ranger en su nombre.