Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Propagación de identidad fiable con Amazon EMR Serverless
Con las versiones 7.8.0 y posteriores de Amazon EMR, puede propagar las identidades de los usuarios desde el Centro de identidades de AWS IAM a cargas de trabajo interactivas con EMR Serverless a través de Apache Livy Endpoint. Las cargas de trabajo interactivas de Apache Livy propagarán aún más la identidad suministrada a servicios descendentes como Amazon S3, Lake Formation y Amazon Redshift, lo que permitirá el acceso seguro a los datos mediante la identidad del usuario en estos servicios descendentes. Las siguientes secciones proporcionan una descripción conceptual, los requisitos previos y los pasos necesarios para lanzar y propagar la identidad a cargas de trabajo interactivas con EMR Serverless a través de Apache Livy Endpoint.
Descripción general
El IAM Identity Center es el enfoque recomendado para la autenticación y autorización del personal en AWS organizaciones de cualquier tamaño y tipo. Con Identity Center, puede crear y administrar identidades de usuario o conectar su fuente de identidad existente, que incluye Microsoft Active Directory, Okta, Ping Identity JumpCloud, Google Workspace y Microsoft Entra ID (anteriormente Azure AD). AWS
La propagación de identidades fiable es una función del centro de identidades de AWS IAM que los administradores de los AWS servicios conectados pueden utilizar para conceder y auditar el acceso a los datos del servicio. El acceso a estos datos se basa en los atributos del usuario, como las asociaciones de grupo. La configuración de una propagación de identidad fiable requiere la colaboración entre los administradores de los AWS servicios conectados y los administradores del IAM Identity Center. Para obtener más información, consulte los requisitos previos y las consideraciones en la Guía del usuario del IAM Identity Center.
Características y ventajas
La integración de Apache Livy Endpoint sin servidor EMR con la propagación de identidad confiable de IAM Identity Center ofrece las siguientes ventajas:
La capacidad de hacer cumplir la autorización a nivel de tabla con las identidades de Identity Center en las tablas del catálogo de datos de AWS Glue gestionado por AWS Lake Formation.
La capacidad de aplicar la autorización con las identidades de Identity Center en los clústeres de Amazon Redshift.
Permite el seguimiento integral de las acciones de los usuarios para su auditoría.
La capacidad de aplicar la autorización a nivel de prefijo de Amazon S3 con las identidades de Identity Center en los prefijos de S3 administrados por S3 Access Grants.
Funcionamiento

Ejemplo de casos de uso
Preparación de datos e ingeniería de funciones
Los científicos de datos de varios equipos de investigación colaboran en proyectos complejos mediante una plataforma de datos unificada. Inician sesión en la SageMaker IA con sus credenciales corporativas y obtienen acceso inmediato a un vasto lago de datos compartido que abarca varias AWS cuentas. A medida que comienzan a diseñar nuevos modelos de aprendizaje automático, las sesiones de Spark lanzadas a través de EMR Serverless aplican las políticas de seguridad a nivel de columnas y filas de Lake Formation en función de sus identidades propagadas. Los científicos pueden preparar los datos y diseñar funciones de manera eficiente con herramientas conocidas, mientras que los equipos de cumplimiento tienen la seguridad de que cada interacción de datos se rastrea y audita automáticamente. Este entorno seguro y colaborativo acelera los procesos de investigación y, al mismo tiempo, mantiene los estrictos estándares de protección de datos exigidos en los sectores regulados.