Trabajar con otros servicios de AWS - AWS Lake Formation

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Trabajar con otros servicios de AWS

Los servicios de AWS como Amazon Athena, AWS Glue, Amazon Redshift Spectrum y Amazon EMR pueden utilizar AWS Lake Formation para acceder de forma segura a los datos de las ubicaciones de Amazon S3 registradas en Lake Formation. Con Lake Formation, puede definir y administrar permisos de control de acceso específicos (FGAC) para sus tablas del AWS Glue Data Catalog. Cada uno de estos servicios de AWS es una llamada fiable a Lake Formation, y Lake Formation proporciona acceso a los datos almacenados en Amazon S3 mediante credenciales temporales. Para obtener más información, consulte Cómo funciona la integración de aplicaciones de Lake Formation.

Para aprovechar estas prestaciones, Lake Formation requiere que antes registre la ubicación de Amazon S3 y asigne los permisos adecuados a la entidad principal de IAM para acceder a la tabla, la base de datos y la ubicación de Amazon S3. Para obtener más información, consulte, Administrar los permisos de Lake Formation.

En las siguientes tablas se enumeran los tipos de permisos de Lake Formation que admiten Amazon Athena, AWS Glue, Amazon EMR y Amazon Redshift Spectrum para acceder a datos de tablas estándar y tablas transaccionales de AWS Glue (Apache Iceberg, Apache Hudi y Linux Foundation Delta Lake) con datos almacenados en Amazon S3 y metadatos de tablas en el Catálogo de datos.

Servicios de AWS y tipos de permisos compatibles para vistas y tablas estándar de AWS Glue
Servicio de AWS Permisos de tabla Permisos de columna Permisos de fila y celda
Athena SQL

Acceso de lectura/escritura

Acceso de lectura Acceso de lectura
Athena para Spark

No admitido

No admitido

No admitido

Redshift Spectrum en un clúster aprovisionado o en Amazon Redshift sin servidor

Acceso de lectura/escritura Acceso de lectura Acceso de lectura

Apache Spark en Amazon EMR (EC2)

Acceso de lectura/escritura Acceso de lectura Acceso de lectura
Apache Hive en Amazon EMR (EC2) Acceso de lectura/escritura Acceso de lectura No admitido
Apache Spark en EMR sin servidor Acceso de lectura/escritura Acceso de lectura Acceso de lectura
Apache Hive en EMR sin servidor No admitido No admitido No admitido
Amazon EMR en EKS No admitido No admitido No admitido
AWS Glue ETL Acceso de lectura/escritura AWS Glue 5.0 y versiones posteriores admiten el acceso de lectura. AWS Glue 5.0 y versiones posteriores admiten el acceso de lectura.
Consideraciones y limitaciones
  • Athena Spark no admite la consulta de tablas del Catálogo de datos con permisos de Lake Formation.

  • Los usuarios de Athena basados en SAML pueden leer los orígenes de datos protegidos mediante permisos de Lake Formation habilitando la federación basada en SAML 2.0. Los usuarios de SAML pueden insertar datos en tablas de Parquet.

  • Apache Spark en EMR sin servidor no admite la consulta de vistas del Catálogo de datos.

  • Apache Hive en EMR sin servidor no admite la consulta de tablas con permisos de Lake Formation.

  • AWS Glue 5.0 y versiones posteriores admiten los controles de acceso detallados en las tablas Iceberg y Hive del Catálogo de datos respaldadas por S3. Esta capacidad le permite configurar los controles de acceso en el nivel de tabla, fila, columna y celda para las consultas de lectura en AWS Glue para los trabajos de Apache Spark.

    Para obtener más información, consulte Versiones de AWS Glue.

Servicios de AWS y tipos de permisos compatibles de los formatos de tablas transaccionales
Servicio de AWS Iceberg Hudi Delta Lake (nativo) Delta Lake (tablas de enlaces simbólicos)

Athena SQL

Permite leer tablas con permisos de tabla, columna, fila y celda. Las operaciones de escritura requieren acceso completo a la tabla.

Permite leer y crear operaciones en tablas con permisos de tabla, columna, fila y celda. No se admiten las operaciones de escritura.

Athena (versión 3 del motor) admite la lectura de tablas nativas de Delta Lake con permisos de tabla, columna, fila y celda. No se admiten las operaciones de escritura.

Athena (versión 3 del motor) admite la lectura de tablas de enlaces simbólicos de Delta Lake con permisos de tabla, columna, fila y celda. No se admiten las operaciones de escritura.

Redshift Spectrum en un clúster aprovisionado

Permite leer tablas con permisos de tabla, columna, fila y celda. No se admiten las operaciones de escritura.

Permite leer tablas con permisos de tabla, columna, fila y celda. No se admiten las operaciones de escritura.

No compatible Permite leer de tablas de Delta Lake mediante un manifiesto de enlaces simbólicos con permisos de tabla, columna, fila y celda. No se admiten las operaciones de escritura.
Apache Spark en Amazon EMR (EC2) Permite leer tablas con permisos de tabla, columna, fila y celda. Las operaciones de escritura requieren acceso completo a la tabla. Permite leer tablas con permisos de tabla, columna, fila y celda. Las operaciones de escritura requieren acceso completo a la tabla.

Permite leer tablas con permisos de tabla, columna, fila y celda. No se admiten las operaciones de escritura.

Permite leer tablas con permisos de tabla, columna, fila y celda. Las operaciones de escritura requieren acceso completo a la tabla.
AWS Glue ETL AWS Glue 5.0 y versiones posteriores admiten la lectura de tablas con permisos en el nivel de tabla, columna, fila y celda. Admite la lectura/escritura en tablas con permisos de tabla. Admite la lectura/escritura en tablas con permisos de tabla. Admite la lectura/escritura en tablas con permisos de tabla.