

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Uso AWS Lake Formation con Amazon EMR
<a name="emr-integ-lf"></a>

 Amazon EMR es una plataforma flexible de clústeres AWS gestionados en la que puede ejecutar cualquier código personalizado en marcos de big data compatibles, como Hadoop Map-Reduce, Spark, Hive, Presto, etc. Las organizaciones también utilizan Amazon EMR para ejecutar aplicaciones de procesamiento de datos por lotes y en streaming en un clúster altamente distribuido. Si utiliza Apache Spark en Amazon EMR, puede ejecutar sus transformaciones de datos y código personalizado en bases de datos y tablas cuyos permisos administre Lake Formation.

Hay tres opciones para implementar Amazon EMR:
+ EMR en EC2
+  EMR sin servidor 
+  Amazon EMR en EKS 

 Para obtener más información, consulte [Integrar Amazon EMR con Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-lake-formation.html) o Uso de [EMR Serverless](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/emr-serverless-lf-enable.html) with para un control de acceso detallado AWS Lake Formation 

## Compatibilidad con formatos de tablas transaccionales
<a name="tables-emr"></a>

 Las versiones 6.15.0 y posteriores de Amazon EMR incluyen compatibilidad con los permisos de control de acceso a nivel de tabla, fila, columna y celda de Lake Formation en los formatos de tabla [Apache Hudi](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hudi.html), [Apache Iceberg](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-iceberg.html) y [Delta Lake](https://github.com/aws-samples/amazon-emr-with-delta-lake) al leer y escribir datos con Spark SQL. 

Para conocer las limitaciones, consulte [Consideraciones sobre Amazon EMR con Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-lf-limitations.html).


**Formatos de tabla compatibles**  

| Formato de tabla | Descripción y operaciones permitidas | Permisos de Lake Formation admitidos en Amazon EMR | 
| --- | --- | --- | 
| Apache Hudi | Formato de tabla abierta para simplificar el procesamiento incremental de datos y el desarrollo de canalizaciones de datos.<br />Para obtener una lista de las operaciones compatibles, consulte [Apache Hudi y Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/hudi-with-lake-formation.html). | Amazon EMR es compatible con el control de acceso a nivel de tabla, fila, columna y celda con Apache Hudi. | 
| Apache Iceberg | Formato de tabla abierta que gestiona grandes colecciones de archivos como tablas.<br />Para obtener una lista de las operaciones compatibles, consulte [Apache Iceberg y Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/iceberg-with-lake-formation.html). | Amazon EMR es compatible con el control de acceso a nivel de tabla, fila, columna y celda con Apache Iceberg. | 
| Linux Foundation Delta Lake | Delta Lake es un proyecto de código abierto que ayuda a implementar arquitecturas de lago de datos modernos comúnmente construidas sobre Amazon S3 o el Sistema de archivos distribuido de Hadoop (HDFS).<br />Para obtener una lista de las operaciones compatibles, consulte [Delta Lake y Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/delta-with-lake-formation.html). | Amazon EMR permite el control de acceso de nivel de tabla, fila, columna y celda con tablas de Delta Lake. | 

## Recursos adicionales
<a name="add-resources-EMR"></a>

**Guía del usuario, publicaciones de blog y talleres**
+ [ Integración con Amazon EMR mediante roles de tiempo de ejecución](https://catalog.us-east-1.prod.workshops.aws/workshops/78572df7-d2ee-4f78-b698-7cafdb55135d/en-US/emr-runtimerole-integration)
+  [Introducción rápida a Apache Hudi, Apache Iceberg y Delta Lake con Amazon EMR en EKS](https://aws.amazon.com/blogs/big-data/get-a-quick-start-with-apache-hudi-apache-iceberg-and-delta-lake-with-amazon-emr-on-eks/)
+  [Uso de OSS de Delta Lake con EMR sin servidor](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/using-delta-lake.html) 