

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Utilice un racimo de Delta Lake con Spark and AWS Glue
<a name="Deltacluster-spark-glue"></a>

Para usar el AWS Glue Catalog como almacén de tablas de Delta Lake, cree un clúster con los siguientes pasos. Para obtener información sobre cómo especificar la clasificación de Delta Lake mediante AWS Command Line Interface, consulte [Proporcionar una configuración mediante la AWS Command Line Interface al crear un clúster](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-configure-apps-create-cluster.html#emr-configure-apps-create-cluster-cli) o [Proporcionar una configuración mediante el SDK de Java al crear un clúster](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-configure-apps-create-cluster.html#emr-configure-apps-create-cluster-sdk).

**Creación de un clúster de Delta Lake**

1. Cree un archivo, `configurations.json`, con el siguiente contenido:

   ```
   [{"Classification":"delta-defaults",  
   "Properties":{"delta.enabled":"true"}},
   {"Classification":"spark-hive-site",
   "Properties":{"hive.metastore.client.factory.class":"com.amazonaws.glue.catalog.metastore.AWSGlueDataCatalogHiveClientFactory"}}]
   ```

1. Cree un clúster con la siguiente configuración y sustituya **example Amazon S3 bucket path** y **subnet ID** por sus propios valores.

   ```
   aws emr create-cluster 
       --release-label  emr-6.9.0  
       --applications Name=Spark  
       --configurations file://delta_configurations.json 
       --region us-east-1  
       --name My_Spark_Delta_Cluster  
       --log-uri  s3://amzn-s3-demo-bucket/  
       --instance-type m5.xlarge  
       --instance-count 2   
       --service-role EMR_DefaultRole_V2  
       --ec2-attributes  InstanceProfile=EMR_EC2_DefaultRole,SubnetId=subnet-1234567890abcdef0
   ```