Pasos a seguir a continuación - Recomendaciones de AWS

Pasos a seguir a continuación

Comprensión de las transformaciones AWS Glue

Para un procesamiento de datos más eficiente, AWS Glue incluye funciones de transformación integradas. Las funciones pasan de transformación en transformación en una estructura de datos denominada DynamicFrame, que es una extensión de un Apache Spark SQL DataFrame. Un marco dinámico es similar a un marco de datos, excepto que cada registro se autodescribe, por lo que no se requiere ningún esquema inicialmente.

Para familiarizarse con varias funciones integradas de PySpark AWS Glue, consulte la entrada del blog Building an AWS Glue ETL pipeline locally without an AWS account.

Crear su primer trabajo de ETL

Si no ha escrito un trabajo de ETL anteriormente, puede empezar utilizando los Tres tipos de trabajos de ETL AWS Glue para convertir datos al patrón de Apache Parquet.

Si tiene experiencia escribiendo trabajos de ETL, puede usar los ejemplos de GitHub AWS Glue para explorarlos más a fondo.

Precios

Para obtener información sobre precios, consulte Precios de AWS Glue. También puede utilizar Calculadora de precios de AWS para estimar su costo mensual por el uso de diferentes componentes AWS Glue.