Próximas etapas - Recomendações da AWS

Próximas etapas

Com compreender as transformações AWS Glue

Para um processamento de dados mais eficiente, AWS Glue inclui funções de transformação integradas. As funções passam de transformação para transformação em uma estrutura de dados chamada DynamicFrame, que é a extensão de um DataFrame do Apache Spark SQL. Um DynamicFrame é semelhante a um DataFrame do Apache Spark, mas cada registro é autodescritivo, então nenhum esquema é necessário inicialmente.

Para se familiarizar com várias funções integradas do AWS Glue PySpark, consulte a postagem do blog Como criar um pipeline de ETL do AWS Glue localmente sem uma conta da AWS.

Como criar sua primeira tarefa de ETL

Se você nunca escreveu uma tarefa ETL anteriormente, pode começar usando os Três tipos de tarefa AWS Glue ETL para converter dados no padrão Apache Parquet.

Se você tem experiência em escrever tarefas de ETL, você pode utilizar os exemplos AWS Glue GitHub para explorar mais profundamente.

Preços

Para obter informações sobre preços, consulte AWS Glue preços. Você também pode utilizar AWS Calculadora de Preços para estimar o custo mensal do uso de componentes AWS Glue diferentes.