

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 后续步骤
<a name="next-steps"></a>

## 了解 AWS Glue 转换
<a name="transformations"></a>

为了提高数据处理的效率， AWS Glue 包括内置的[转换函数](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-python-transforms.html)。这些函数在名为 a 的数据结构中从一个变换传递到另一个变换 DynamicFrame，该数据结构是 [Apache Spark](https://spark.apache.org/) SQL DataFrame 的扩展。A 与 a DynamicFrame 类似 DataFrame，不同之处在于每条记录都是自描述的，因此最初不需要架构。

要熟悉几个 AWS Glue PySpark 内置函数，请参阅博客文章 “在不使用” [的情况下在本地构建 AWS Glue ETL 管道](https://aws.amazon.com/blogs/big-data/building-an-aws-glue-etl-pipeline-locally-without-an-aws-account/)。 AWS 账户

## 编写您的第一个 ETL 作业
<a name="authoring"></a>

如果你以前没有写过 ETL 作业，你可以先使用[三种 AWS Glue ETL 作业类型将数据转换为 Apache Par](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/three-aws-glue-etl-job-types-for-converting-data-to-apache-parquet.html) quet 模式。

如果您有编写 ETL 作业的经验，则可以使用这些[AWS Glue GitHub 示例](https://github.com/aws-samples/aws-glue-samples/tree/master/examples)进行更深入的探索。

## 定价
<a name="pricing"></a>

有关定价信息，请参阅 [AWS Glue 定价](https://aws.amazon.com/glue/pricing/)。您还可以使用[AWS 定价计算器](https://calculator.aws/#/createCalculator)来估算使用不同 AWS Glue 组件的每月成本。