后续步骤 - AWS Prescriptive Guidance

后续步骤

了解 AWS Glue 转换

为了提高数据处理的效率,AWS Glue 包括内置的转换函数。函数在一个称为 DynamicFrame 的数据结构中从一个转换传递到另一个转换,该数据结构是 Apache Spark SQL DataFrame的扩展。DynamicFrame 与 DataFrame 类似,不同之处在于每个记录都是自描述的,因此刚开始并不需要任何架构。

要了解几个 AWS Glue Pyspark 内置函数,请参阅博客文章:Building an AWS Glue ETL pipeline locally without an AWS account

编写您的第一个 ETL 作业

如果您以前并无写过 ETL 作业,您可以先使用三种 AWS Glue ETL 作业类型将数据转换为 Apache Parquet 模式。

如果您有编写 ETL 作业的经验,则可以使用 AWS Glue GitHub 示例进行更深入的探索。

定价

有关定价信息,请参阅 AWS Glue 定价。您还可以使用 AWS 定价计算器 来估算使用不同 AWS Glue 组件的月度成本。