后续步骤
了解 AWS Glue 转换
为了提高数据处理的效率,AWS Glue 包括内置的转换函数。函数在一个称为 DynamicFrame 的数据结构中从一个转换传递到另一个转换,该数据结构是 Apache Spark
要了解几个 AWS Glue Pyspark 内置函数,请参阅博客文章:Building an AWS Glue ETL pipeline locally without an AWS account
编写您的第一个 ETL 作业
如果您以前并无写过 ETL 作业,您可以先使用三种 AWS Glue ETL 作业类型将数据转换为 Apache Parquet 模式。
如果您有编写 ETL 作业的经验,则可以使用 AWS Glue GitHub 示例
定价
有关定价信息,请参阅 AWS Glue 定价