後續步驟 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

後續步驟

了解 AWS Glue 轉換

為了更有效率地處理資料, AWS Glue 包含內建轉換函數。函數會從轉換傳遞到名為 DynamicFrame 的資料結構中的轉換,DynamicFrame 是 Apache Spark SQL DataFrame 的延伸。DynamicFrame 類似於 DataFrame,但每個記錄都是自我描述的,因此一開始不需要結構描述。

若要熟悉數個 AWS Glue PySpark 內建函數,請參閱部落格文章,在本機建置沒有 AWS 帳戶的 AWS Glue ETL 管道

撰寫您的第一個 ETL 任務

如果您先前尚未撰寫 ETL 任務,您可以使用三個 AWS Glue ETL 任務類型來將資料轉換為 Apache Parquet 模式,以開始。

如果您有撰寫 ETL 任務的經驗,您可以使用 AWS Glue GitHub 範例來更深入地探索。

定價

如需定價資訊,請參閱 AWS Glue 定價。您也可以使用 AWS 定價計算工具來估算使用不同 AWS Glue 元件的每月成本。