次のステップ - AWS 規範ガイダンス

次のステップ

AWS Glue トランスフォームの理解

より効率的なデータ処理のために、AWS Glue には「変換関数」 が組み込まれています。この関数は、「Apache Spark」のSQL DataFrameを拡張したDynamicFrameと呼ばれるデータ構造内で、トランスフォームからトランスフォームへと渡されます。DynamicFrame は DataFrame に似ているが、各レコードが自己記述型であるため、最初はスキーマが必要ない点が異なります。

AWS Glue PySpark のいくつかの組み込み関数について詳しく知るには、ブログ記事「AWS Glue ETL パイプラインをローカルで AWS アカウントなしで構築する」 を参照してください。

最初の ETL ジョブの作成

ETL ジョブを書いたことがない場合は、データを Apache Parquet に変換するための 3 つのAWS Glue ETL ジョブタイプパターンを使って始めることができます。

ETL ジョブを作成した経験がある場合は、「AWS Glue GitHub の例」 を使用してさらに詳しく調べることができます。

料金

料金情報については、「AWS Glue の料金」を参照してください。また、「AWS 料金見積りツール」 を使用して、さまざまな AWS Glue コンポーネントを使用する場合の毎月のコストを見積もることもできます。