本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在本機開發和測試 AWS Glue 任務指令碼
當您開發和測試 AWS Glue for Spark 任務指令碼時,有多個可用選項:
AWS Glue Studio 主控台
Visual editor (視覺化編輯器)
指令碼編輯器
AWS Glue Studio 筆記本
互動式工作階段
Jupyter 筆記本
Docker 映像檔
本機開發
遠端開發
您可根據自己的需求選擇上述任何選項。
如果您不偏好程式碼或更少的程式碼體驗,則 Glue Studio AWS 視覺化編輯器是不錯的選擇。
如果您偏好互動式筆記本體驗, AWS Glue Studio 筆記本是不錯的選擇。如需詳細資訊,請參閱搭配使用筆記本與 AWS Glue Studio 和 AWS Glue。如果想要使用自己的本機環境,那麼互動式工作階段是個不錯的選擇。如需詳細資訊,請參閱搭配 Glue AWS 使用互動式工作階段。
如果您偏好採用本機/遠端開發,那麼 Docker 映像檔是個不錯的選擇。這可協助您在偏好的任何地方開發和測試 AWS Glue for Spark 任務指令碼,而不會產生 AWS Glue 成本。
如果您偏好不使用 Docker 的本機開發,在本機安裝 AWS Glue ETL 程式庫目錄是不錯的選擇。
使用 Glue Studio AWS 進行開發
Glue Studio 視覺化編輯器是一種圖形界面,可讓您輕鬆地在 AWS Glue 中建立、執行和監控擷取、轉換和載入 (ETL) AWS 任務。您可以以視覺化方式編寫資料轉換工作流程,並在 AWS Glue 的 Apache Spark 型無伺服器 ETL 引擎上無縫執行。您可以在任務的每個步驟中檢查結構描述和資料結果。如需詳細資訊,請參閱 AWS Glue Studio 使用者指南。
使用互動式工作階段進行開發
使用互動式工作階段允許您自行選擇要建置和測試應用程式的環境。如需詳細資訊,請參閱搭配 Glue AWS 使用互動式工作階段。