本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS Glue 常見問答集上的無伺服器 ETL
本節提供有關 上無伺服器 ETL 的常見問題解答 AWS Glue。
何時應使用 Python shell 而非 Apache Spark 執行 AWS Glue 任務?
當您有不需要 Apache Spark 分散式運算功能的基本 ETL 任務或小型資料集時,請使用 Python shell。將 Apache Spark 用於需要 Spark 最佳化處理之高處理能力的更複雜 ETL 任務或大型資料集。
我的專案的建議 AWS Glue 版本是什麼?
我們通常建議使用最新版本的 AWS Glue。AWS Glue 版本頁面列出版本之間的差異,以及其與各種 Python 和 Spark 版本的相容性。