本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
EMR 可觀測性最佳實務
EMR 可觀測性包含 AWS EMR 叢集的全方位監控和管理方法。基礎依賴 Amazon CloudWatch 作為主要監控服務,由 EMR Studio 和 Prometheus 和 Grafana 等第三方工具補充,以提高可見性。在本文件中,我們會探索叢集可觀測性的特定層面:
-
Spark 可觀測性
(GitHub) – 關於 Spark 使用者介面,您在 Amazon EMR 中有三個選項。 -
Spark 疑難排解
(GitHub) – 錯誤的解決方案。 -
EMR 叢集監控
(GitHub) – 監控叢集效能。 -
故障診斷 EMR
(GitHub) – 識別、診斷和解決常見的 EMR 叢集問題。 -
成本最佳化
(GitHub) – 本節概述執行具成本效益工作負載的最佳實務。
適用於 Apache Spark 應用程式的效能最佳化工具
-
AWS EMR Advisor
工具會分析 Spark 事件日誌,以提供量身打造的建議,以最佳化 EMR 叢集組態、增強效能並降低成本。透過利用歷史資料,建議理想的執行器大小和基礎設施設定,實現更有效率的資源使用率並改善整體叢集效能。 -
Amazon CodeGuru Profiler
工具透過收集和分析執行時間資料,協助開發人員識別 Spark 應用程式中的效能瓶頸和效率低下。該工具與現有的 Spark 應用程式無縫整合,需要最少的設定,並透過 AWS 主控台提供有關 CPU 用量、記憶體模式和效能熱點的詳細洞察。