Amazon CloudWatch 儀表板 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon CloudWatch 儀表板

建立叢集時,會建立 Amazon CloudWatch 儀表板。這可讓您更輕鬆地監控叢集中的節點,以及檢視存放在 Amazon CloudWatch Logs 中的日誌。儀表板的名稱為 ClusterName-RegionClusterName 是叢集的名稱 AWS 區域 ,而 Region 是叢集所在的區域。您可以在 主控台中或透過開啟 來存取儀表板https://console.aws.amazon.com/cloudwatch/home?region=Region#dashboards:name=ClusterName-Region

下圖顯示叢集的 CloudWatch 儀表板範例。

Dashboard graphs of the status of cluster resources.

前端節點執行個體指標

儀表板的第一個區段會顯示前端節點 Amazon EC2 指標的圖形。

如果您的叢集具有共用儲存體,則下一節會顯示共用儲存體指標。

叢集運作狀態指標

如果您的叢集使用 Slurm進行排程,叢集運作狀態指標圖表會顯示即時叢集運算節點錯誤。如需詳細資訊,請參閱叢集運作狀態指標疑難排解。從 3.6.0 AWS ParallelCluster 版開始,叢集運作狀態指標會新增至儀表板。

前端節點日誌

最後一個區段列出依日誌分組 AWS ParallelCluster的前端節點日誌、排程器日誌、Amazon DCV 整合日誌和系統日誌。

如需 Amazon CloudWatch 儀表板的詳細資訊,請參閱《Amazon CloudWatch 使用者指南》中的使用 Amazon CloudWatch 儀表板Amazon CloudWatch

如果您不想建立 Amazon CloudWatch 儀表板,您可以將 Monitoring / Dashboards / CloudWatch / 設定為 Enabled將其關閉false

注意

如果您停用建立 Amazon CloudWatch 儀表板,您也可以停用叢集的 Amazon CloudWatch disk_used_percentmemory_used_percent警示。如需詳細資訊,請參閱叢集指標的 Amazon CloudWatch 警示

從 3.6 AWS ParallelCluster 版開始新增 disk_used_percentmemory_used_percent警示。