

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 CloudWatch 來監控 Amazon EMR 指標
<a name="UsingEMR_ViewingMetrics"></a>

指標會每五分鐘更新一次，並自動收集和推送到每個 Amazon EMR 叢集的 CloudWatch。此間隔無法設定。在 CloudWatch 中報告的 Amazon EMR 指標不收取任何費用。這些五分鐘資料點指標會封存 63 天，之後會捨棄這些資料。

## 如何使用 Amazon EMR 指標？
<a name="UsingEMR_ViewingMetrics_HowDoI"></a>

下表顯示 Amazon EMR 報告的指標常見用法。這些是協助您開始的建議，而不是完整清單。若需 Amazon EMR 報告的指標完整清單，請參閱 [CloudWatch 中的 Amazon EMR 報告的指標](#UsingEMR_ViewingMetrics_MetricsReported)。


****  

| 運作方式？ | 相關指標 | 
| --- | --- | 
| 追蹤我的叢集進度 | 查看 RunningMapTasks、RemainingMapTasks、RunningReduceTasks，和 RemainingReduceTasks 指標。 | 
| 偵測閒置叢集 | IsIdle 指標會追蹤叢集是否處於活動狀態，而非目前正在執行的任務。當叢集已閒置一段指定時間 (例如 30 分鐘) 時，您可以設置警示以將其觸發。 | 
| 偵測節點何時耗盡儲存空間 | MRUnhealthyNodes 指標會追蹤一個或多個核心節點或任務節點何時耗盡本機磁碟儲存空間並轉換為 UNHEALTHY YARN 狀態。例如，核心節點或任務節點的磁碟空間不足，將無法執行任務。 | 
| 偵測叢集何時耗盡儲存空間 | 該 HDFSUtilization 指標會監控叢集的合併 HDFS 容量，並且可能需要調整叢集大小才能新增更多核心節點。例如，HDFS 使用率很高，可能會影響作業和叢集運作狀態。 | 
| 偵測叢集何時在容量減少的情況下執行 | MRLostNodes 指標會追蹤一個或多個核心節點或任務節點無法與主節點通訊。例如，主節點無法存取核心節點或任務節點。 | 

如需詳細資訊，請參閱 [Amazon EMR 叢集終止 NO\_SLAVE\_LEFT 和核心節點 FAILED\_BY\_MASTER](emr-cluster-NO_SLAVE_LEFT-FAILED_BY_MASTER.md) 和 [AWSSupport-AnalyzeEMRLogs](https://docs.aws.amazon.com//systems-manager-automation-runbooks/latest/userguide/automation-awssupport-analyzeemrlogs.html)。

## 存取 Amazon EMR 的 CloudWatch 指標
<a name="UsingEMR_ViewingMetrics_Access"></a>

可以使用 Amazon EMR 主控台或 CloudWatch 主控台來檢視 Amazon EMR 向 CloudWatch 報告的指標。也可以使用 CloudWatch CLI 命令 `[mon-get-stats](https://docs.aws.amazon.com/AmazonCloudWatch/latest/cli/cli-mon-get-stats.html)` 或 CloudWatch `[GetMetricStatistics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html)` API 來擷取指標。如需有關使用 CloudWatch 來檢視或擷取 Amazon EMR 指標的詳細資訊，請參閱 [Amazon CloudWatch 使用者指南](https://docs.aws.amazon.com/AmazonCloudWatch/latest/DeveloperGuide/)。

------
#### [ Console ]

**使用主控台檢視指標**

1. 登入 AWS 管理主控台，並在 https：//[https://console.aws.amazon.com/emr](https://console.aws.amazon.com/emr) 開啟 Amazon EMR 主控台。

1. 在左側導覽窗格的 **EMR on EC2** 下，選擇**叢集**，然後選擇您要檢視其指標的叢集。這會開啟叢集詳細資訊頁面。

1. 選取叢集詳細資訊頁面中的**監控**索引標籤。選擇**叢集狀態**、**節點狀態**或**輸入和輸出**選項中的任何一個，載入有關叢集進度和運作狀態的報告。

1. 選擇要檢視的指標後，可以放大每個圖形。若要篩選圖形的時間範圍，請選取預先填入的選項或選擇**自訂**。

------

## CloudWatch 中的 Amazon EMR 報告的指標
<a name="UsingEMR_ViewingMetrics_MetricsReported"></a>

下表列出 Amazon EMR 在主控台中報告並推送至 CloudWatch 的指標。

### Amazon EMR 指標
<a name="emr-metrics-reported"></a>

Amazon EMR 會將多個指標的資料傳送到 CloudWatch。所有 Amazon EMR 叢集每隔五分鐘自動傳送一次指標。指標將封存兩週，之後即會捨棄資料。

`AWS/ElasticMapReduce` 命名空間包含下列指標。

**注意**  
Amazon EMR 從叢集中提取指標。如果叢集無法連接，則不會報告指標，除非叢集再次可用。

以下指標可用於執行 Hadoop 2.x 版本的叢集。

[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html)

下列是 Hadoop 1 指標：

[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html)

#### 叢集容量指標
<a name="emr-metrics-managed-scaling"></a>

下列指標可指出叢集的目前或目標容量。只有在啟用受管擴展或自動終止後，才能使用這些指標。

對於由執行個體機群組成的叢集，叢集容量指標會搭配 `Units` 測量。對於由執行個體群組組成的叢集，叢集容量指標則搭配 `Nodes` 或 `VCPU`，根據受管擴展原則中使用的單位類型為單位進行測量。如需詳細資訊，請參閱《Amazon EMR 管理指南》**中的[使用 EMR 受管擴展](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-managed-scaling.html)。


| 指標 | Description | 
| --- | --- | 
| [See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html) | 叢集中單位/節點/vCPU 的目標總數，由受管擴展判定。<br />單位：*計數* | 
| [See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html)  | 執行中執行個體內的目前可用單位/節點/vCPU 總數。叢集如被要求調整大小，則在此叢集加入新執行個體或移除執行個體之後，此指標將隨之更新。<br />單位：*計數* | 
| [See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html)  | 叢集中 CORE 單位/節點/vCPU 的目標數，由受管擴展判定。<br />單位：*計數* | 
| [See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html)  | 叢集中正在執行的 CORE 單位/節點/vCPU 的目前數目。<br />單位：*計數* | 
| [See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html)  | 叢集中 TASK 單位/節點/vCPU 的目標數，由受管擴展判定。<br />單位：*計數* | 
| [See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html)  | 叢集中正在執行的 TASK 單位/節點/vCPU 的目前數目。<br />單位：*計數* | 

當您使用自動終止政策啟用自動終止時，Amazon EMR 會以一分鐘的精細度發出以下指標。部分指標僅適用於 Amazon EMR 6.4.0 及更新的版本。若要進一步了解自動終止，請參閱 [使用 Amazon EMR 叢集清除的自動終止政策](emr-auto-termination-policy.md)。


****  

| 指標 | Description | 
| --- | --- | 
| TotalNotebookKernels | 叢集上的執行中和閒置筆記本核心的總數。此指標僅適用於 Amazon EMR 6.4.0 及更新的版本。 | 
| AutoTerminationIsClusterIdle | 指出叢集是否在使用中。**0** 值表示叢集正由下列其中一個元件使用：[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/emr/latest/ManagementGuide/UsingEMR_ViewingMetrics.html)<br />**1** 值表示叢集處於閒置狀態。Amazon EMR 會檢查叢集是否持續閒置 (`AutoTerminationIsClusterIdle` = 1)。當叢集的閒置時間等於自動終止政策中的 `IdleTimeout` 值時，Amazon EMR 會終止叢集。 | 

### Amazon EMR 指標的維度
<a name="emr-metrics-dimensions"></a>

可使用下表中的任何一個維度來篩選 Amazon EMR 資料。


| 維度  | Description  | 
| --- | --- | 
| JobFlowId | 與叢集 ID 相同，它是叢集的唯一識別符，格式為 j-XXXXXXXXXXXXX。在 Amazon EMR 主控台中按一下叢集即可尋找此值。 | 