

 **このページの改善にご協力ください** 

このユーザーガイドに貢献するには、すべてのページの右側のペインにある「**GitHub でこのページを編集する**」リンクを選択してください。

# Amazon CloudWatch でクラスターデータをモニタリングする
<a name="cloudwatch"></a>

Amazon CloudWatch はクラウドリソースからメトリクスとログを収集するモニタリングサービスです。バージョン `1.28` 以降の新しいクラスターを使用する場合、CloudWatch は基本的な Amazon EKS メトリクスを無料で提供します。ただし、CloudWatch オベサビリティオペレーター を Amazon EKS アドオンとして使用すると、オブザーバビリティ機能を強化できます。

## Amazon CloudWatch の基本メトリクス
<a name="cloudwatch-basic-metrics"></a>

Kubernetes バージョン `1.28` 以降のクラスターの場合、CloudWatch の Vended メトリクスを `AWS/EKS` 名前空間で無料で取得できます。次の表はサポートされているバージョンで使用できる基本的なメトリクスのリストです。リストされているあらゆるメトリクスの頻度は 1 分です。


| メトリクス名 | 説明 | 
| --- | --- | 
|   `apiserver_flowcontrol_current_executing_seats`   |  API リクエストの実行に現在使用されているシートの数。シート割り当ては、Kubernetes API Priority and Fairness [機能](https://kubernetes.io/docs/concepts/cluster-administration/flow-control/)の priority\$1level と flow\$1schema の設定によって決まります。  **単位**: カウント  **有効な統計:** Sum  | 
|   `scheduler_schedule_attempts_total`   |  一定期間にクラスター内の Pod をスケジュールするための、スケジューラによる合計試行回数。このメトリクスは、スケジューラのワークロードのモニタリングに役立ち、スケジューリングのプレッシャーや Pod 配置の潜在的な問題を示している可能性があります。  **単位**: カウント  **有効な統計:** Sum  | 
|   `scheduler_schedule_attempts_SCHEDULED`   |  一定期間にクラスター内のノードに Pod をスケジュールするための、スケジューラによる成功した試行回数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `scheduler_schedule_attempts_UNSCHEDULABLE`   |  ノードの CPU やメモリの不足などの有効な制約により、一定期間スケジュールできなかった Pod をスケジュールするための試行回数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `scheduler_schedule_attempts_ERROR`   |  API サーバーの接続の問題などの、スケジューラ自体の内部的な問題により、一定期間失敗していた Pod をスケジュールするための試行回数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `scheduler_pending_pods`   |  一定期間にクラスター内のスケジューラによってスケジュールされる、保留中の Pod の合計数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `scheduler_pending_pods_ACTIVEQ`   |  一定期間にクラスターでスケジュールされることを待機している、activeQ で保留中の Pod の数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `scheduler_pending_pods_UNSCHEDULABLE`   |  スケジューラがスケジュールを試みて失敗し、再試行のためにスケジュールできない状態で保持されている、保留中の Pod の数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `scheduler_pending_pods_BACKOFF`   |  バックオフ期間の終了を待機している、バックオフ状態で `backoffQ` で保留中の Pod の数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `scheduler_pending_pods_GATED`   |  必要な条件を満たすまでスケジュールできないため、制限あり状態で現在待機している保留中の Pod の数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_request_total`   |  クラスター内のすべての API サーバーで行われた HTTP リクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_request_total_4XX`   |  `4XX` (クライアントエラー) ステータスコードが発生した、クラスター内のすべての API サーバーに対して行われた HTTP リクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_request_total_429`   |  クライアントがレート制限のしきい値を超えたときに発生する `429` ステータスコードが発生した、クラスター内のすべての API サーバーに対して行われた HTTP リクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_request_total_5XX`   |  `5XX` (サーバーエラー) ステータスコードが発生した、クラスター内のすべての API サーバーに対して行われた HTTP リクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_request_total_LIST_PODS`   |  クラスター内のすべての API サーバーに対して行われた Pod の `LIST` リクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_request_duration_seconds_PUT_P99`   |  クラスター内のすべての API サーバーでのすべてのリクエストから計算された、`PUT` リクエストのレイテンシーの 99 パーセンタイル。すべての `PUT` リクエストの 99% が完了する応答時間を表しています。  **単位:** 秒  **有効な統計:** 平均  | 
|   `apiserver_request_duration_seconds_PATCH_P99`   |  クラスター内のすべての API サーバーでのすべてのリクエストから計算された、`PATCH` リクエストのレイテンシーの 99 パーセンタイル。すべての `PATCH` リクエストの 99% が完了する応答時間を表しています。  **単位:** 秒  **有効な統計:** 平均  | 
|   `apiserver_request_duration_seconds_POST_P99`   |  クラスター内のすべての API サーバーでのすべてのリクエストから計算された、`POST` リクエストのレイテンシーの 99 パーセンタイル。すべての `POST` リクエストの 99% が完了する応答時間を表しています。  **単位:** 秒  **有効な統計:** 平均  | 
|   `apiserver_request_duration_seconds_GET_P99`   |  クラスター内のすべての API サーバーでのすべてのリクエストから計算された、`GET` リクエストのレイテンシーの 99 パーセンタイル。すべての `GET` リクエストの 99% が完了する応答時間を表しています。  **単位:** 秒  **有効な統計:** 平均  | 
|   `apiserver_request_duration_seconds_LIST_P99`   |  クラスター内のすべての API サーバーでのすべてのリクエストから計算された、`LIST` リクエストのレイテンシーの 99 パーセンタイル。すべての `LIST` リクエストの 99% が完了する応答時間を表しています。  **単位:** 秒  **有効な統計:** 平均  | 
|   `apiserver_request_duration_seconds_DELETE_P99`   |  クラスター内のすべての API サーバーでのすべてのリクエストから計算された、`DELETE` リクエストのレイテンシーの 99 パーセンタイル。すべての `DELETE` リクエストの 99% が完了する応答時間を表しています。  **単位:** 秒  **有効な統計:** 平均  | 
|   `apiserver_current_inflight_requests_MUTATING`   |  クラスター内のすべての API サーバーで現在処理されている、変更リクエスト (`POST`、`PUT`、`DELETE`、`PATCH`) の数。このメトリクスは、処理中であり、まだ処理を完了していないリクエストを表しています。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_current_inflight_requests_READONLY`   |  クラスター内のすべての API サーバーで現在処理されている、読み取り専用リクエスト (`GET`、`LIST`) の数。このメトリクスは、処理中であり、まだ処理を完了していないリクエストを表しています。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_admission_webhook_request_total`   |  クラスター内のすべての API サーバーで行われたアドミッションウェブフックリクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_admission_webhook_request_total_ADMIT`   |  クラスター内のすべての API サーバーで行われた変更アドミッションウェブフックリクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_admission_webhook_request_total_VALIDATING`   |  クラスター内のすべての API サーバーで行われた検証アドミッションウェブフックリクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_admission_webhook_rejection_count`   |  拒否されたクラスター内のすべての API サーバーで行われたアドミッションウェブフックリクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_admission_webhook_rejection_count_ADMIT`   |  拒否されたクラスター内のすべての API サーバーで行われた変更アドミッションウェブフックリクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_admission_webhook_rejection_count_VALIDATING`   |  拒否されたクラスター内のすべての API サーバーで行われた検証アドミッションウェブフックリクエストの数。  **単位**: カウント  **有効な統計:** Sum  | 
|   `apiserver_admission_webhook_admission_duration_seconds`   |  クラスター内のすべての API サーバーでのすべてのリクエストから計算された、サードパーティーのアドミッションウェブフックリクエストのレイテンシーの 99 パーセンタイル。すべてのサードパーティーのアドミッションウェブフックリクエストの 99% が完了する応答時間を表しています。  **単位:** 秒  **有効な統計:** 平均  | 
|   `apiserver_admission_webhook_admission_duration_seconds_ADMIT_P99`   |  クラスター内のすべての API サーバーでのすべてのリクエストから計算された、サードパーティーの変更アドミッションウェブフックリクエストのレイテンシーの 99 パーセンタイル。すべてのサードパーティーの変更アドミッションウェブフックリクエストの 99% が完了する応答時間を表しています。  **単位:** 秒  **有効な統計:** 平均  | 
|   `apiserver_admission_webhook_admission_duration_seconds_VALIDATING_P99`   |  クラスター内のすべての API サーバーでのすべてのリクエストから計算された、サードパーティーの検証アドミッションウェブフックリクエストのレイテンシーの 99 パーセンタイル。すべてのサードパーティーの検証アドミッションウェブフックリクエストの 99% が完了する応答時間を表しています。  **単位:** 秒  **有効な統計:** 平均  | 
|   `apiserver_storage_size_bytes`   |  クラスター内の API サーバーで使用される、etcd ストレージデータベースファイルの物理サイズ (バイト単位)。このメトリクスは、ストレージに割り当てられた実際のディスク容量を表しています。  **単位:** バイト  **有効な統計:** 最大  | 

## Amazon CloudWatch オブザーバビリティオペレータ
<a name="cloudwatch-operator"></a>

Amazon CloudWatch Observability は、リアルタイムログ、メトリクス、トレースデータを収集します。それらを [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) と [AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) に送信します。このアドオンをインストールすると、CloudWatch アプリケーションシグナルと Amazon EKS のオブザーバビリティが強化された CloudWatch コンテナインサイトの両方を有効にできます。これにより、インフラストラクチャとコンテナ化されたアプリケーションのヘルスとパフォーマンスをモニタリングできます。Amazon CloudWatch オベサビリティオペレーター は必要なコンポーネントをインストールして設定するように設計されています。

Amazon EKS は [Amazon EKS アドオン](eks-add-ons.md)として CloudWatch オベサビリティオペレーター をサポートしています。このアドオンは、クラスターの Linux と Windows の両方のワーカーノードで Container Insights を有効にします。Container Insights を Windows で有効にするには、Amazon EKS アドオンのバージョンが `1.5.0` 以上である必要があります。現在、CloudWatch Application Signals は Amazon EKS Windows ではサポートされていません。

以下のトピックでは Amazon EKS クラスターのために CloudWatch オベサビリティオペレーター の使用を開始する方法について説明します。
+ このアドオンのインストール手順については「*Amazon CloudWatch ユーザーガイド*」の「[Amazon CloudWatch オベサビリティ EKS アドオンまたは Helm チャートを使用して CloudWatch エージェントをインストールする](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/install-CloudWatch-Observability-EKS-addon.html)」を参照してください。
+ CloudWatch アプリケーションシグナルの詳細については「*Amazon CloudWatch ユーザーガイド*」の「[Application Signals](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Application-Monitoring-Sections.html)」を参照してください。
+ 詳細については、「*Amazon CloudWatch ユーザーガイド*」の「[Container Insights の使用](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContainerInsights.html)」を参照してください。