翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon EKS でのモニタリング
<a name="monitoring"></a>

Amazon EKS でのモニタリングは、Kubernetes ワークロードのヘルス、パフォーマンス、セキュリティに関する重要な可視性を提供します。適切なモニタリングを行わないと、サービスの中断、セキュリティ違反、非効率的なリソース使用率が発生し、事業運営に影響を与え、コストが増加する可能性があります。効果的なモニタリングにより、問題をプロアクティブに特定して解決し、リソースの使用を最適化し、コンテナ化されたアプリケーション全体でコンプライアンス要件を維持できます。包括的なモニタリングソリューションを実装することで、高可用性を確保し、異常を早期に検出し、Amazon EKS インフラストラクチャのスケーリングと改善のためにデータ駆動型の意思決定を行うことができます。

このセクションでは、さまざまなモニタリングタイプ、利用可能なツール、Kubernetes 環境の堅牢なモニタリング戦略の構築に役立つベストプラクティスなど、Amazon EKS モニタリングのさまざまな側面について説明します。

**Topics**
+ [モニタリングのタイプ](monitoring-types.md)
+ [ツール](monitoring-tools.md)
+ [高可用性の実装](monitoring-ha-setup.md)
+ [ベストプラクティス](monitoring-best-practices.md)
+ [高度な考慮事項](monitoring-considerations.md)

# Amazon EKS のモニタリングのタイプ
<a name="monitoring-types"></a>

Amazon EKS の効果的なオブザーバビリティには、インフラストラクチャ、アプリケーション、セキュリティのモニタリングアクティビティが含まれます。

## インフラストラクチャのモニタリング
<a name="infrastructure"></a>

インフラストラクチャモニタリングは Amazon EKS オブザーバビリティの基本的なコンポーネントであり、Kubernetes クラスターの基本的な要素のヘルスとパフォーマンスに関する深いインサイトを提供します。その中核となるのは、コントロールプレーンコンポーネントとワーカーノードの両方のバイタルを追跡し、基盤となるプラットフォームが安定して効率的であることを確認することです。
+ API サーバー、 etcd データベース、スケジューラなどの主要なコンポーネントを監督するため、**コントロールプレーンのモニタリング**は重要です。API サーバーのレイテンシーをモニタリングすることで、アプリケーションのデプロイやスケーリングオペレーションに影響を与える可能性のあるパフォーマンスのボトルネックをすばやく特定できます。Etcd パフォーマンスモニタリングは、クラスターの状態データベースが効率的に動作することを検証し、クラスター全体に影響を与える可能性のあるデータ整合性の問題を防ぎます。
+ **ノードレベルのモニタリング**は、コンテナ化されたワークロードを実行するコンピューティングリソースに焦点を当てているため、同様に重要です。これには、すべてのワーカーノードでの CPU 使用率、メモリ消費量、ディスク I/O、ネットワークパフォーマンスの追跡が含まれます。これらのメトリクスを理解することで、リソースの枯渇を防ぎ、ノードスケーリングの決定を最適化し、適切なキャパシティプランニングを確保できます。
+ **ネットワークモニタリング**は、ポッド、サービス、外部リソース間の信頼性の高い通信を維持する上で重要な役割を果たします。ネットワークスループット、レイテンシー、および接続状態をモニタリングすることで、接続の問題を早期に特定し、アプリケーションのスムーズな通信を確保できます。ストレージモニタリングは、ボリュームのパフォーマンス、容量使用率、I/O パターンを追跡することでネットワークモニタリングを補完し、データ関連のボトルネックを防ぐのに役立ちます。

インフラストラクチャモニタリングは、潜在的な問題の早期警告システムとして機能し、プロアクティブメンテナンスを可能にし、最適なリソース割り当てを確保します。堅牢なインフラストラクチャモニタリングを行わないと、予期しないダウンタイム、パフォーマンスの低下、リソースの非効率的な使用がビジネスオペレーションとコストに大きな影響を与えるリスクがあります。

## アプリケーションのモニタリング
<a name="application"></a>

アプリケーションモニタリングは、Amazon EKS 環境で正常でパフォーマンスが高く、信頼性の高いコンテナ化されたアプリケーションを維持するために不可欠です。このレベルのモニタリングでは、クラスター内で実行される実際のワークロードに焦点を当て、アプリケーションがどのように動作し、実行し、他のサービスとやり取りするかに関する重要なインサイトを提供します。

アプリケーションモニタリングには、コンテナレベルのモニタリング、サービスレベルのモニタリング、分散トレースが含まれます。
+ **コンテナレベルで**は、アプリケーションモニタリングは、コンテナのヘルスステータス、再起動数、リソース消費パターンなどの重要なメトリクスを追跡します。これらのメトリクスは、過剰なリソースを消費したり、頻繁に再起動したりしている可能性がある問題のあるコンテナを特定するのに役立ちます。これは、メモリリークや設定の問題などの根本的な問題を示している可能性があります。コンテナライフサイクルイベントをモニタリングすることで、適切なアプリケーション動作を確保し、デプロイの問題を迅速にトラブルシューティングできます。
+ **サービスレベルのモニタリング**は、応答時間、エラー率、リクエストスループットなどのアプリケーションのパフォーマンスと信頼性のメトリクスを可視化します。これらのメトリクスは、サービスレベル目標 (SLOs) を維持し、ポジティブなエンドユーザーエクスペリエンスを確保するために不可欠です。さまざまなサービスエンドポイント間でレイテンシーを追跡し、パフォーマンスのボトルネックを特定し、エラーパターンをモニタリングしてアプリケーションの信頼性を維持できます。
+ **分散トレース**は、特にマイクロサービスアーキテクチャにおけるアプリケーションモニタリングのもう 1 つの重要な側面です。トレースを実装することで、さまざまなサービスを通過するリクエストを追跡し、依存関係を理解し、パフォーマンスのボトルネックを特定できます。このend-to-end可視性は、サービスインタラクションを最適化し、複数のコンポーネントにまたがる複雑な問題のトラブルシューティングに役立ちます。

カスタムアプリケーションメトリクスは、ビジネス固有のインサイトを提供する上で重要な役割を果たします。これには、注文処理率、ユーザーログイン頻度、トランザクション成功率などのメトリクスが含まれる場合があります。これらのカスタムメトリクスをインフラストラクチャおよびコンテナメトリクスと関連付けて、インフラストラクチャのパフォーマンスがビジネスオペレーションにどのように影響するかをよりよく理解し、スケーリングと最適化のためのデータ駆動型の意思決定を行うことができます。

アプリケーションモニタリングの重要性は、アプリケーションのヘルスとパフォーマンスを包括的に把握できることにあります。このモニタリングにより、高いサービス品質を維持し、問題を迅速に解決し、ビジネス目標を達成するためにアプリケーションを継続的に最適化できます。

## セキュリティモニタリング
<a name="security"></a>

Amazon EKS のセキュリティモニタリングは、組織が Kubernetes 環境の整合性、機密性、コンプライアンスを維持するのに役立つ重要なアクティビティです。この包括的なセキュリティアプローチは、継続的な監視、脅威検出、コンプライアンスモニタリングを組み合わせて、コンテナ化されたワークロードを潜在的なセキュリティリスクや不正アクセスから保護します。これには、認証と認可のモニタリング、ネットワークセキュリティのモニタリング、設定とコンプライアンスのモニタリングが含まれます。
+ **認証と認可のモニタリング**は、クラスターへのアクセスのすべての試行を追跡することで、防御の最前線を形成します。これには、API サーバーリクエストのモニタリング、ログイン試行の成功と失敗の追跡、ロールベースのアクセスコントロール (RBAC) の変更の監査が含まれます。誰がいつどのリソースにアクセスしたかの詳細な監査ログを維持することで、潜在的なセキュリティ違反、不正アクセスの試み、特権エスカレーションアクティビティをすばやく検出できます。これは、厳格なアクセスコントロールを維持することが重要なマルチテナント環境で特に重要です。
+ **ネットワークセキュリティモニタリング**は、ポッドとサービス間の不正な通信を検出して防止することに重点を置いています。ネットワークポリシー違反や異常なトラフィックパターンをモニタリングすることで、コンテナエスケープの試みやクラスター内の横移動などの潜在的なセキュリティ脅威を特定できます。これには、内部クラスター通信と外部トラフィックパターンの両方を追跡して、コンテナが承認されたエンドポイントとのみ通信し、定義されたセキュリティポリシーに従うようにすることが含まれます。
+ **設定とコンプライアンスのモニタリング**は、セキュリティベースラインを維持し、規制要件を満たすために不可欠です。これには、コンテナイメージの脆弱性の継続的なスキャン、ランタイムセキュリティのモニタリング、セキュリティ体制に影響を与える可能性のある設定変更の追跡が含まれます。定期的なコンプライアンス監査により、業界標準と組織のセキュリティポリシーへの準拠が保証され、設定ドリフトの検出により、セキュリティリスクを引き起こす可能性のある不正な変更を防ぐことができます。

Amazon EKS のセキュリティモニタリングは、規制要件への準拠を確保しながら、最新のセキュリティ脅威から保護するために必要な可視性と制御を提供します。包括的なセキュリティモニタリングを実装することで、組織は強力なセキュリティ体制を維持し、セキュリティインシデントに迅速に対応し、さまざまな規制標準への準拠を実証することができます。

# Amazon EKS のモニタリングツール
<a name="monitoring-tools"></a>

このセクションでは、Amazon EKS モニタリングツールの 3 つのカテゴリについて説明します。 AWS モニタリングサービス、オープンソースまたは独自のソリューション、および特殊なツールです。

## AWS サービス
<a name="monitoring-services"></a>
+ [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html): 包括的なモニタリングとログ記録サービス

  CloudWatch は AWS モニタリングソリューションのバックボーンを形成し、Amazon EKS 環境に広範な機能を提供します。詳細なコンテナおよびクラスターメトリクスの Container Insights を提供するため、パフォーマンス、リソース使用率、アプリケーションのヘルスをモニタリングできます。このサービスはログの集約と分析に優れており、コンテナとノード間の一元的なログ記録をサポートしています。CloudWatch は と自然に統合されます AWS のサービス。自動アラーム設定を提供し、カスタムメトリクスとダッシュボードをサポートしているため、Amazon EKS モニタリングに不可欠なツールです。
+ [AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html): 高度な分散トレースプラットフォーム

  X-Ray は、高度な分散トレース機能を提供することでオブザーバビリティを向上させます。サービスマップの視覚化により、アプリケーションアーキテクチャと依存関係を明確に把握でき、詳細なリクエスト追跡により、サービス全体のパフォーマンスのボトルネックを特定できます。X-Ray は複雑なマイクロサービスアーキテクチャを通じてリクエストを追跡できるため、特に複数の にまたがる分散システムでは、トラブルシューティングや最適化に非常に役立ちます AWS のサービス。
+ [AWS Distro for OpenTelemetry](https://aws-otel.github.io/): 統合オブザーバビリティフレームワーク

  Distro for OpenTelemetry は、クロスプラットフォームをサポートする統合データ収集機能を提供するため、ハイブリッド環境に最適です。このサービスは他の と統合され AWS のサービス、カスタム計測をサポートし、業界標準との互換性を維持しながら包括的なモニタリングソリューションを柔軟に実装できます。
+ [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html): エンタープライズグレードの視覚化

  Amazon Managed Grafana は、データの可視化と分析のためのフルマネージドサービスを提供します。他の や AWS のサービス組み込みのセキュリティ機能、エンタープライズグレードのスケーラビリティとシームレスに統合できます。このサービスは、クロスアカウントデータソースへのアクセスや との統合などの高度な機能を提供しながら、ダッシュボードの作成と管理を簡素化します AWS IAM アイデンティティセンター。
+ [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html): 高可用性、セキュア、マネージドモニタリング

  Amazon Managed Service for Prometheus は、完全マネージド型の Prometheus 互換モニタリングサービスです。自動スケーリング、高可用性、安全なメトリクスの取り込みとクエリを提供します。このサービスは Amazon EKS とシームレスに統合され、Prometheus サーバーを管理するための運用上のオーバーヘッドを排除します。

## オープンソースまたは独自のソリューション
<a name="monitoring-open-source"></a>

前のセクションで説明した AWS ツールは、シームレスな統合サービスとマネージドサービスを提供します。このセクションに記載されているオープンソースツールは、柔軟性と広範なカスタマイズオプションを提供すること AWS のサービス で補完します。各ツールの機能とユースケースを理解することは、特定の要件を満たすモニタリング戦略を設計するのに役立ちます。
+ [Prometheus](https://docs.aws.amazon.com/eks/latest/userguide/deploy-prometheus.html): メトリクス収集ツールキット

  Prometheus は、Kubernetes 環境でメトリクスを収集するためのオープンソースソリューションです。時系列データベースと PromQL クエリ言語により、高度なメトリクス分析が可能になります。プラットフォームのサービス検出機能は動的 Kubernetes 環境に自動的に適応し、アラート管理システムは重大な問題を常に把握します。Prometheus には広範な統合オプションが用意されており、包括的なメトリクスモニタリングのための汎用的な選択肢となります。
+ [Grafana](https://grafana.com/docs/grafana-cloud/monitor-infrastructure/kubernetes-monitoring/configuration/config-other-methods/config-aws-eks/): 高度な視覚化エンジン

  Grafana は、視覚化機能を通じて、複雑なモニタリングデータを実用的なインサイトに変換します。プラットフォームは、複数のソースからのデータを組み合わせたカスタマイズされたダッシュボードを作成し、インフラストラクチャとアプリケーションメトリクスの統合ビューを提供します。さまざまなデータソースとアラート管理機能をサポートしているため、包括的なモニタリングが可能です。Grafana は、リアルタイムデータと履歴データの両方を視覚化するのに役立つため、傾向を特定し、情報に基づいた意思決定を行うことができます。
+ [Fluent Bit](https://fluentbit.io/): 統合ログ記録レイヤー

  このログ記録ソリューションは、Kubernetes 環境のログ収集と管理を提供します。ネイティブの Kubernetes 統合により、コンテナとノードからのシームレスなログ収集が保証され、複数の出力先がサポートされるため、ログのストレージと分析に柔軟性がもたらされます。ログ解析やフィルタリングなどの高度な機能により、特定の要件に基づいてログを処理およびルーティングできます。Fluent Bit の軽量性により、コンテナ化された環境に特に適しています。
+ [Datadog](https://www.datadoghq.com/blog/eks-monitoring-datadog/): フルスタックオブザーバビリティ

  Datadog は、ネイティブ Kubernetes サポートを備えた包括的なモニタリング機能を提供します。インフラストラクチャモニタリング、アプリケーションパフォーマンスモニタリング (APM)、ログ管理、リアルタイム分析を提供します。プラットフォームの自動サービス検出と Amazon EKS モニタリング用の広範な統合カタログ、およびその機械学習機能を使用して、異常を検出し、潜在的な問題を予測できます。
+ [New Relic](https://docs.newrelic.com/docs/infrastructure/amazon-integrations/connect/eks-add-on/): アプリケーションパフォーマンスのモニタリング

  New Relic は、アプリケーションのパフォーマンスとインフラストラクチャの状態を可視化します。Kubernetes 統合により、詳細なコンテナインサイト、分散トレース、カスタムダッシュボードが提供されます。プラットフォームは、アプリケーションのパフォーマンスをインフラストラクチャメトリクスに関連付けるため、問題をすばやく特定して解決できます。
+ [Elastic Stack (ELK スタック)](https://aws.amazon.com/opensearch-service/resources/the-benefits-of-the-elk-stack/): ログ分析と検索

  ELK スタックは、Elasticsearch、Logstash、Kibana を組み合わせて、ログ管理と分析機能を提供します。高度な検索機能、視覚化ツール、機械学習機能を提供します。スタックを使用して、Amazon EKS 環境からの大量のログデータを処理できます。

## 特殊なツール
<a name="monitoring-special"></a>

特定のモニタリング要件、運用規模、組織設定に基づいて、以下のツールを混在させて一致させることができます。重要なのは、管理性とコスト効率を維持しながら、包括的な可視性を提供するモニタリングスタックを作成することです。
+ [kube-state-metrics (KSM)](https://github.com/kubernetes/kube-state-metrics): Kubernetes 状態モニタリング

  このアドオンサービスは Kubernetes API サーバーをリッスンし、オブジェクトの状態に関するメトリクスを生成します。デプロイ、ポッド、その他の Kubernetes リソースの正常性に関するインサイトを提供します。
+ [Kubernetes メトリクスサーバー](https://docs.aws.amazon.com/eks/latest/userguide/metrics-server.html): リソースメトリクス

  このメトリクスサーバーは、kubelets からリソースメトリクスを収集し、Kubernetes メトリクス API を通じて公開します。水平ポッドの自動スケーリングと基本的な CPU およびメモリメトリクスを提供します。
+ [Kubecost](https://github.com/kubecost/cost-analyzer-helm-chart): Kubernetes コストモニタリング

  Kubecost などのツールは、EKS クラスターの詳細なコスト分析と最適化の推奨事項を提供します。これらは、さまざまな名前空間、デプロイ、サービスにわたるクラウド支出の理解と最適化に役立ちます。

# Amazon EKS モニタリングソリューションの高可用性の実装
<a name="monitoring-ha-setup"></a>

Amazon EKS モニタリングの堅牢な高可用性 (HA) 戦略は、Kubernetes 環境を継続的に可視化するために不可欠です。このセクションでは、モニタリングインフラストラクチャのさまざまな側面に HA を実装するための包括的なアプローチについて説明します。

## アーキテクチャの冗長性とスケーラビリティ
<a name="architecture"></a>

高可用性モニタリングシステムの構築は、適切なアーキテクチャ設計から始まります。モニタリングコンポーネントは、ゾーンの障害から保護するために、複数の AWS アベイラビリティーゾーンに分散する必要があります。これには、Prometheus サーバー、ログコレクター、アラートマネージャーなどの重要なモニタリングコンポーネントの水平スケーリングの実装が含まれます。Amazon Managed Service for Prometheus や Amazon Managed Grafana などのマネージド AWS サービスを使用すると、高可用性を確保しながら運用オーバーヘッドを削減できます。自動フェイルオーバーメカニズムを設定して、コンポーネントの障害発生時のサービス継続性を維持し、ヘルスチェックと自動復旧手順を実施します。

## 回復力のあるデータストレージ戦略
<a name="data-storage"></a>

データストレージの耐障害性は、モニタリングシステムの信頼性を維持するために不可欠です。分散ストレージソリューションを実装することで、個々のストレージノードに障害が発生しても、メトリクスデータとログにアクセスし続けることができます。これには、複数のアベイラビリティーゾーン間で適切なデータレプリケーションを設定し、冗長性のために異なるストレージバックエンドを使用することが含まれます。履歴データの定期的なバックアップ手順を確立し、さまざまな障害シナリオの復旧プロセスを文書化します。Prometheus などの時系列データベースの場合、リモートストレージソリューションを実装すると、ストレージの懸念をデータ収集から分離し、システム全体の信頼性を向上させることができます。

## 冗長アラート管理
<a name="alert-mgmt"></a>

アラート管理では、HA セットアップに特別な注意が必要です。冗長アラートマネージャーをデプロイすると、システム障害発生時でも重要な通知が意図した受信者に到達します。E メール、SMS、Slack、PagerDuty などの複数の通知チャネルを設定して、代替通信パスを提供します。アラート重複排除メカニズムを使用して部分的なシステム障害時のアラートストームを防ぎ、フォールバック通知方法を使用して重要なアラートを見逃さないようにします。アラート相関を実装すると、フェイルオーバーシナリオ中にコンテキストを維持し、冗長システムからの通知の重複を防ぐことができます。

## ロードバランシングとサービス検出
<a name="load-balancing"></a>

安定したモニタリングサービスを維持するには、適切な負荷分散が不可欠です。 AWS Application Load Balancer は受信モニタリングトラフィックを複数のエンドポイントに分散し、ヘルスチェックはトラフィックが正常なインスタンスにのみルーティングされるようにします。サービス検出メカニズムは、モニタリングコンポーネントが新しいノードやサービスの追加など、環境の変化に自動的に適応するのに役立ちます。DaemonSets を使用してモニタリングエージェントをすべてのノードに一貫してデプロイし、クラスターのスケールに応じて包括的なカバレッジを確保します。

## HA に関するその他の考慮事項
<a name="ha-considerations"></a>

ネットワークの耐障害性:
+ 冗長ネットワークパスを実装します。
+ アベイラビリティーゾーン全体で適切なサブネット設計を設定します。
+ バックアップルート[AWS Direct Connect](https://docs.aws.amazon.com/whitepapers/latest/aws-vpc-connectivity-options/aws-direct-connect.html)で を使用します。
+ 適切なセキュリティグループとネットワークアクセスコントロールリスト (ネットワーク ACLs) を設定します。

モニターのモニタリング:
+ セカンダリモニタリングシステムをデプロイします。
+ クロスリージョンモニタリングを実装します。
+ 応答しないシステムのアラートを設定します。
+ フェイルオーバー手順を定期的にテストします。

キャパシティプランニング:
+ リソースの使用状況の傾向をモニタリングします。
+ 予測スケーリングを実装します。
+ パフォーマンスを定期的にテストします。

データ管理:
+ データ保持ポリシーを実装します。
+ メトリクス集約を設定します。
+ データライフサイクル管理の計画を立てます。
+ ストレージを定期的に最適化します。

復旧手順:
+ 復旧プロセスを文書化します。
+ ディザスタリカバリを定期的にテストします。
+ 可能な場合は、自動復旧を実装します。
+ 明確なエスカレーションパスを特定して実装します。

これらの高可用性プラクティスを実装することで、Amazon EKS モニタリングインフラストラクチャの信頼性と回復力を維持し、さまざまな障害シナリオでも Kubernetes 環境を継続的に可視化できます。これらの HA 設定の定期的なテストと更新により、環境の進化に合わせて有効のままになります。

# Amazon EKS でのモニタリングのベストプラクティス
<a name="monitoring-best-practices"></a>

## 戦略的実装アプローチ
<a name="implementation"></a>

Amazon EKS モニタリング戦略を成功させるには、十分に計画された段階的な実装アプローチから始めます。
+ まず、ビジネスオペレーションとアプリケーションの信頼性に直接影響する重要なメトリクスを特定してモニタリングします。この基盤には、重要なインフラストラクチャメトリクス、主要なアプリケーションパフォーマンス指標、重要なセキュリティメトリクスを含める必要があります。運用上のニーズと学んだ教訓に基づいてモニタリングカバレッジを段階的に拡大し、各追加が有意義な価値をもたらすことを確認します。
+ Terraform や などの infrastructure as code (IaC) ツールを使用して、一貫性と再現性を確保 CloudFormation することで、自動デプロイプロセスを実装します。
+ 信頼性と精度を維持するために、モニタリングシステムをテストおよび検証します。
+ 変化するビジネスニーズに合わせて、モニタリングパラメータを継続的に改善します。

## 効果的なデータ管理
<a name="data-mgmt"></a>

効率的で費用対効果の高いモニタリングソリューションを維持するには、適切なデータ管理が不可欠です。
+ 履歴分析のニーズとストレージコストのバランスを取る明確なデータ保持ポリシーを実装します。
+ さまざまなメトリクスタイプに適切なサンプリングレートを設定します。重要なメトリクスでは頻度が高くなり、重要度の低いメトリクスでは頻度が低くなります。
+ メトリクス集約を使用して、特に長期的な傾向分析のために、有意義なインサイトを維持しながらデータ量を削減します。
+ 一元的なログ記録システム (CloudWatch Logs など) に体系的なログ保持とアーカイブ手順を実装して、ストレージコストを管理し、重要なデータへのアクセスを引き続き維持します。
**注記**  
コンテナレベルのログローテーションは、Amazon EKS バージョン 1.21 以降の kubelet によって自動的に処理されます。
+ アクセス速度とコスト効率の両方を最適化するために、ログストレージにhot-warm-coldアーキテクチャを実装することを検討してください。

## アラートの設定と管理
<a name="alert-config"></a>

アラート設定では、アラートの疲労を引き起こすことなく有効性を維持するために慎重に検討する必要があります。
+ サービスレベル目標 (SLOs) と過去のパフォーマンスパターンに基づいて、明確で実用的なしきい値を定義します。
+ 即時対応が必要な重大な問題と緊急性の低い問題を明確に区別する階層型アラート重要度システムを実装します。
+ アラートが、迅速な問題解決に役立つ十分なコンテキストと実用的な情報を提供していることを確認します。
+ さまざまなアラート重要度の所有権と応答時間を定義して、明確なエスカレーション手順を確立します。
+ アラート設定を定期的に見直して絞り込み、関連性と有効性を維持します。

## リソースの最適化
<a name="resource"></a>

費用対効果の高い運用を維持するには、リソース使用率の継続的なモニタリングが不可欠です。
+ ノード、ポッド、永続ボリュームなど、すべてのクラスターコンポーネントに包括的なリソースモニタリングを実装します。
+ 実際の使用パターンとパフォーマンス要件に基づいて自動スケーリングを設定し、パフォーマンスを維持しながら効率的なリソース使用率を確保します。
+ コスト配分タグを使用して、さまざまなチーム、アプリケーション、環境のリソース消費量を追跡します。
+ リソース効率メトリクスを定期的に分析して、最適化の機会を特定し、改善を実装します。
+ クラウド支出を追跡して最適化するためのコスト管理ツールの実装を検討してください。

## セキュリティ
<a name="security"></a>

セキュリティ上の考慮事項は、モニタリング戦略に不可欠です。
+ すべてのモニタリングコンポーネントの[最小特権アクセス原則](https://docs.aws.amazon.com/wellarchitected/latest/security-pillar/sec_permissions_least_privileges.html)を実装して、ユーザーとサービスに必要なアクセス許可のみを持つようにします。
+ 包括的な監査ログ記録を有効にして、モニタリングシステムへのすべてのアクセスと変更を追跡します。
+ 潜在的な脆弱性を特定するために、モニタリング設定とアクセスパターンを定期的にセキュリティレビューします。
+ 転送中と保管時の両方の機密データモニタリングデータの暗号化を実装します。
+ セキュリティモニタリングを既存のセキュリティ情報およびイベント管理 (SIEM) システムと統合して、包括的なセキュリティ可視性を実現します。

# Amazon EKS での高度なモニタリングに関する考慮事項
<a name="monitoring-considerations"></a>

パフォーマンスの最適化:
+ メトリクス収集間隔を最適化します。
+ 効率的なクエリパターンを設定します。
+ メトリクスの事前集約を実装します。
+ 適切なストレージソリューションを使用します。

コンプライアンスとガバナンス:
+ 監査証跡を維持します。
+ コンプライアンスモニタリングを実装します。
+ 定期的なコンプライアンスレポートを提供します。
+ モニタリング手順を文書化します。

ディザスタリカバリ:
+ モニタリング設定を定期的にバックアップします。
+ 復旧手順を文書化します。
+ 復旧プロセスをテストします。

継続的な改善:
+ レビューセッションを定期的にモニタリングします。
+ パフォーマンスサイクルを最適化します。
+ インシデントに基づいてモニタリングを更新します。
+ ユーザーフィードバックを組み込みます。

これらのベストプラクティスは、Amazon EKS 環境の効果的なモニタリングソリューションを実装および維持するためのフレームワークを提供します。これらのプラクティスを定期的に見直して更新し、組織のニーズと業界標準に合わせるようにします。モニタリングは 1 回限りのセットアップではなく、定期的な注意と改良が必要な継続的なプロセスです。