CloudWatch 調査 - Amazon CloudWatch

CloudWatch 調査

CloudWatch 調査機能は、システムのインシデントの対応を支援する生成 AI を活用したアシスタントです。生成 AI を使用してシステムのテレメトリをスキャンし、問題に関連する可能性のあるテレメトリデータと提案をすばやく表示します。これらの提案には、メトリクス、ログ、デプロイイベント、および複数のリソースが関与する場合の視覚的表現による根本原因の仮説が含まれます。AI アシスタントが表示できるデータのタイプの詳細なリストについては、「CloudWatch 調査が調査で表示できるインサイト」を参照してください。

CloudWatch 運用トラブルシューティングでは、追加の設定なしで調査を実行できます。調査を開始すると、CloudWatch 調査はサインインしたユーザーに関連付けられたアクセス許可を使用して、アラーム、メトリクス、または Logs Insights クエリに関連付けられたリソースを調査および分析し、トラブルシューティングの提案を提供します。調査によってリソースは作成されず、CloudWatch 調査によって実行されたすべてのアクションは、追跡可能性のために CloudTrail にログとして記録されます。調査では、運用上のトラブルシューティングに役立つ以下の情報を提供します。

  • AI が生成した観測、提案、仮説を表示する

  • マルチリソース仮説の視覚的表現にアクセスする

  • 自然言語の説明と根本原因分析を確認する

  • メトリクス、ログ、デプロイイベント、AWS Health イベント、CloudTrail 変更イベント、X-Ray トレースデータ、CloudWatch Logs Insights クエリなど、テレメトリデータの AI 分析にアクセスする

    CloudWatch 調査を設定すると、より詳細な調査が可能になります。

CloudWatch 調査を設定すると、調査に次の機能が追加されます。

  • 提案や観察の受け入れまたは破棄

    提案ごとに、ユーザーは調査結果に追加するか破棄するかを決定します。これにより、CloudWatch 調査は問題の根本原因を絞り込み、反復処理ができます。CloudWatch 調査を使用すると、複数のメトリクスやその他のテレメトリやイベントのソースを手動で特定してクエリすることなく、根本原因を見つけることができます。異なるコンソールの検索と切り替えに何時間もかかっていたトラブルシューティングの問題も、はるかに短時間で解決できます。

  • クロスアカウントアクセスを設定する

    CloudWatch クロスアカウントオブザーバビリティを使用して、調査で他のソースアカウントからデータを収集できるようにします。

  • 調査に新しいテレメトリソースを追加する

    CloudTrail イベント履歴からデータを追加すると、CloudWatch 調査で問題を変更イベントに関連付けるのに役立ちます。X-Ray を追加すると、トポロジとアプリケーションマッピングが改善されます。Application Signals からデータを追加して、そのテレメトリを他のテレメトリソースと組み合わせて、アプリケーションとサービスの状態をより深く掘り下げることもできます。Amazon EKS クラスターを使用する場合は、CloudWatch 調査が EKS リソースにアクセスできるようにして、調査中の問題に関連する可能性のあるクラスターリソースに関するより詳細な情報を提供できます。

  • 調査の検出結果にメモまたはコメントを追加する

    調査の検出結果に追加のコンテキストを提供して、報告や監査の際の視点を指定できます。

  • 提案されたランブック修復を実行する

    CloudWatch 調査は、Automation ランブックを使用して問題を自動的に解決することを提案する場合があります。Automation は、別の AWS サービスである Systems Manager の一機能です。オートメーションランブックは、選択したリソースで実行する一連のステップまたはアクションを定義します。各ランブックは、特定の問題に対処するように設計されています。

  • 調査結果をチームメンバーと共有する

    追加の設定がない場合、調査はサインインしたユーザーのセッションにリンクされます。他のユーザーは、調査結果を表示したり、調査を続行したりすることはできません。CloudWatch 調査を設定すると、必要なアクセス許可が付与されたアカウント内のすべてのユーザーが調査を利用できるようになります。

  • 調査を手動で終了、アーカイブ、または再開する

    アカウントで CloudWatch 調査が設定される前は、調査は 1 回実行されてから完了します。CloudWatch 調査が設定されると、解決されるまで調査を続行できます。問題が解決されると、調査はアーカイブされます。問題を解決しても、調査の原因となった状態がまだ存在する場合は、調査を手動で終了できます。状態が再出現する場合は、調査を再起動 (または再開) できます。

  • 調査レポート

    調査を完了すると、調査のすべての検出結果、タイムラインイベント、推奨されるアクションを自動的にキャプチャする包括的な調査レポートを生成できます。

CloudWatch 調査を設定すると、アカウントで調査グループが作成されます。各アカウントに含めることができる調査グループは 1 つで、調査グループ内に同時に含めることができるアクティブな調査は最大 2 つです。毎月、各アカウントは AI 分析で強化された調査を最大 150 件作成できます。調査グループはアカウントレベルの設定です。調査グループがアカウントで作成されると、そのアカウントで開始されたすべての調査で使用されます。

注記

CloudWatch 調査を設定すると、CloudWatch は提供された IAM ロールを使用して、リソースとテレメトリをマッピングするためにアカウント内のリソースを定期的にスキャンします。Lambda などの一部のサービスは、リソースの記述または一覧表示に関連する特定の API コールに対して、CloudWatch に代わって KMS 復号 API を呼び出します。このバックグラウンドプロセスは、トポロジがアカウントの最新の状態とその依存関係を反映していることを確認するために実行されます。この更新は、アクティブな調査があるかどうかに関係なく行われます。