翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
統合オペレーションの開始方法: 緊急アラームを迅速なインシデント管理にオンボードする
重大なインシデントを迅速に通知するには、次の手順を実行して、アラームを AWS Incident Detection and Response にオンボードします。
迅速なインシデント管理のために重要なアラームを定義して設定します。詳細については、「Incident Detection and Response User Guide」の「Define and configure alarm in Incident Detection and Response」を参照してください。
-
Amazon CloudWatch を使用してアラームを設定する手順については、「Incident Detection and Response User Guide」の「Define and configure alarms in Incident Detection and Response」を参照してください。さまざまな の重要なアラームタイプの AWS 推奨事項については AWS のサービス、「Incident Detection and Response (IDR)
」を参照してください。タグ付き AWS リソースの重要な AWS アラームの作成 AWS を自動化する場合は、 AWS 統合オペレーションチームにお問い合わせください。 -
DataDog、NewRelic などの直接 Amazon EventBridge 統合
を使用してサードパーティーの APM ツールから重要なアラームをリダイレクトまたは取り込むには、AWS 「Incident Detection and Response User Guide」の「Ingest alarms from APMs that have direct integration with Amazon EventBridge」を参照してください。アラーム (イベント) を Incident Detection and Response に変換してリダイレクトするには、一連の AWS リソース (およびAWS Lambda Amazon EventBridge AWS イベントバスルール) をデプロイする必要があります。 AWS 統合オペレーションチームは、これらのリソースをインストールするための CloudFormation テンプレートの提供を支援できます。 -
DataDog、NewRelic などの Amazon EventBridge と直接統合されていないサードパーティーの APM ツールを使用して、カスタムモニタリングツールから重要なアラームをリダイレクトまたは取り込みます。詳細については、AWS 「Incident Detection and Response User Guide」の「Ingest alarm from APMs that have direct integration with Amazon EventBridge」を参照してください。アラーム (イベント) を AWS Incident Detection and Response に変換してリダイレクトするには、一連の AWS リソース (API Gateway AWS Lambda 関数と Amazon EventBridge イベントバスルール) をデプロイする必要があります。 AWS 統合運用チームは、これらのリソースをインストールするための CloudFormation テンプレートの提供を支援できます。
-
-
ワークロードアーキテクチャの詳細、連絡先情報、重要なアラームの緩和アクションに関するランブック情報を提供します。そのためには、以下のステップを完了します。
重要なワークロードまたはアプリケーションごとの AWS Incident Detection and Response ワークロードオンボーディングアンケートと、一意のワークロードごとのアラーム取り込みアンケートをダウンロードして完了します。
これらのアンケートの情報は、 AWS チームがインシデント修復ランブックを作成するのに役立ちます。このランブックでは、重要なアラームがビジネスのダウンタイムを引き起こす前に、迅速にトラブルシューティングと修復を行うための適切なアクションを実行できます。例とサンプル情報については、AWS 「Incident Detection and Response」の「Workload onboarding and alarm ingestion questionnaire」を参照してください。
Incident AWS Detection and Response に重要なアラームをオンボードするためのアクセスを提供する
AWS インシデント管理チームがモニタリングする重要なワークロード AWS アカウント を実行する に、
AWSServiceRoleForHealth_EventProcessorサービスにリンクされたロール (SLR) をデプロイします。詳細については、「AWS Incident Detection and Response へのアラート取り込みのためのプロビジョニングアクセス」を参照してください。注記
大規模な のオンボーディングを支援するために AWS アカウント、 は、この SLR のプロビジョニングを迅速に追跡するための AWS Command Line Interface スクリプトを提供 AWS できます。
(オプション) アラームが Amazon CloudWatch にある場合は、アラームテスト (本番稼働前) に使用される AWS Identity and Access Management ユーザーまたはロールに、重要なワークロードを実行 AWS アカウント している の
cloudwatch:SetAlarmStateIAM アクセス許可があることを確認してください。これは、オンボーディング後のアラームテスト (ゲーム日) に必要です。詳細については、AWS 「Incident Detection and Response」の「Test onboarded workloads」を参照してください。
迅速なインシデント管理のためにワークロードをサブスクライブする AWS サポート ケースを作成します。 AWS アカウント では、インバウンドの迅速なインシデント管理が自動的に有効になることに注意してください。つまり、サポートセンターコンソール、、または AWS SDK を使用して、統合オペレーションのインシデント検出と対応キューにケースを発行し AWS Command Line Interface、迅速に対処できます。がアウトバウンド AWS サポート ケースでインシデントをプロアクティブにモニタリングして作成 AWS するには、重要なワークロードの AWS サポート ケースを作成します。そのためには、以下のステップを完了します。
にサインインしAWS Support Center Console
、ケースの作成を選択し、テクニカルサポートを選択します。 Service の場合は、Incident Detection and Response を選択します。
カテゴリ で、新しいワークロードのオンボードを選択します。
重要度 一般的なガイダンスを選択します。
前のステップで完了したワークロードとアラームのアンケートをアタッチしました。