OPS10-BP07 イベントへの対応を自動化する
イベントへの対応を自動化することは、迅速で一貫性があり、ミスのない運用処理を実現するために不可欠です。プロセスを合理化し、ツールを使用してイベントを自動的に管理および対応することで、手作業による介入を極力なくし、運用効率を高めます。
期待される成果:
- 
      
自動化を通じて、ヒューマンエラーを抑制し、解決所要時間を短縮できる。
 - 
      
一貫性があり信頼できる運用上のイベント処理。
 - 
      
運用効率とシステムの信頼性が向上する。
 
一般的なアンチパターン:
- 
      
手作業によるイベント処理は、遅延やミスにつながりやすい。
 - 
      
反復的でありながら重要なタスクに対し、自動化が見過ごされる。
 - 
      
繰り返しのタスクを手作業で行うと、アラート疲労が起きやすく、重大な問題を見逃しかねない。
 
このベストプラクティスを活用するメリット:
- 
      
イベントへの対応を迅速化し、システムのダウンタイムを短縮する。
 - 
      
自動化された一貫したイベント処理による、信頼性の高い運用。
 
このベストプラクティスを活用しない場合のリスクレベル: 中
実装のガイダンス
自動化を組み込んで運用ワークフローを効率化し、手作業による介入を極力抑えます。
実装手順
- 
          
自動化の機会を特定する: 問題の修正、チケットの強化、容量管理、スケーリング、デプロイ、テストなど、自動化の余地がある反復的なタスクを判断します。
 - 
          
自動化のプロンプトを特定する:
- 
              
自動応答の契機となる特定の条件やメトリクスを Amazon CloudWatch アラームアクションを使用して評価し、定義します。
 - 
              
Amazon EventBridge
を使用して、AWS サービス、カスタムワークロード、SaaS アプリケーションでイベントに対応します。  - 
              
AWS リソースでの特定のログエントリ、パフォーマンスメトリクスのしきい値、状態の変化など、契機となるイベントを検討します。
 
 - 
              
 - 
          
イベント駆動型の自動化を実装する:
- 
              
AWS Systems Manager オートメーションランブックを使用して、メンテナンス、デプロイ、修正のタスクを簡素化します。
 - 
              
Incident Manager でインシデントを作成して、関連する AWS リソースに関する情報を自動的に収集し、インシデントに追加します。
 - 
              
AWS のクォータモニタ
を使用してクォータをプロアクティブにモニタリングします。  - 
              
AWS Auto Scaling
を使用して容量を自動的に調整し、可用性とパフォーマンスを維持します。  - 
              
Amazon CodeCatalyst
を使用して開発パイプラインを自動化します。  - 
              
合成モニタリングを使用して、エンドポイントと API をスモークテストするか継続的にモニタリングします。
 
 - 
              
 - 
          
自動化を通じてリスクを軽減する:
- 
              
リスクに迅速に対処するため自動化されたセキュリティ対応
を実施します。  - 
              
AWS Systems Manager State Manager を使用して設定のドリフトを減らします。
 
 - 
              
 
実装計画に必要な工数レベル: 高
リソース
関連するベストプラクティス:
関連ドキュメント:
関連動画:
関連する例: