사고 탐지 및 대응에서 온보딩된 워크로드 테스트
참고
경보 테스트에 사용하는 AWS Identity and Access Management 사용자 또는 역할에 cloudwatch:SetAlarmState 권한이 있어야 합니다.
온보딩 프로세스의 마지막 단계는 새 워크로드에 게임데이를 수행하는 것입니다. 경보 수집이 완료되면 AWS 사고 탐지 및 대응은 게임데이를 시작하기로 선택한 날짜와 시간을 확인합니다.
게임데이는 다음의 두 가지 주요 목적을 위한 것입니다.
기능 검증: AWS 사고 탐지 및 대응이 경보 이벤트를 올바르게 수신할 수 있는지 확인합니다. 또한 기능 검증은 경보 이벤트가 적절한 런북과 자동 사례 생성(경보 수집 시 선택한 경우)과 같은 기타 원하는 작업을 트리거하는지 확인합니다.
시뮬레이션: 게임데이는 실제 인시던트 중에 발생할 수 있는 상황을 전체적으로 다루는 시뮬레이션입니다. AWS 사고 탐지 및 대응은 규정된 런북 단계에 따라 실제 인시던트가 어떻게 전개될 수 있는지에 대한 인사이트를 제공합니다. 게임데이는 질문을 하거나 지침을 구체화하여 참여도를 개선할 수 있는 기회입니다.
경보 테스트 중에 AWS 사고 탐지 및 대응은 사용자와 협력하여 식별된 문제를 해결합니다.
CloudWatch 경보
AWS 사고 탐지 및 대응은 경보의 상태 변경을 모니터링하여 Amazon CloudWatch 경보를 테스트합니다. 이렇게 하려면 AWS Command Line Interface를 사용하여 경보를 경보 상태로 수동으로 변경합니다. AWS CloudShell에서 AWS CLI에 액세스할 수 있습니다. AWS 사고 탐지 및 대응은 테스트 중에 사용할 수 있는 AWS CLI 명령 목록을 제공합니다.
경보 상태를 설정하는 AWS CLI 명령의 예:
aws cloudwatch set-alarm-state --alarm-name "ExampleAlarm" --state-value ALARM --state-reason "Testing AWS Incident Detection and Response" --regionus-east-1
CloudWatch 경보의 상태를 수동으로 변경하는 방법에 대한 자세한 내용은 SetAlarmState를 참조하세요.
CloudWatch API 작업에 필요한 권한에 대한 자세한 내용은 Amazon CloudWatch 권한 참조를 참조하세요.
타사 APM 경보
Datadog, Splunk, New Relic 또는 Dynatrace와 같은 타사 애플리케이션 성능 모니터링(APM) 도구를 사용하는 워크로드로 경보를 시뮬레이션하려면 다른 지침이 필요합니다. 게임데이가 시작될 때 AWS 사고 탐지 및 대응은 경보 임계값 또는 비교 연산자를 일시적으로 변경하여 경보를 ALARM 상태로 강제 전환하도록 요청합니다. 이 상태는 AWS 사고 탐지 및 대응에 대한 페이로드를 트리거합니다.
핵심 결과물
핵심 결과물:
경보 수집에 성공하고 경보 구성이 정확합니다.
경보가 AWS 사고 탐지 및 대응에서 성공적으로 생성 및 수신되었습니다.
참여에 대한 지원 사례가 생성되고 규정된 연락처에 알림이 전송됩니다.
AWS 사고 탐지 및 대응은 미리 정해진 회의 수단을 통해 고객과 소통할 수 있습니다.
게임데이의 일부로 생성된 모든 경보 및 지원 사례가 해결됩니다.
AWS 사고 탐지 및 대응에서 워크로드를 모니터링 중임을 확인하는 Go-Live 이메일이 전송됩니다.