View a markdown version of this page

자습서: 지표 수학 함수를 사용하여 경보 억제 - AWS 사고 탐지 및 대응 사용 설명서

자습서: 지표 수학 함수를 사용하여 경보 억제

다음 자습서에서는 지표 수학을 사용하여 CloudWatch 경보를 억제하는 방법을 안내합니다.

예제 시나리오

UTC 기준 오는 화요일 오전 1시부터 오전 3시까지 예정된 활동이 있습니다. 이 시간 동안 실제 데이터 포인트를 0(설정된 임곗값보다 낮은 데이터 포인트)으로 대체하는 CloudWatch 지표 수학 함수를 생성하려고 합니다.

  1. 경보가 트리거되는 기준을 평가합니다. 다음 스크린샷은 경보 기준의 예를 제공합니다.

    경보 세부 정보를 보여주는 CloudWatch 화면입니다.

    이전 스크린샷에 표시된 경보는 Application Load Balancer 대상 그룹의 UnHealthyHostCount 지표를 모니터링합니다. 이 경보는 UnHealthyHostCount 지표가 5개의 데이터 포인트 중 5개에 대해 3보다 크거나 같을 때 ALARM 상태로 전환됩니다. 경보는 누락된 데이터를 불량으로 처리합니다(구성된 임곗값 위반).

  2. 지표 수학 함수를 생성합니다.

    이 예제에서는 UTC 기준 오는 화요일 오전 1시부터 오전 3시까지 예정된 활동이 있습니다. 따라서 이 시간 동안 실제 데이터 포인트를 0(설정된 임곗값보다 낮은 데이터 포인트)으로 대체하는 CloudWatch 지표 수학 함수를 생성하려고 합니다.

    구성해야 하는 대체 데이터 포인트는 경보 구성에 따라 다릅니다. 예를 들어 임곗값이 98 미만인 HTTP 성공률을 모니터링하는 경보가 있는 경우, 계획된 활동 중 실제 데이터 포인트를 구성된 임곗값인 100보다 큰 값으로 바꿉니다. 다음은 이 시나리오에 대한 지표 수학 함수의 예입니다.

    IF((DAY(m1) == 2 && HOUR(m1) >= 1 && HOUR(m1) < 3), 0, m1)

    이전 지표 수학 함수에는 다음 요소가 포함되어 있습니다.

    • DAY(m1) == 2: 화요일인지 확인합니다(월요일 = 1, 일요일 = 7).

    • HOUR(m1) >= 1 && HOUR(m1) < 3: UTC 기준 오전 1시~오전 3시의 시간 범위를 지정합니다.

    • IF(condition, value_if_true, value_if_false): 조건이 true인 경우 함수는 지표 값을 0으로 바꿉니다. 그렇지 않으면 원래 값(m1)이 반환됩니다.

    구문 및 사용 가능한 함수에 대한 자세한 정보는 Amazon CloudWatch 사용 설명서지표 수학 구문 및 함수를 참조하세요.

  3. AWS Management Console에 로그인하고 https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

  4. 경보를 선택한 다음 지표 수학 함수를 추가할 경보를 찾습니다.

  5. 지표 수학 섹션에서 편집을 선택합니다.

  6. 수학 추가, 빈 표현식으로 시작을 선택합니다.

  7. 수학 표현식을 입력한 다음 적용을 선택합니다.

    다음 예제와 같이 경보가 자동으로 모니터링하는 기존 지표는 m1이 되고 수학 표현식은 e1이 됩니다.

    지표 수학 표현식을 보여주는 CloudWatch 화면입니다.
  8. (선택 사항) 다음 예와 같이 지표 수학 표현식의 레이블을 편집하여 다른 사용자가 함수와 생성된 이유를 이해하는 데 도움을 줍니다.

    지표 일치 표현식 레이블의 편집을 보여주는 CloudWatch 화면입니다.
  9. m1을 선택 취소하고 e1을 선택한 다음 지표 선택을 선택합니다. 이렇게 하면 기본 지표 대신 수학 표현식을 직접 모니터링하도록 경보가 설정됩니다.

  10. 검토 및 생성 건너뛰기를 선택합니다.

  11. 경보가 정상적으로 구성되어 있는지 확인한 다음 경보 업데이트를 선택하여 변경 사항을 저장합니다.

앞의 예에서 지표 수학 함수를 적용하지 않으면 계획된 활동 중에 실제 UnHealthyHostCount 지표가 보고되었을 것입니다. 이렇게 하면 다음 예제와 같이 CloudWatch 경보가 ALARM 상태로 전환되고 사고 탐지 및 대응이 개입됩니다.

경보 상태로 이어지는 데이터 포인트를 보여주는 CloudWatch 화면입니다.

지표 수학 함수를 사용하면 활동 중에 실제 데이터 포인트가 0으로 대체되고 경보는 OK 상태로 유지되어 사고 탐지 및 대응 참여를 억제합니다.

경보 상태가 없는 데이터 포인트를 보여주는 CloudWatch 화면입니다.