경보 평가 - Amazon CloudWatch

경보 평가

지표 경보 상태

지표 경보에는 다음과 같은 상태가 있을 수 있습니다.

  • OK – 지표 또는 표현식이 정의된 임곗값 내에 있습니다.

  • ALARM – 지표 또는 표현식이 정의된 임곗값을 벗어났습니다.

  • INSUFFICIENT_DATA – 경보가 방금 시작되었거나 지표를 사용할 수 없거나 지표에서 경보 상태를 결정하는 데 사용할 수 있는 데이터가 충분하지 않습니다.

경보 평가 상태

경보 상태 외에도 각 경보에는 경보 평가 프로세스에 대한 정보를 제공하는 평가 상태가 있습니다. 다음 상태가 나타날 수 있습니다.

  • PARTIAL_DATA - 할당량 제한으로 인해 사용 가능한 모든 데이터를 검색할 수 없음을 나타냅니다. 자세한 내용은 부분 데이터 처리 방법 섹션을 참조하세요.

  • EVALUATION_ERROR - 검토 및 수정이 필요한 경보 설정의 구성 오류를 나타냅니다. 자세한 내용은 경보의 StateReason 필드를 참조하세요.

  • EVALUATION_FAILURE - 임시 CloudWatch 문제를 나타냅니다. 문제가 해결될 때까지 수동 모니터링을 사용하는 것이 좋습니다.

콘솔의 경보 세부 정보에서 또는 describe-alarms CLI 명령이나 DescribeAlarms API를 사용하여 평가 상태를 볼 수 있습니다.

경보 평가 설정

경보를 생성할 때 다음과 같은 세 가지 설정을 지정하여 CloudWatch가 경보 상태를 변경할 시기를 평가할 수 있도록 합니다.

  • 기간은 경보에 대해 개별 데이터 포인트를 생성하기 위해 지표 또는 표현식을 평가하는 기간입니다. 초로 표시됩니다.

  • [평가 기간(Evaluation Periods)]은 경보 상태를 결정할 때 평가할 가장 최근의 기간 또는 데이터 요소의 수입니다.

  • 경보에 대한 데이터 요소(Datapoints to Alarm)는 평가 기간 내에 경보가 ALARM 상태에 도달하게 만드는 위반 데이터 요소의 수입니다. 위반 데이터 포인트가 연속적일 필요는 없지만, 평가 기간(Evaluation Period)과 동일한 마지막 데이터 포인트 수 이내여야 합니다.

1분 이상인 기간의 경우 경보는 1분마다 평가되며 평가는 기간평가 기간에 정의된 기간을 기준으로 합니다. 예를 들어 기간이 5분(300초)이고 평가 기간이 1인 경우 5분이 끝날 때 1분에서 5분까지의 데이터를 기반으로 경보가 평가됩니다. 그런 다음 6분이 끝나면 2분에서 6분까지의 데이터를 기반으로 경보를 평가합니다.

경보 기간이 10초, 20초 또는 30초인 경우 경보는 10초마다 평가됩니다. 자세한 내용은 고분해능 경보 섹션을 참조하세요.

평가 기간 수에 각 평가 기간의 길이를 곱한 값이 1일을 초과하는 경우 경보는 1시간마다 평가됩니다. 이러한 다일 경보를 평가하는 방법에 대한 자세한 내용은 다일 경보 평가 예제 섹션을 참조하세요.

다음 그림에서 지표 경보에 대한 경보 임곗값은 3개 단위로 설정됩니다. [평가 기간(Evaluation Period)]과 [경보에 대한 데이터 요소(Datapoints to Alarm)]가 둘 다 3입니다. 즉, 가장 최근의 연속된 세 기간에서 기존 데이터 요소가 모두 임곗값을 초과하면 경보가 ALARM 상태가 됩니다. 그림에서는 기간 3에서 6 사이에 이러한 일이 발생합니다. 기간 6에서는 값이 임곗값 아래로 떨어지므로 평가 대상 기간 중 하나가 위반 상태가 아닙니다. 따라서 경보 상태가 다시 OK로 변경됩니다. 9번째 기간에 다시 한 번 임곗값이 위반되지만, 오직 하나의 기간 동안에만 그렇습니다. 결과적으로 경보 상태는 OK로 남아 있습니다.

경보 임곗값이 경보 트리거

[평가 기간(Evaluation Period)]과 [경보에 대한 데이터 요소(Datapoints to Alarm)]를 다른 값으로 구성하는 경우 이는 ‘M out of N(N 중 M)’ 경보를 설정한 것입니다. 경보에 대한 데이터 포인트는 ('M')이고 평가 기간은 ('N')입니다. 평가 간격은 평가 기간 수에 기간 길이를 곱한 값입니다. 예를 들어, 1분 기간으로 5개의 데이터 포인트 중 4개를 구성하는 경우 평가 간격은 5분입니다. 10분의 기간으로 3개의 데이터 포인트 중 3개를 구성하는 경우 평가 간격은 30분입니다.

참고

경보를 생성한 직후 데이터 요소가 누락되고 경보를 생성하기 전에 지표가 CloudWatch에 보고된 경우 CloudWatch는 경보를 평가할 때 경보가 생성되기 전부터 가장 최근의 데이터 요소를 검색합니다.

고분해능 경보

고분해능 지표에서 경보를 설정하는 경우 10초, 20초 또는 30초 기간의 고분해능 경보을 지정할 수 있습니다. 고분해능 경보는 요금이 더 비쌉니다. 고분해능 지표에 대한 자세한 내용은 사용자 지정 지표 게시 단원을 참조하세요.

다일 경보 평가 예제

각 평가 기간의 길이에 평가 기간 수를 곱한 값이 1일을 초과하는 경우 경보는 다일 경보입니다. 다일 경보는 시간당 한 번 평가됩니다. 다일 경보가 평가되면 CloudWatch는 평가 시 현재 시간의 :00분까지 지표만 고려합니다.

예를 들어 3일마다 10시에 실행되는 작업을 모니터링하는 경보를 가정합니다.

  1. 10:02에 작업이 실패합니다.

  2. 10:03에 경보가 평가되고 OK 상태를 유지합니다. 평가는 최대 10:00까지의 데이터만 고려하기 때문입니다.

  3. 11:03에 경보는 11:00까지의 데이터를 고려하고 ALARM 상태로 전환합니다.

  4. 11:43에 오류를 수정하고 이제 작업이 성공적으로 실행됩니다.

  5. 12:03에 경보가 다시 평가되고 성공한 작업을 확인한 후 OK 상태로 돌아갑니다.