기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
3단계: 검사, 조정 및 반복
관찰성 시스템을 구현한 후에는 구현을 지속적으로 검토, 평가, 학습, 조정 및 개선하는 것이 좋습니다. AWS 관찰성 성숙도 모델을
정기 검토 구현
관찰성은 반복적인 프로세스입니다. 이를 위해서는 기존 구성 요소에 대한 정기적인 감사 및 평가와 지속적인 개선을 위한 변경 및 개선이 필요합니다. 정기적인 검토를 수행하여 SLOs, 알림 임계값, 대시보드, 지표 세부 수준, 보존 정책, 샘플링 전략 등을 재평가하여 팀과 비즈니스의 가치를 높이는지 확인하는 것이 좋습니다. 관찰성 비용을 특정 팀 및 서비스에 연결하면 적용 범위 및 리소스 할당에 대한 데이터 기반 결정을 활성화할 수 있습니다.
Amazon은 주간 운영 준비 검토(ORRs)를 수행하여 모범 사례에 대한 팀의 프로세스 및 관찰성 태세를 감사합니다. 이는 Amazon의 서비스 수 및 릴리스 빈도에 맞는 비차단 연습입니다.
조직의 규모에 따라 각 팀의 한 구성원이 이상 및 추세를 보고하고, 알려지지 않은 사항을 발견하고, 원치 않는 계측 및 알림을 제거하고, 대시보드를 개선하고, 관찰성 솔루션이 팀에 계속 작동하고 팀의 목표 및 성공 지표에 부합하는지 확인할 책임이 있는 BAU(Business as Always) 명단을 보유할 수도 있습니다. 또한 알림 전략을 재평가하여 보다 대응력이 뛰어나고 선제적이며 사용자에게 더 가까워질 수 있습니다. 이러한 검토의 목표는 다음 그림과 같이 선순환을 생성하고 관찰성 성숙도 AWS 모델에 설명된 대로 관찰성 태세 성숙도의 성숙도를
가장 자주 액세스하는 플레이북을 식별하고 애플리케이션을 개선하거나 계측을 추가하는 것이 좋습니다. 가장 자주 실행되는 런북을 식별하고 해당 런북을 자동화하는 것이 좋습니다.
이러한 리뷰의 학습 내용은 관찰성 스쿼드 및 전문가와도 공유되어 중앙 프로그램 및 관찰성 플랫폼의 개선 사항을 강조합니다. 예를 들어 배포 트리거 이벤트의 빈도에 따라 다른 구성 요소보다 배포 파이프라인 개선의 우선순위를 지정할 수 있습니다. 모니터링 격차로 인해 MTTR이 더 높은 경우 관찰성 플랫폼 및 해당 구성 개선의 우선순위를 지정할 수 있습니다.
승자 축하
관찰성 도구를 사용하는 팀의 성공 사례를 공유합니다. 예를 들어 관찰성 지표를 사용하여 보다 효율적이고 지연 시간이나 비용을 줄이는 대체 솔루션을 구현한 팀의 성공을 강조합니다. 이러한 성공을 알리는 것은 관찰성의 중요성을 강조하고 다른 팀이 관찰성 태세를 개선하고 유사한 성공을 위해 노력하도록 동기를 부여합니다.
인시던트에서 알아보기
Amazon에서 오류 수정(COE)