View a markdown version of this page

선제적 인시던트 예방 - AWS DevOps 에이전트

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

선제적 인시던트 예방

AWS DevOps Agent는 인시던트 조사 전반의 패턴을 분석하여 운영 태세를 지속적으로 개선하고 향후 인시던트를 방지하는 대상 추천을 제공합니다. 운영자 웹 앱의 Ops 백로그 페이지를 통해 선제적 인시던트 예방에 액세스합니다.

선제적 인시던트 예방 작동 방식

AWS DevOps Agent는 최근 인시던트 조사를 평가하여 지속적인 개선 사항을 식별하여 향후 인시던트를 방지하고 평균 탐지 시간(MTTD)을 단축합니다. 에이전트는 여러 인시던트를 분석하여 향후 전체 인시던트 클래스를 방지할 수 있는 권장 사항을 식별하며, 가장 영향력 있는 권장 사항에 집중하여 조치를 취할 수 있도록 합니다.

기본적으로 에이전트는 매주 평가를 자동으로 실행합니다. 온디맨드 방식으로만 평가를 실행하려면 일정을 일시 중지할 수 있습니다. 수동 평가는 항상 사용할 수 있으며, 이는 최근 조사를 통해 권장 개선 사항을 신속하게 해결해야 할 때 유용합니다.

에이전트는 Ops 백로그 페이지의 권장 범주화 차트에 표시된 네 가지 범주의 개선 사항을 식별합니다.

  • 관찰성 - 모니터링, 알림, 로깅 및 시스템 가시성을 향상하여 문제를 더 빠르고 정확하게 감지하는 것이 좋습니다.

  • 인프라 - 리소스 구성, 용량 튜닝 및 아키텍처 복원력을 최적화하기 위한 권장 사항입니다.

  • 거버넌스 - 배포 프로세스, 파이프라인 개선, 테스트 관행 및 운영 제어를 강화하기 위한 권장 사항입니다.

  • 코드 최적화 - 애플리케이션 코드 품질, 오류 처리 및 코드 복원력을 개선하기 위한 권장 사항입니다.

이 분류를 통해 운영 개선이 가장 필요한 부분을 파악하고 팀의 중점 영역에 따라 권장 사항의 우선순위를 지정할 수 있습니다.

이점

  • 반복되는 인시던트 방지 - 동일한 유형의 문제에 반복적으로 대응하지 않고 근본 원인을 체계적으로 해결합니다.

  • 운영 위험 감소 - 팀이 반복적인 소방에서 벗어나 혁신과 전략적 개선에 집중할 수 있습니다.

  • 시스템 복원력 개선 - 실제 인시던트 데이터를 기반으로 인프라, 관찰성 및 배포 프로세스 강화

  • 과거 패턴에서 알아보기 - 과거 인시던트의 인사이트를 활용하여 가장 큰 영향을 미치는 목표 개선

에이전트 요약

웹 앱의 운영 백로그 페이지에 있는 에이전트 요약은 최근 인시던트의 마지막 평가 결과에 대한 설명을 제공합니다. 요약에서는 분석된 인시던트 조사 수, 과거 인시던트와 유사한 인시던트, 새로운 정보로 생성되거나 업데이트된 권장 사항을 설명합니다.

요약은 에이전트가 가장 최근 평가 중에 발견한 내용을 빠르게 이해하는 데 도움이 되며 운영 태세에 가장 큰 영향을 미칠 수 있는 가장 주목할 만한 권장 사항을 강조합니다.

평가 제어

AWS DevOps 에이전트가 인시던트를 평가하고 권장 사항을 생성하는 시기를 제어할 수 있습니다.

  • 수동으로 평가 실행 - Ops 백로그 페이지에서 지금 실행 버튼을 클릭하여 평가를 즉시 시작합니다. 이는 최근 조사에서 권장 개선 사항을 신속하게 처리해야 하는 경우에 유용합니다.

  • 활성 평가 중지 - 운영 백로그 페이지에서 평가 중지 버튼을 클릭하여 현재 진행 중인 평가를 중지합니다.

권장 사항 관리

AWS DevOps Agent는 Ops 백로그 페이지에서 권장 사항을 검토하고 관리할 수 있는 권장 사항을 제공합니다.

  • 권장 사항 세부 정보 보기 - 권장 사항을 클릭하여 권장 사항 세부 정보 페이지를 엽니다. 권장 사항에 영향을 준 인시던트, 예상되는 영향 및 다음 단계를 포함하여 제안된 개선 사항에 대한 자세한 정보를 볼 수 있습니다. 코드 변경에 대한 권장 사항의 경우 구현을 위해 코딩 에이전트에 전달할 수 있는 에이전트 지원 사양을 볼 수도 있습니다.

  • 유지 - 추적을 위해 백로그에 권장 사항을 유지하려면 '보관'을 클릭합니다. 이를 통해 구현하려는 개선 사항을 모니터링하고 진행 상황을 추적할 수 있습니다.

  • 폐기 - 'Discard'를 클릭하여 백로그에서 권장 사항을 제거합니다. 권장 사항을 삭제하면 요구 사항을 충족하지 않는 이유에 대한 자연어 설명을 제공할 수 있습니다. 에이전트는이 피드백을 통해 학습하고 이를 사용하여 향후 권장 사항을 알려 시간이 지남에 따라 운영 우선순위 및 요구 사항에 더 부합하도록 합니다.

  • 구현됨 - '구현됨'을 클릭하여 권장 사항을 완료됨으로 표시합니다. 이를 통해 적용된 개선 사항을 추적하고 에이전트가 시간 경과에 따른 권장 사항의 효과를 측정할 수 있습니다.

  • 자동 제거 - 유지 또는 구현으로 표시되지 않은 권장 사항은 권장 사항을 구현하여 새 인시던트가 방지되지 않은 경우 약 6주 후에 제거할 수 있습니다. 이렇게 하면 운영 백로그 페이지가 운영 문제에 가장 관련성이 높은 개선 사항에 초점을 맞출 수 있습니다.

  • 권장 사항 업데이트 - 기존 권장 사항은 권장 사항으로 인해 방지되었을 새 인시던트가 발견되면 업데이트됩니다. 업데이트는 권장 사항의 우선 순위를 변경하거나 새로운 인사이트를 기반으로 권장 사항을 구체화할 수 있습니다.

에이전트 지원 사양

코드 또는 구성 변경과 관련된 권장 사항의 경우 AWS DevOps 에이전트는 에이전트 지원 사양을 생성할 수 있습니다. 이 사양은 구현을 위해 코딩 에이전트에 직접 전달할 수 있는 구조화된 문서를 제공합니다.

사양에는 다음이 포함됩니다.

  • 문제 설명 - 문제 및 문제의 근본 원인 요약

  • 솔루션 요약 - 권장 접근 방식에 대한 개략적인 설명

  • 대상 리포지토리 - 변경해야 하는 특정 리포지토리

  • 코드 변경 - 특정 파일 경로 및 구현 고려 사항과 함께 변경해야 하는 사항 및 이유에 대한 자세한 설명

  • 테스트 요구 사항 - 테스트해야 하는 시나리오

  • 구현 계획 - 변경 사항을 구현하기 위한 단계별 접근 방식

에이전트 지원 사양은 코딩 에이전트가 엔지니어와 광범위한 back-and-forth을 가속화합니다.

권장 사항 구현

선제적 인시던트 예방 권장 사항의 가치를 극대화하려면 다음과 같은 조치를 취하는 방법을 고려하세요.

  • 에이전트 지원 사양 사용 - 코드 변경이 있는 권장 사항의 경우 생성된 사양을 사용하여 코딩 에이전트에 전달하거나 수동 구현을 위한 자세한 가이드로 사용하여 구현을 가속화합니다.

  • 티켓 백로그에 권장 사항 추가 - 팀의 티켓팅 시스템 또는 프로젝트 관리 도구에 권장 사항을 복사하여 다른 엔지니어링 작업과 함께 우선 순위를 지정합니다.

  • 영향을 기반으로 권장 사항 우선 순위 지정 - 가장 빈번하거나 심각한 인시던트 유형 또는 중요한 시스템에 영향을 미치는 권장 사항에 먼저 집중합니다.

  • 구현 진행 상황 추적 - 구현된 권장 사항을 모니터링하고 시간이 지남에 따라 유사한 인시던트가 감소하는지 관찰하여 효과를 측정합니다.

  • 개발 팀과 조정 - 영향을 받는 시스템을 소유한 적절한 팀과 권장 사항을 공유하여 개선 사항을 구현하는 데 필요한 컨텍스트와 리소스를 확보합니다.