View a markdown version of this page

부록 A ‒ 카오스 엔지니어링을 위한 목표 유형 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

부록 A ‒ 카오스 엔지니어링을 위한 목표 유형

목표 유형에 대한 다음 설명에는 Amazon 및 기타 조직이 카오스 엔지니어링 목표를 설계한 방법에 대한 실제 예제가 포함됩니다.

탄력적 아키텍처 목표

카오스 엔지니어링을 채택하기 위한 초기 동인 중 하나는 시스템 및 인프라 전반에서 단일 장애 지점(SPOF)을 식별하고 줄이는 것입니다. 목표는 중요한 시스템 및 아키텍처, 특히 새로운 서비스 또는 애플리케이션의 복원력을 검증하기 위해 설정됩니다.

탄력적 아키텍처 목표에는 서비스 종속성의 장애를 시뮬레이션하는 카오스 실험 실행이 포함됩니다. 실험은 제한 시간, 재시도, 캐싱 동작 및 회로 차단기 구성이 올바르게 작동하는지 확인합니다. 이러한 실험은 해결 문제를 발견하여 고객에게 영향을 미치는 인시던트를 방지하는 데 도움이 됩니다. 예를 들어 카오스 엔지니어링을 사용하여 Prime Video에서 복원력 있는 서비스 구축을 참조하세요.

서비스 복구 목표

서비스 복구 목표는 운영 중단 또는 인프라 장애로부터 복구하는 능력을 개선하는 데 중점을 둡니다. 예를 들어, 운영 중단 시 조직은 핵심 서비스에 대한 특정 복구 시간 목표(RTO)를 달성하는 것을 목표로 할 수 있습니다. 팀은 카오스 실험을 설계하여 대피 전략, 장애 조치 메커니즘 및 자동화된 복구 프로세스를 검증하고 최적화할 수 있습니다. 최적화는 궁극적으로 서비스 복원에 필요한 시간을 줄입니다. 예제는 AWS Lambda: Resilience under-the-hood를 참조하세요.

사용자 경험 목표

특히 트래픽이 많은 기간이나 중요한 이벤트 발생 시 일관되고 안정적인 사용자 경험을 유지하는 것이 중요합니다. 이러한 경우 특정 서비스 수준 목표(SLOs) 충족을 중심으로 목표를 설정합니다. 이 고객 중심 접근 방식을 사용하면 장애 또는 성능 저하된 조건에서도 복원력 노력이 우수한 사용자 경험을 제공하는 것과 직접 연계됩니다. 예제는 엔지니어링 복원력: Amazon Search의 카오스 엔지니어링 여정에서 얻은 교훈을 참조하세요.

지표 기반 목표

검증된 복원력 모범 사례를 채택한 서비스에 점수를 부여하여 계산된 복원력 점수와 같은 정량적 지표를 기반으로 목표를 설정할 수 있습니다. 그런 다음 특정 카오스 실험을 사용하여 복원력 점수를 결정할 수 있습니다. 이 점수는 팀이 알려진 가용성 위험을 완화하고 권장 복원력 조치를 구현하는 진행 상황을 추적할 수 있는 조치 역할을 할 수 있습니다. 그러나 이러한 점수를 신중하게 해석하고 더 광범위한 복원력 목표를 희생하면서 단일 지표를 과도하게 강조하지 않는 것이 중요합니다. 예제는 복원력 점수 이해를 참조하세요.

규정 준수 목표

금융 서비스 산업은 강력한 복원력 기능을 요구하는 엄격한 규제 요구 사항에 따라 주로 카오스 엔지니어링을 수용하는 최전선 러너로 부상했습니다. 규정에 따라 금융 기관은 중요한 시스템 및 프로세스의 취약성을 사전에 식별, 테스트 및 해결해야 합니다. 이러한 규정에는 다음이 포함됩니다.

  • 미국 연방 기관에서 발행한 운영 복원력을 강화하기 위한 사운드 프랙티스에 대한 기관 간 논문

  • 운영 복원력에 대한 유럽 중앙 은행의 지침

  • 디지털 운영 복원력법(DORA)에 대한 유럽위원회의 제안

조직이 금융 기관인 경우 포괄적인 테스트 및 검증 전략을 통해 운영 복원력을 입증하기 위한 명시적 목표를 설정하여 이러한 규정을 준수합니다. 예를 들어 London Stock Exchange Group은에서 카오스 엔지니어링 AWS 을 사용하여 복원력을 개선합니다를 참조하세요.