

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 부록 A ‒ 카오스 엔지니어링을 위한 목표 유형
<a name="appendix-a"></a>

목표 유형에 대한 다음 설명에는 Amazon 및 기타 조직이 카오스 엔지니어링 목표를 설계한 방법에 대한 실제 예제가 포함됩니다.

## 탄력적 아키텍처 목표
<a name="resilient-architecture"></a>

카오스 엔지니어링을 채택하기 위한 초기 동인 중 하나는 시스템 및 인프라 전반에서 단일 장애 지점(SPOF)을 식별하고 줄이는 것입니다. 목표는 중요한 시스템 및 아키텍처, 특히 새로운 서비스 또는 애플리케이션의 복원력을 검증하기 위해 설정됩니다.

탄력적 아키텍처 목표에는 서비스 종속성의 장애를 시뮬레이션하는 카오스 실험 실행이 포함됩니다. 실험은 제한 시간, 재시도, 캐싱 동작 및 회로 차단기 구성이 올바르게 작동하는지 확인합니다. 이러한 실험은 해결 문제를 발견하여 고객에게 영향을 미치는 인시던트를 방지하는 데 도움이 됩니다. 예를 들어 [카오스 엔지니어링을 사용하여 Prime Video에서 복원력 있는 서비스 구축](https://aws.amazon.com/blogs/opensource/building-resilient-services-at-prime-video-with-chaos-engineering/)을 참조하세요.

## 서비스 복구 목표
<a name="service-recovery"></a>

서비스 복구 목표는 운영 중단 또는 인프라 장애로부터 복구하는 능력을 개선하는 데 중점을 둡니다. 예를 들어, 운영 중단 시 조직은 핵심 서비스에 대한 특정 복구 시간 목표(RTO)를 달성하는 것을 목표로 할 수 있습니다. 팀은 카오스 실험을 설계하여 대피 전략, 장애 조치 메커니즘 및 자동화된 복구 프로세스를 검증하고 최적화할 수 있습니다. 최적화는 궁극적으로 서비스 복원에 필요한 시간을 줄입니다. 예제는 [AWS Lambda: Resilience under-the-hood](https://aws.amazon.com/blogs/compute/aws-lambda-resilience-under-the-hood/)를 참조하세요.

## 사용자 경험 목표
<a name="ux"></a>

특히 트래픽이 많은 기간이나 중요한 이벤트 발생 시 일관되고 안정적인 사용자 경험을 유지하는 것이 중요합니다. 이러한 경우 특정 서비스 수준 목표(SLOs) 충족을 중심으로 목표를 설정합니다. 이 고객 중심 접근 방식을 사용하면 장애 또는 성능 저하된 조건에서도 복원력 노력이 우수한 사용자 경험을 제공하는 것과 직접 연계됩니다. 예제는 [엔지니어링 복원력: Amazon Search의 카오스 엔지니어링 여정에서 얻은 교훈을 참조하세요](https://community.aws/posts/amazon-search-chaos-engineering-journey).

## 지표 기반 목표
<a name="metrics"></a>

검증된 복원력 모범 사례를 채택한 서비스에 점수를 부여하여 계산된 복원력 점수와 같은 정량적 지표를 기반으로 목표를 설정할 수 있습니다. 그런 다음 특정 카오스 실험을 사용하여 복원력 점수를 결정할 수 있습니다. 이 점수는 팀이 알려진 가용성 위험을 완화하고 권장 복원력 조치를 구현하는 진행 상황을 추적할 수 있는 조치 역할을 할 수 있습니다. 그러나 이러한 점수를 신중하게 해석하고 더 광범위한 복원력 목표를 희생하면서 단일 지표를 과도하게 강조하지 않는 것이 중요합니다. 예제는 [복원력 점수 이해를](https://docs.aws.amazon.com/resilience-hub/latest/userguide/resil-score.html) 참조하세요.

## 규정 준수 목표
<a name="compliance"></a>

금융 서비스 산업은 강력한 복원력 기능을 요구하는 엄격한 규제 요구 사항에 따라 주로 카오스 엔지니어링을 수용하는 최전선 러너로 부상했습니다. 규정에 따라 금융 기관은 중요한 시스템 및 프로세스의 취약성을 사전에 식별, 테스트 및 해결해야 합니다. 이러한 규정에는 다음이 포함됩니다.
+ 미국 연방 기관에서 발행한 운영 복원력을 강화하기 위한 사운드 프랙티스에 대한 기관 간 논문
+ 운영 복원력에 대한 유럽 중앙 은행의 지침
+ 디지털 운영 복원력법(DORA)에 대한 유럽위원회의 제안

조직이 금융 기관인 경우 포괄적인 테스트 및 검증 전략을 통해 운영 복원력을 입증하기 위한 명시적 목표를 설정하여 이러한 규정을 준수합니다. 예를 들어 [London Stock Exchange Group은에서 카오스 엔지니어링 AWS 을 사용하여 복원력을 개선](https://aws.amazon.com/blogs/architecture/london-stock-exchange-group-uses-chaos-engineering-on-aws-to-improve-resilience/)합니다를 참조하세요.