신뢰성 요소 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

신뢰성 요소

AWS Well-Architected Framework의 신뢰성 원칙은 시스템이 수명 주기 동안 예상 운영 기간 동안 의도한 기능과 성능 수준을 얼마나 잘 유지하는지 다룹니다. 워크로드 수명 주기의 모든 단계에서 테스트 및 검증 전략을 AWS포함하여 신뢰할 수 있는 시스템을 구축하고 유지하기 위한 포괄적인 지침을 제공합니다.

WorkSpaces 애플리케이션 스트리밍 환경에이 원칙을 적용하기 위한 주요 중점 영역:

  • 플릿 관리 및 조정

  • 세션 신뢰성

  • 애플리케이션 가용성

  • 복구 절차

장애로부터 자동 복구

비즈니스 가치에 대한 KPIs 모니터링하여 운영에 영향을 미치기 전에 장애를 예측, 방지 또는 복구할 수 있는 자동화된 응답을 트리거합니다.

  • IP 서브넷 할당에서 확장 및 가용성을 고려하는지 확인합니다.

  • 중요한 CloudWatch 지표를 모니터링하여 AvailableCapacity 및와 같은 플릿 용량 지표 InUseCapacity및와 같은 스트리밍 품질 지표를 포함하여 서비스 가용성과 성능을 보장합니다StreamingSessionLatency.

  • 용량 임계값, 세션 상태 지표, 성능 저하 및 플릿 상태 변경에 대한 알림을 구성합니다.

  • 내장 WorkSpaces 애플리케이션 자동 조정 기능을 사용하여 다음을 수행할 수 있습니다.

    • 최소 및 최대 플릿 용량을 구성합니다.

    • 용량 사용률을 기반으로 조정 정책을 설정합니다.

    • 기술 지표만 정의하는 대신 사용자 경험 지표 및 비즈니스 요구 사항을 기반으로 스케일 아웃 및 스케일 인 임계값을 정의합니다.

  • WorkSpaces 애플리케이션 환경을 위한 재해 복구 환경을 구축합니다. 자세한 내용은 AWS 블로그 게시물 Amazon WorkSpaces 애플리케이션을 사용한 재해 복구 고려 사항을 참조하세요.

복구 절차 테스트

클라우드 환경을 사용하면 장애 시나리오 및 복구 절차를 자동으로 테스트할 수 있습니다. 이러한 기능을 사용하면 실제 장애가 발생하기 전에 취약성을 식별하고 수정할 수 있습니다.

  • 플릿 복구 테스트. 여러 시나리오에서 포괄적인 플릿 복구 테스트를 구현합니다.

    • 인스턴스 종료를 시뮬레이션하여 자동 조정 응답을 확인합니다.

    • 플릿 최소 용량 유지 관리를 검증합니다.

    • 인스턴스 교체 타이밍 및 사용자 리디렉션을 테스트합니다.

    • 조정 정책 효과를 검증합니다.

    • 플릿 용량 제한 및 오버플로 처리를 테스트합니다.

  • 세션 복구 테스트. 세션 복구 검증 절차를 구현합니다.

    • 연결 해제 및 다시 연결 시나리오를 테스트합니다.

    • 애플리케이션 상태 보존을 확인합니다.

    • 다양한 네트워크 중단 시나리오를 테스트합니다.

    • 세션 제한 시간 동작을 검증합니다.

    • 사용자 인증 지속성을 확인합니다.

    • 임시 스토리지 처리를 확인합니다.

가로로 확장하여 집계 워크로드 가용성 향상

워크로드를 여러 개의 작은 리소스에 분산하여 개별 장애의 영향을 최소화하고 단일 장애 지점을 제거합니다.

  • 여러 가용 영역에 플릿 인스턴스를 배포합니다.

  • 적절한 최소 플릿 용량을 구성합니다.

  • 플릿에 대한 자동 조정을 구성하고 적절한 조정 임계값을 설정합니다.

  • 플릿 전반의 용량 사용률을 모니터링합니다.

  • WorkSpaces 애플리케이션 스택을 여러 리전에 배포합니다. 자세한 내용은 AWS 블로그 게시물 Optimize user experience with latency-based routing for Amazon WorkSpaces Applications를 참조하세요.

용량 추측 중지

클라우드의 자동 조정 기능을 사용하여 수요에 따라 리소스를 동적으로 조정합니다. 이렇게 하면 최적의 효율성을 유지하면서 리소스 포화를 방지할 수 있습니다.

  • CapacityUtilization, AvailableCapacity및와 같은 주요 지표를 모니터링InUseCapacity하여 용량 요구 사항을 파악합니다.

  • 다양한 기간의 플릿 사용률 추세를 추적합니다. 일일 패턴, 주간 변동, 월별 추세 및 계절적 피크를 모니터링합니다.

  • 조정 정책을 설정하고 조정 임계값을 구성합니다.

  • 현재의 할당량과 최대 사용량 간에 장애 조치를 수용할 만큼 여유가 충분히 있는지 확인합니다.

  • 아키텍처를 통해 고정된 서비스 할당량 및 제약 조건을 수용합니다.

자동화를 통한 변경 관리

자동화 코드 자체에 대한 버전 제어 변경을 포함하여 자동화를 통해 인프라 변경을 구현합니다.

  • 플릿 구성에 IaC를 사용합니다.

  • 일관된 조정 정책을 구현합니다.

  • 일관된 이미지 생성을 위해 Image Assistant CLI를 사용합니다.