PERF02-BP05 사용 가능한 리소스 탄력성 사용
클라우드는 수요 변화에 맞춰 다양한 메커니즘을 통해 리소스를 동적으로 확장 또는 축소할 수 있는 유연성을 제공합니다. 컴퓨팅 관련 지표를 함께 활용하는 경우 워크로드가 변화에 자동으로 대응하여 목표를 달성하는 데 가장 적합한 리소스 세트를 활용할 수 있습니다.
수요에 가장 적합한 리소스를 공급하면 워크로드의 비용을 최대한 낮출 수 있습니다. 하지만 그와 동시에 프로비저닝 시간과 개별 리소스 장애를 고려해 리소스를 충분히 공급할 수 있는 계획도 마련해야 합니다. 수요는 고정되어 있을 수도 있고 변경될 수도 있으므로, 관리상의 부담을 방지하고 관리 작업에서 비용이 너무 많이 발생하지 않도록 하려면 적절한 지표와 자동화 기능이 필요합니다.
AWS에서는 다양한 방식을 사용하여 수요와 공급을 일치시킬 수 있습니다. 비용 최적화 원칙 백서에서는 다음과 같은 접근 방식을 사용하여 비용을 절감하는 방법을 설명합니다.
-
수요 기반 방식
-
버퍼 기반 방식
-
시간 기반 방식
워크로드 배포에서 확장 및 축소 이벤트를 모두 처리할 수 있는지 확인해야 합니다. 축소 이벤트에 대한 테스트 시나리오를 생성하여 워크로드가 예상대로 작동하는지 확인하십시오.
일반적인 안티 패턴:
-
용량을 수동으로 늘려 경보에 대응합니다.
-
조정 이벤트 후에 다시 축소하는 대신 증가된 용량을 그대로 둡니다.
이 모범 사례 정립의 이점: 워크로드 탄력성을 구성하고 테스트하면 비용을 절감하고, 성능 벤치마크를 유지하며, 트래픽 변화에 따른 신뢰성을 높일 수 있습니다. 대부분의 비 프로덕션 인스턴스는 사용되지 않을 때 중지되어야 합니다. 미사용 인스턴스를 수동으로 종료할 수도 있지만 대규모 환경에서는 실용적이지 않습니다. 볼륨 기반 탄력성을 활용할 수도 있습니다. 탄력성을 활용하면 수요가 급증할 경우 컴퓨팅 인스턴스 수를 자동으로 늘리고 수요가 감소할 경우 용량을 줄임으로써 성능과 비용을 최적화할 수 있습니다.
이 모범 사례를 정립되지 않을 경우 노출되는 위험의 수준: 보통
구현 가이드
탄력성 활용: 탄력성은 보유한 리소스의 공급을 해당 리소스의 수요에 맞춥니다. 인스턴스, 컨테이너 및 함수를 자동 조정과 함께 사용하거나 서비스의 기능으로 사용하는 경우 탄력성 개선을 위한 메커니즘이 제공됩니다. 아키텍처에서 탄력성을 사용하여 모든 사용 규모에 대한 성능 요구 사항을 충족하기에 충분한 용량이 있는지 확인합니다. 탄력적 리소스의 확장 또는 축소에 대한 지표가 배포 중인 워크로드 유형에 대해 검증되었는지 확인합니다. 동영상 트랜스코딩 애플리케이션을 배포하는 경우 100%의 CPU 활용률이 예상되므로, 기본 지표로 사용해서는 안 됩니다. 또는 대기 중인 트랜스코딩 작업의 대기열 깊이를 기준으로 측정하여 인스턴스 유형을 조정할 수 있습니다. 워크로드 배포에서 확장 및 축소 이벤트를 모두 처리할 수 있는지 확인합니다. 워크로드 구성 요소를 안전하게 축소하는 것은 수요에 따라 리소스를 확장하는 것만큼 중요합니다. 축소 이벤트에 대한 테스트 시나리오를 생성하여 워크로드가 예상대로 작동하는지 확인하십시오.
리소스
관련 문서:
관련 동영상:
관련 예시: