

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 배포의 자동 롤백 모니터링
<a name="monitoring-deployments"></a>

배포 중에 Amazon CloudWatch 경보를 기반으로 AWS AppConfig [배포 전략](https://docs.aws.amazon.com/appconfig/latest/userguide/appconfig-creating-deployment-strategy.html)과 자동 롤백의 조합을 사용하여 잘못된 구성 데이터로 인해 애플리케이션에서 오류가 발생하는 상황을 완화할 수 있습니다. 구성이 완료되면 배포 중에 하나 이상의 CloudWatch 경보가 `ALARM` 또는 `INSUFFICIENT_DATA`상태로 전환되면는 구성 데이터를 이전 버전으로 AWS AppConfig 자동 롤백하여 애플리케이션 중단 또는 오류를 방지합니다.

**참고**  
연결된 CloudWatch 경보에서 작업이 비활성화된 경우 배포가 자동으로 롤백되지 않습니다.  
[DisableAlarmActions](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_DisableAlarmActions.html) 및 [EnableAlarmActions](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_EnableAlarmActions.html) API 작업 또는 AWS CLI의 [disable-alarm-actions](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/disable-alarm-actions.html) 및 [enable-alarm-actions](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/enable-alarm-actions.html) 명령을 사용하여 경보를 사용 설정 및 사용 중지할 수 있습니다.

배포가 진행 중인 동안 [StopDeployment](https://docs.aws.amazon.com/appconfig/2019-10-09/APIReference/API_StopDeployment.html) API 작업을 직접적으로 호출하여 구성을 롤백할 수도 있습니다.

**중요**  
성공적으로 완료된 배포의 경우는 [StopDeployment](https://docs.aws.amazon.com/appconfig/2019-10-09/APIReference/API_StopDeployment.html) API 작업과 함께 `AllowRevert` 파라미터를 사용하여 구성 데이터를 이전 버전으로 되돌릴 AWS AppConfig 수도 있습니다. 일부 고객의 경우, 배포에 성공한 후 이전 구성으로 되돌리면 배포 전과 동일한 데이터가 보장됩니다. 되돌리기 작업은 또한 경보 모니터를 무시하므로, 애플리케이션 긴급 상황에서 롤포워드가 진행되지 않을 수 있습니다. 자세한 내용은 [구성 되돌리기](appconfig-deploying-reverting.md) 단원을 참조하십시오.

자동 롤백을 구성하려면 AWS AppConfig 환경을 생성 또는 편집할 때 **CloudWatch 경보** 필드에 하나 이상의 CloudWatch 지표의 Amazon 리소스 이름(ARN)을 지정합니다. 자세한 내용은 [에서 애플리케이션을 위한 환경 생성 AWS AppConfig](appconfig-creating-environment.md) 단원을 참조하십시오.

**참고**  
서드 파티 모니터링 솔루션(예: Datadog)을 사용하는 경우 `AT_DEPLOYMENT_TICK` 액션 포인트에서 경보를 확인하고, 경보를 트리거한 경우 안전 가드레일 조치로 배포를 롤백하는 AWS AppConfig 확장을 생성할 수 있습니다. AWS AppConfig 확장에 대한 자세한 내용은 섹션을 참조하세요[확장을 사용하여 AWS AppConfig 워크플로 확장](working-with-appconfig-extensions.md). 사용자 지정 확장에 대한 자세한 내용은 [연습: 사용자 지정 AWS AppConfig 확장 생성](working-with-appconfig-extensions-creating-custom.md)을 참조하세요. `AT_DEPLOYMENT_TICK` 작업 지점을 사용하여 Datadog과 통합하는 AWS AppConfig 확장의 코드 샘플을 보려면 GitHub의 [aws-samples / aws-appconfig-tick-extn-for-datadog](https://github.com/aws-samples/aws-appconfig-tick-extn-for-datadog)를 참조하세요.

## 자동 롤백 모니터링을 위한 권장 지표
<a name="monitoring-deployments-metrics"></a>

모니터링하도록 선택한 지표는 애플리케이션에서 사용하는 하드웨어 및 소프트웨어에 따라 달라집니다. AWS AppConfig 고객은 종종 다음 지표를 모니터링합니다. 그룹화된 권장 지표의 전체 목록은 *Amazon CloudWatch 사용 설명서*의 [권장 경보](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html)를 AWS 서비스참조하세요.

모니터링할 지표를 결정한 후에는 CloudWatch를 사용하여 경보를 구성하세요. 자세한 내용은 [Amazon CloudWatch 경보 사용](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)을 참조하세요.


****  

| 서비스 | 지표 | 세부 정보 | 
| --- | --- | --- | 
| [Amazon API Gateway](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#ApiGateway) | 4XXError | 이 경보는 높은 비율의 클라이언트 측 오류를 감지합니다. 이는 권한 부여 또는 클라이언트 요청 매개변수에 문제가 있음을 의미할 수 있습니다. 리소스가 제거되었거나 클라이언트가 존재하지 않는 리소스를 요청하고 있음을 의미할 수도 있습니다. Amazon CloudWatch Logs를 활성화하고 4XX 오류의 원인이 될 수 있는 오류가 있는지 확인해 보세요. 또한 상세한 CloudWatch 지표를 활성화하여 리소스 및 방법별로 이 지표를 확인하고 오류의 원인을 좁히는 것도 고려해 보세요. 구성된 제한 한도를 초과하여 오류가 발생할 수도 있습니다. | 
| [Amazon API Gateway](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#ApiGateway) | 5XXError | 이 경보는 높은 비율의 서버 측 오류 감지에 도움이 됩니다. 이는 API 백엔드, 네트워크 또는 API 게이트웨이와 백엔드 API 간의 통합에 문제가 있음을 나타낼 수 있습니다. | 
| [Amazon API Gateway](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#ApiGateway) | Latency | 이 경보는 스테이지에서 높은 지연 시간을 감지합니다. `IntegrationLatency` 지표 값을 찾아 API 백엔드 지연 시간을 확인하세요. 두 지표가 대부분 일치하면 API 백엔드가 지연 시간 증가의 원인이므로 문제가 있는지 조사해야 합니다. CloudWatch Logs를 활성화하고 긴 지연 시간을 유발할 수 있는 오류가 있는지 확인하는 것도 고려해 보세요. | 
| [Amazon EC2 Auto Scaling](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#AutoScaling) | GroupInServiceCapacity | 이 경보는 그룹의 용량이 워크로드에 필요한 용량보다 낮을 경우 이를 감지하는 데 도움이 됩니다. 문제를 해결하려면 조정 활동에서 시작 실패가 있는지 확인하고 원하는 용량 구성이 올바른지 확인하세요. | 
| [Amazon EC2](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#EC2) | CPUUtilization | 이 경보는 EC2 인스턴스의 CPU 사용률을 모니터링하는 데 도움이 됩니다. 애플리케이션에 따라 지속적으로 높은 사용률 수준이 정상일 수 있습니다. 그러나 성능이 저하되고 애플리케이션이 디스크 I/O, 메모리 또는 네트워크 리소스의 제약을 받지 않는 경우 CPU 한도가 초과되면 리소스 병목 현상이나 애플리케이션 성능 문제가 발생할 수 있습니다. | 
| [Amazon ECS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#ECS) | CPUReservation | 이 경보는 ECS 클러스터의 높은 CPU 예약을 감지하는 데 도움이 됩니다. CPU 예약이 높으면 클러스터에 등록된 해당 작업에 사용할 CPU가 부족하다는 의미일 수 있습니다. | 
| [Amazon ECS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#ECS) | HTTPCode\_Target\_5XX\_Count | 이 경보는 ECS 서비스에 대한 서버 측 오류 수가 많을 경우 이를 감지하는 데 도움이 됩니다. 이는 오류가 발생하여 서버가 요청을 처리할 수 없게 되었음을 의미할 수 있습니다. | 
| [Amazon EKS와 Container Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#EKS-ContainerInsights) | node\_cpu\_utilization | 이 경보는 Amazon EKS 클러스터의 워커 노드에서 높은 CPU 사용률을 감지하는 데 도움이 됩니다. 사용률이 지속적으로 높으면 워커 노드를 CPU가 더 큰 인스턴스로 교체하거나 시스템을 수평적으로 확장해야 할 수 있습니다. | 
| [Amazon EKS와 Container Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#EKS-ContainerInsights) | node\_memory\_utilization | 이 경보는 Amazon EKS 클러스터의 워커 노드에서 높은 메모리 사용률을 감지하는 데 도움이 됩니다. 사용률이 지속적으로 높으면 포드 복제본 수를 조정하거나 애플리케이션을 최적화해야 할 수 있습니다. | 
| [Amazon EKS와 Container Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#EKS-ContainerInsights) | pod\_cpu\_utilization\_over\_pod\_limit | 이 경보는 Amazon EKS 클러스터의 포드에서 높은 CPU 사용률을 감지하는 데 도움이 됩니다. 사용률이 지속적으로 높으면 영향을 받는 포드의 CPU 한도를 늘려야 할 수 있습니다. | 
| [Amazon EKS와 Container Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#EKS-ContainerInsights) | pod\_memory\_utilization\_over\_pod\_limit | 이 경보는 Amazon EKS 클러스터의 포드에서 높은 CPU 사용률을 감지하는 데 도움이 됩니다. 사용률이 지속적으로 높으면 영향을 받는 포드의 CPU 한도를 늘려야 할 수 있습니다. | 
| [AWS Lambda](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#Lambda) | 오류 | 이 경보는 높은 오류 횟수를 감지합니다. 오류에는 코드에서 발생하는 예외와 Lambda 런타임에서 발생하는 예외가 포함됩니다. | 
| [AWS Lambda](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#Lambda) | 제한 | 이 경보는 많은 수의 스로틀링된 간접 호출 요청을 감지합니다. 스케일 업에 사용할 수 있는 동시성이 없는 경우 제한이 발생합니다. | 
| [Lambda Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#LambdaInsights) | memory\_utilization | 이 경보는 Lambda 함수의 메모리 사용률이 구성된 한도에 근접하는지 감지하는 데 사용됩니다. | 
| [Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#S3) | 4xxErrors | 이 경보를 통해 클라이언트 요청에 대한 응답으로 생성된 4xx 오류 상태 코드의 총 개수를 보고할 수 있습니다. 예를 들어 403 오류 코드는 잘못된 IAM 정책을 나타내고, 404 오류 코드는 클라이언트 애플리케이션이 제대로 작동하지 않음을 나타낼 수 있습니다. | 
| [Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Best_Practice_Recommended_Alarms_AWS_Services.html#S3) | 5xxErrors | 이 경보는 많은 수의 서버 측 오류 감지에 도움이 됩니다. 이러한 오류는 클라이언트가 요청을 했지만 서버가 완료하지 못했음을 나타냅니다. 이를 통해 애플리케이션이 S3로 인해 직면한 문제의 상관 관계를 파악할 수 있습니다. | 