

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon CloudWatch 지표를 사용하여 용량 예약 사용량 모니터링
<a name="training-plan-cw-metrics"></a>

[Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 지표를 사용하여 SageMaker 훈련 계획과 관련된 용량 예약의 사용률을 모니터링할 수 있습니다. 이 기능을 사용하면 개별 플랜 수준과 계정의 모든 플랜에서 인스턴스 사용량에 대한 과거 및 실시간 지표에 모두 액세스할 수 있으므로 용량 및 비용에 대해 정보에 입각한 결정을 내릴 수 있습니다. 이러한 지표는 계정에 직접 게시되며 SageMaker 훈련 계획 서비스는 해당 지표에 액세스할 수 없습니다.

## 온보딩 고려 사항
<a name="training-plan-cw-metrics-onboarding"></a>

지표를 게시하려면 서비스 `AWSServiceRoleForSageMakerCapacityReservation` 연결 역할(SLR)이 계정에 있어야 합니다. 계정 역할에 `iam:CreateServiceLinkedRole` 권한을 추가해야 합니다. SageMaker AI는 다음에를 호출할 때 필요한 SLR을 자동으로 설정합니다`CreateTrainingPlan`. SLR이 설정되면 새 플랜 구매에 CloudWatch 지표를 사용할 수 있습니다.

IAM 정책에 다음 문을 추가해야 합니다.

```
{
    "Effect": "Allow",
    "Action": "iam:CreateServiceLinkedRole",
    "Resource": "*",
    "Condition": {
        "StringEquals": {
            "iam:AWSServiceName": "capacityreservation.sagemaker.amazonaws.com"
        }
    }
}
```

**참고**  
`Resource` 필드가 `"*"` (의 경우 필수`CreateServiceLinkedRole`)로 설정된 동안 `Condition` 블록은 SageMaker AI 용량 예약 SLR만 생성하도록이 권한을 제한합니다. 또한 어떤 이유로든 역할이 삭제되면 API 또는 콘솔을 통해 다음 `CreateTrainingPlan` 호출 시 역할이 다시 생성됩니다.

### 수동으로 서비스 연결 역할 생성
<a name="training-plan-cw-metrics-slr"></a>

다음 명령을 실행하여 SageMaker AI를 사용하여 설정하는 AWS CLI 대신를 통해 SLR을 생성할 수도 있습니다.

```
aws iam create-service-linked-role --aws-service-name capacityreservation.sagemaker.amazonaws.com
```

이 명령은 계정에 `AWSServiceRoleForSageMakerCapacityReservation` 역할을 생성합니다. 서비스 연결 역할에 대한 자세한 내용은 [서비스 연결 역할 사용](https://docs.aws.amazon.com/IAM/latest/UserGuide/using-service-linked-roles.html)을 참조하세요.

**중요**  
서비스는 SLR이 생성된 후에만 지표 게시를 시작합니다. SLR 생성 전에 구매한 플랜에는 CloudWatch의 이전 사용률 데이터가 표시되지 않습니다.

## 용량 예약 사용량 지표
<a name="training-plan-cw-metrics-usage"></a>

SageMaker AI는 `aws/sagemaker/CapacityReservations` 네임스페이스에 다음 지표를 게시합니다.


| 지표 | 설명 | 
| --- | --- | 
| UsedInstanceCount | 현재 사용 중인 인스턴스 수입니다. 단위: 수 | 
| AvailableInstanceCount | 사용 가능한 인스턴스 수입니다. 단위: 수 | 
| TotalInstanceCount | 훈련 계획의 총 인스턴스 수입니다. 단위: 수 | 
| InstanceUtilization | 현재 사용 중인 예약 용량 인스턴스의 비율입니다. 단위: 백분율 | 

## 용량 예약 지표 차원
<a name="training-plan-cw-metrics-dimensions"></a>

다음 차원을 사용하여 지표를 필터링할 수 있습니다.


| 차원 | 설명 | 
| --- | --- | 
| ReservationName | 이름을 기준으로 지표를 필터링합니다. | 
| ComponentType | SageMaker HyperPod 클러스터, 훈련 작업, 추론 엔드포인트 또는 Studio 앱과 같은 SageMaker AI 구성 요소를 기준으로 지표를 필터링합니다. | 
| AvailabilityZone | 가용 영역을 기준으로 지표를 필터링합니다. | 
| InstanceType | 인스턴스 유형별로 지표를 필터링합니다. | 
| ReservationType | 예약 유형(TrainingPlan)을 기준으로 지표를 필터링합니다. | 

## 용량 예약에 대한 Amazon CloudWatch 지표 보기
<a name="training-plan-cw-metrics-view"></a>

Amazon CloudWatch 콘솔 또는를 사용하여 용량 예약 지표를 볼 수 있습니다 AWS CLI.

**Amazon CloudWatch 콘솔을 사용하여 용량 예약 지표를 보려면**

1. [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/)에서 CloudWatch 콘솔을 엽니다.

1. 탐색 창에서 **지표**를 선택한 다음 **모든 지표**를 선택합니다.

1. `aws/sagemaker/CapacityReservations` 네임스페이스를 선택합니다.

1. 필터링할 지표 차원을 선택합니다.

1. 지표 옆의 확인란을 선택하여 그래프로 표시합니다.

를 사용하여 사용 가능한 지표를 나열하려면 다음 명령을 AWS CLI실행합니다.

```
aws cloudwatch list-metrics --namespace "aws/sagemaker/CapacityReservations"
```