

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 엔드포인트를 사용한 Auto Scaling
<a name="comprehend-autoscaling"></a>

문서 분류 엔드포인트 및 개체 인식기 엔드포인트에 프로비저닝된 추론 단위 수를 수동으로 조정하는 대신, Auto Scaling을 사용하여 용량에 맞게 엔드포인트 프로비저닝을 자동으로 설정할 수 있습니다.

Auto Scaling을 사용하여 엔드포인트에 프로비저닝된 추론 단위 수를 조정하는 방법은 두 가지입니다.
+ [대상 추적](targettracking.md): Auto Scaling을 설정하여 사용량에 따라 용량에 맞게 엔드포인트 프로비저닝을 조정합니다.
+ [예약된 크기 조정](ScheduledScaling.md): Auto Scaling을 설정하여 지정된 일정의 용량에 맞게 엔드포인트 프로비저닝을 조정합니다.

Auto Scaling은 AWS Command Line Interface ()를 통해서만 설정할 수 있습니다AWS CLI. Auto Scaling에 대한 자세한 내용은 [애플리케이션 Auto Scaling이란?](https://docs.aws.amazon.com/autoscaling/application/userguide/what-is-application-auto-scaling.html)을 참조하세요.

# 대상 추적
<a name="targettracking"></a>

대상 추적을 사용하면 사용량에 따라 용량에 맞게 엔드포인트 프로비저닝을 조정할 수 있습니다. 사용 용량이 프로비저닝된 용량의 목표 백분율 내에 있도록 추론 단위 수가 자동으로 조정됩니다. 대상 추적을 사용하여 문서 분류 엔드포인트 및 개체 인식기 엔드포인트의 일시적인 사용 급증을 수용할 수 있습니다. 자세한 내용은 [애플리케이션 Auto Scaling의 대상 추적 조정 정책](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-target-tracking.html)을 참조하세요.

**참고**  
다음은 Unix, Linux, macOS용 형식으로 지정된 예제입니다. Windows의 경우 각 줄의 끝에 있는 백슬래시(\$1) Unix 연속 문자를 캐럿(^)으로 바꿉니다.

## 대상 추적 설정
<a name="setup-target-tracking"></a>

엔드포인트에 대한 대상 추적을 설정하려면 AWS CLI 명령을 사용하여 확장 가능 대상을 등록한 다음 조정 정책을 생성합니다. 확장 가능 대상은 추론 단위를 엔드포인트 프로비저닝을 조정하는 데 사용되는 리소스로 정의하고, 조정 정책은 프로비저닝된 용량의 Auto Scaling을 제어하는 지표를 정의합니다.

**대상 추적을 설정하려면**

1. 확장 가능 대상을 등록합니다. 다음 예에서는 확장 가능 대상을 등록하여 최소 용량은 추론 단위 1개, 최대 용량은 추론 단위 2개로 엔드포인트 프로비저닝을 조정합니다.

   문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

   개체 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

1. 확장 가능 대상의 등록을 확인하려면 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling describe-scalable-targets \
       --service-namespace comprehend \
       --resource-id endpoint ARN
   ```

1. 조정 정책을 위한 대상 추적 구성을 생성하고 구성을 `config.json`이라는 파일에 저장합니다. 다음은 InferenceUtilization 지표를 70%로 유지하는 것을 대상으로 하는 문서 분류 엔드포인트에 대한 대상 추적 구성의 예입니다.

   ```
   {
     "TargetValue": 70,
     "CustomizedMetricSpecification": {
       "MetricName": "InferenceUtilization",
       "Namespace": "MyNamespace",
       "Dimensions": [
         {
           "Name": "EndpointArn",
           "Value": "arn:aws:comprehend:region:account-id:document-classifier-endpoint/name"
         }
       ],
       "Statistic": "Sum",
       "Unit": "Percent"
     }
   }
   ```

   다음은 개체 인식기 엔드포인트의 예입니다.

   ```
   {
     "TargetValue": 70,
     "CustomizedMetricSpecification": {
       "MetricName": "InferenceUtilization",
       "Namespace": "MyNamespace",
       "Dimensions": [
         {
           "Name": "EndpointArn",
           "Value": "arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name"
         }
       ],
       "Statistic": "Sum",
       "Unit": "Percent"
     }
   }
   ```

1. 조정 정책을 생성합니다. 다음 예제에서는 `config.json` 파일에 정의된 대상 추적 구성을 기반으로 조정 정책을 생성합니다.

   문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling put-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
       --policy-type TargetTrackingScaling \
       --target-tracking-scaling-policy-configuration file://config.json
   ```

   개체 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling put-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
       --policy-type TargetTrackingScaling \
       --target-tracking-scaling-policy-configuration file://config.json
   ```

## 고려 사항
<a name="considerations"></a>

Comprehend 엔드포인트에서 대상 추적을 사용할 때는 다음 고려 사항이 적용됩니다.
+ 엔드포인트 지표는 성공적인 요청에 대해서만 내보내집니다. 내부 서버 오류 또는 고객 오류로 인해 제한되거나 실패한 요청에 대해서는 지표가 표시되지 않습니다.
+ 데이터 포인트가 누락되면 백업 CloudWatch 경보 상태가 로 변경됩니다`INSUFFICIENT_DATA `. 이 경우 Application Auto Scaling은 엔드포인트를 확장할 수 없습니다.
+ 지표 수학은 이러한 제한을 해결하는 데 도움이 될 수 있습니다. 예를 들어, 지표가 보고되지 않을 때 값 0을 사용하려면가 지표`m1`인 `FILL(m1,0)` 함수를 사용합니다. 구성을 테스트하여 예상대로 작동하는지 확인하는 것이 중요합니다. 추가 옵션은 [지표 수학을 사용하여 대상 추적 정책 생성을](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-target-tracking-metric-math.html) 참조하세요.

## 대상 추적 제거
<a name="remove-target-tracking"></a>

엔드포인트에 대한 대상 추적을 제거하려면 AWS CLI 명령을 사용하여 조정 정책을 삭제한 다음 확장 가능 대상의 등록을 취소합니다.

**대상 추적을 제거하려면**

1. 조정 정책을 삭제합니다. 다음 예제에서는 지정한 조정 정책을 삭제합니다.

   문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling delete-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
   ```

   개체 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling delete-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy
   ```

1. 확장 가능 목표의 등록을 취소합니다. 다음 예제는 지정된 확장 가능 대상의 등록을 취소합니다.

   문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits
   ```

   개체 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits
   ```

# 예약된 크기 조정
<a name="ScheduledScaling"></a>

예약된 조정을 사용하여 지정된 일정의 용량에 맞게 엔드포인트 프로비저닝을 조정할 수 있습니다. 예약된 조정은 특정 시간의 사용량 급증을 수용할 수 있도록 추론 단위 수를 자동으로 조정합니다. 문서 분류 엔드포인트 및 개체 인식기 엔드포인트에 예약된 조정을 사용할 수 있습니다. 예약된 조정에 대한 자세한 내용을 알아보려면 [애플리케이션 Auto Scaling의 예약된 조정](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-scheduled-scaling.html)을 참조하세요.

**참고**  
다음은 Unix, Linux, macOS용 형식으로 지정된 예제입니다. Windows의 경우 각 줄의 끝에 있는 백슬래시(\$1) Unix 연속 문자를 캐럿(^)으로 바꿉니다.

## 예약된 조정 설정
<a name="setup-scheduled-scaling"></a>

엔드포인트에 대해 예약된 조정을 설정하려면 AWS CLI 명령을 사용하여 확장 가능 대상을 등록한 다음 예약된 작업을 생성합니다. 확장 가능 대상은 추론 단위를 엔드포인트 프로비저닝을 조정하는 데 사용되는 리소스로 정의하고, 예정된 작업은 특정 시간의 프로비저닝된 용량의 Auto Scaling을 제어합니다.

**예약된 조정을 설정하려면**

1. 확장 가능 대상을 등록합니다. 다음 예에서는 확장 가능 대상을 등록하여 최소 용량은 추론 단위 1개, 최대 용량은 추론 단위 2개로 엔드포인트 프로비저닝을 조정합니다.

   문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

   개체 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

1. 예약된 작업을 생성합니다. 다음 예제에서는 최소 2개의 추론 단위와 최대 5개의 추론 단위를 사용하여 매일 12:00(UTC)에 프로비저닝된 용량을 자동으로 조정하는 예정된 작업을 생성합니다. 시간순 표현식 및 예약된 조정에 대한 자세한 내용은 [예약 표현식](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/ScheduledEvents.html)을 참조하세요.

   문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling put-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction \
       --schedule "cron(0 12 * * ? *)" \
       --scalable-target-action MinCapacity=2,MaxCapacity=5
   ```

   개체 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling put-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction \
       --schedule "cron(0 12 * * ? *)" \
       --scalable-target-action MinCapacity=2,MaxCapacity=5
   ```

## 예약된 조정 제거
<a name="remove-scheduled-scaling"></a>

엔드포인트에 대해 예약된 조정을 제거하려면 AWS CLI 명령을 사용하여 예약된 작업을 삭제한 다음 확장 가능 대상의 등록을 취소합니다.

**예약된 조정을 제거하려면**

1. 예약된 작업을 삭제합니다. 다음 예제는 지정된 예약된 작업을 삭제합니다.

   문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling delete-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction
   ```

   개체 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling delete-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction
   ```

1. 확장 가능 목표의 등록을 취소합니다. 다음 예제는 지정된 확장 가능 대상의 등록을 취소합니다.

   문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits
   ```

   개체 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits
   ```