

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Mise à l'échelle automatique avec les points de terminaison
<a name="comprehend-autoscaling"></a>

Au lieu d'ajuster manuellement le nombre d'unités d'inférence fournies pour vos points de terminaison de classification de documents et vos points de terminaison de reconnaissance d'entités, vous pouvez utiliser le dimensionnement automatique pour configurer automatiquement le provisionnement des points de terminaison en fonction de vos besoins en capacité. 

Il existe deux manières d'utiliser le dimensionnement automatique pour ajuster le nombre d'unités d'inférence configurées pour votre point de terminaison :
+ [Suivi des cibles](targettracking.md): configurez le dimensionnement automatique pour ajuster le provisionnement des terminaux en fonction des besoins de capacité en fonction de l'utilisation. 
+ [Mise à l’échelle planifiée](ScheduledScaling.md): configurez le dimensionnement automatique pour ajuster le provisionnement des terminaux en fonction des besoins de capacité selon un calendrier spécifié.

Vous ne pouvez définir la mise à l'échelle automatique qu'avec le AWS Command Line Interface (AWS CLI). Pour plus d'informations sur le dimensionnement automatique, voir [Qu'est-ce qu'Application Auto Scaling ?](https://docs.aws.amazon.com/autoscaling/application/userguide/what-is-application-auto-scaling.html)

# Suivi des cibles
<a name="targettracking"></a>

Grâce au suivi des cibles, vous pouvez ajuster le provisionnement des terminaux en fonction de vos besoins en matière de capacité en fonction de l'utilisation. Le nombre d'unités d'inférence s'ajuste automatiquement pour que la capacité utilisée se situe dans les limites d'un pourcentage cible de la capacité allouée. Vous pouvez utiliser le suivi des cibles pour faire face aux pics d'utilisation temporaires de vos points de terminaison de classification de documents et de vos points de terminaison de reconnaissance d'entités. Pour plus d'informations, consultez [Politiques de suivi des cibles et d'échelonnement pour Application Auto Scaling](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-target-tracking.html).

**Note**  
Les exemples suivants sont formatés pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix, à savoir la barre oblique inversée (\$1), à la fin de chaque ligne par un accent circonflexe (^).

## Configuration du suivi des cibles
<a name="setup-target-tracking"></a>

Pour configurer le suivi des cibles pour un point de terminaison, vous utilisez les commandes de la AWS CLI pour enregistrer une cible évolutive, puis créer une politique de dimensionnement. La cible évolutive définit les unités d'inférence comme la ressource utilisée pour ajuster le provisionnement des terminaux, et la politique de dimensionnement définit les métriques qui contrôlent le dimensionnement automatique de la capacité provisionnée. 

**Pour configurer le suivi des cibles**

1. Inscription d'une cible évolutive. Les exemples suivants enregistrent une cible évolutive pour ajuster le provisionnement des terminaux avec une capacité minimale d'une unité d'inférence et une capacité maximale de 2 unités d'inférence.

   Pour un point de terminaison de classification de documents, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

   Pour un point de terminaison de reconnaissance d'entités, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

1. Pour vérifier l'enregistrement de la cible évolutive, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling describe-scalable-targets \
       --service-namespace comprehend \
       --resource-id endpoint ARN
   ```

1. Créez une configuration de suivi cible pour la politique de dimensionnement et enregistrez la configuration dans un fichier appelé`config.json`. Voici un exemple de configuration de suivi cible pour un point de terminaison de classification de documents qui vise à maintenir la InferenceUtilization métrique à 70 %.

   ```
   {
     "TargetValue": 70,
     "CustomizedMetricSpecification": {
       "MetricName": "InferenceUtilization",
       "Namespace": "MyNamespace",
       "Dimensions": [
         {
           "Name": "EndpointArn",
           "Value": "arn:aws:comprehend:region:account-id:document-classifier-endpoint/name"
         }
       ],
       "Statistic": "Sum",
       "Unit": "Percent"
     }
   }
   ```

   Voici un exemple de point de terminaison de reconnaissance d'entités :

   ```
   {
     "TargetValue": 70,
     "CustomizedMetricSpecification": {
       "MetricName": "InferenceUtilization",
       "Namespace": "MyNamespace",
       "Dimensions": [
         {
           "Name": "EndpointArn",
           "Value": "arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name"
         }
       ],
       "Statistic": "Sum",
       "Unit": "Percent"
     }
   }
   ```

1. Créez une politique de dimensionnement. Les exemples suivants créent une politique de dimensionnement basée sur la configuration de suivi des cibles définie dans le `config.json` fichier. 

   Pour un point de terminaison de classification de documents, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling put-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
       --policy-type TargetTrackingScaling \
       --target-tracking-scaling-policy-configuration file://config.json
   ```

   Pour un point de terminaison de reconnaissance d'entités, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling put-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
       --policy-type TargetTrackingScaling \
       --target-tracking-scaling-policy-configuration file://config.json
   ```

## Considérations
<a name="considerations"></a>

Les considérations suivantes s'appliquent lors de l'utilisation du suivi des cibles avec les points de terminaison Comprehend :
+ Les métriques du point de terminaison ne sont émises que pour les demandes réussies. Les statistiques ne s'afficheront pas pour les demandes limitées ou qui échouent en raison d'une erreur interne du serveur ou d'une erreur du client.
+ Lorsque des points de données sont manquants, l'état de l' CloudWatch alarme de sauvegarde passe à`INSUFFICIENT_DATA `. Dans ce cas, Application Auto Scaling ne peut pas redimensionner votre terminal.
+ Les mathématiques métriques peuvent être utiles pour contourner cette limitation. Par exemple, pour utiliser une valeur de 0 lorsqu'aucune métrique n'est signalée, utilisez la `FILL(m1,0)` fonction where `m1` is the metric. Il est important de tester votre configuration pour vous assurer qu'elle fonctionne comme prévu. Voir [Création de politiques de suivi des cibles à l'aide de mathématiques métriques](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-target-tracking-metric-math.html) pour d'autres options.

## Supprimer le suivi des cibles
<a name="remove-target-tracking"></a>

Pour supprimer le suivi des cibles pour un point de terminaison, vous utilisez les commandes de la AWS CLI pour supprimer la politique de dimensionnement, puis désenregistrer la cible évolutive.

**Pour supprimer le suivi des cibles**

1. Supprimez la politique de dimensionnement. Les exemples suivants suppriment une politique de dimensionnement spécifiée.

   Pour un point de terminaison de classification de documents, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling delete-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
   ```

   Pour un point de terminaison de reconnaissance d'entités, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling delete-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy
   ```

1. Désenregistrez la cible évolutive Les exemples suivants désenregistrent une cible évolutive spécifiée.

   Pour un point de terminaison de classification de documents, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits
   ```

   Pour un point de terminaison de reconnaissance d'entités, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits
   ```

# Mise à l’échelle planifiée
<a name="ScheduledScaling"></a>

Grâce au dimensionnement planifié, vous pouvez ajuster le provisionnement des terminaux en fonction de vos besoins en capacité selon un calendrier précis. La mise à l'échelle planifiée ajuste automatiquement le nombre d'unités d'inférence en fonction des pics d'utilisation à des moments précis. Vous pouvez utiliser le dimensionnement planifié pour les points de terminaison de classification de documents et les points de terminaison de reconnaissance d'entités. Pour plus d'informations sur le dimensionnement planifié, consultez la section [Scaling programmé pour Application Auto Scaling](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-scheduled-scaling.html).

**Note**  
Les exemples suivants sont formatés pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix, à savoir la barre oblique inversée (\$1), à la fin de chaque ligne par un accent circonflexe (^).

## Configuration du dimensionnement planifié
<a name="setup-scheduled-scaling"></a>

Pour configurer le dimensionnement planifié pour un point de terminaison, vous utilisez les commandes de la AWS CLI pour enregistrer une cible évolutive, puis créer une action planifiée. La cible évolutive définit les unités d'inférence comme la ressource utilisée pour ajuster le provisionnement des terminaux, et l'action planifiée contrôle le dimensionnement automatique de la capacité allouée à des moments précis.

**Pour configurer le dimensionnement planifié**

1. Inscription d'une cible évolutive. Les exemples suivants enregistrent une cible évolutive pour ajuster le provisionnement des terminaux avec une capacité minimale d'une unité d'inférence et une capacité maximale de 2 unités d'inférence.

   Pour un point de terminaison de classification de documents, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

   Pour un point de terminaison de reconnaissance d'entités, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

1. Créez une action planifiée. Les exemples suivants créent une action planifiée pour ajuster automatiquement la capacité allouée chaque jour à 12 h 00 UTC avec un minimum de 2 unités d'inférence et un maximum de 5 unités d'inférence. Pour plus d'informations sur les expressions chronologiques et le dimensionnement planifié, consultez la section [Expressions de planification](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/ScheduledEvents.html). 

   Pour un point de terminaison de classification de documents, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling put-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction \
       --schedule "cron(0 12 * * ? *)" \
       --scalable-target-action MinCapacity=2,MaxCapacity=5
   ```

   Pour un point de terminaison de reconnaissance d'entités, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling put-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction \
       --schedule "cron(0 12 * * ? *)" \
       --scalable-target-action MinCapacity=2,MaxCapacity=5
   ```

## Suppression du dimensionnement planifié
<a name="remove-scheduled-scaling"></a>

Pour supprimer le dimensionnement planifié pour un point de terminaison, vous utilisez les commandes de la AWS CLI pour supprimer l'action planifiée, puis désenregistrer la cible évolutive.

**Pour supprimer le dimensionnement planifié**

1. Supprimez l'action planifiée. Les exemples suivants suppriment une action planifiée spécifiée.

   Pour un point de terminaison de classification de documents, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling delete-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction
   ```

   Pour un point de terminaison de reconnaissance d'entités, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling delete-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction
   ```

1. Désenregistrez la cible évolutive Les exemples suivants désenregistrent une cible évolutive spécifiée.

   Pour un point de terminaison de classification de documents, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits
   ```

   Pour un point de terminaison de reconnaissance d'entités, utilisez la commande AWS CLI suivante :

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits
   ```