View a markdown version of this page

Nettoyage - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Nettoyage

Une fois que vous avez fini d’utiliser l’autoscaling pour votre point de terminaison sans serveur avec la simultanéité provisionnée, vous devez nettoyer les ressources que vous avez créées. Cela implique de supprimer la stratégie de mise à l’échelle et de désenregistrer le modèle d’Application Autoscaling. Le nettoyage vous permet de ne pas encourir de coûts inutiles pour les ressources que vous n’utilisez plus.

Suppression d’une stratégie de mise à l’échelle

Vous pouvez supprimer une stratégie de mise à l’échelle à partir de la AWS Management Console, de l’AWS CLI ou de l’API Application Auto Scaling. Pour plus d’informations sur la suppression d’une stratégie de mise à l’échelle avec la AWS Management Console, consultez Suppression d’une stratégie de mise à l’échelle dans la documentation sur l’autoscaling de SageMaker AI.

Suppression d’une stratégie de mise à l’échelle (interface AWS CLI)

Pour appliquer une stratégie de mise à l’échelle à votre modèle, utilisez la commande delete-scaling-policy de l’AWS CLI avec les paramètres suivants :

  • --policy-name : nom de la stratégie de mise à l’échelle.

  • --resource-id : identifiant de la ressource pour la variante. Pour ce paramètre, le type de ressource est endpoint et l’identifiant unique est le nom de la variante. Par exemple endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace : définissez cette valeur sur sagemaker.

  • --scalable-dimension : définissez cette valeur sur sagemaker:variant:DesiredProvisionedConcurrency.

L’exemple suivant supprime une stratégie de mise à l’échelle nommée MyScalingPolicy du modèle nommé MyVariant.

aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Suppression d’une stratégie de mise à l’échelle (API Application Auto Scaling)

Pour supprimer une stratégie de mise à l’échelle de votre modèle, utilisez l’action DeleteScalingPolicy de l’API Application Auto Scaling avec les paramètres suivants :

  • PolicyName : nom de la stratégie de mise à l’échelle.

  • ResourceId : identifiant de la ressource pour la variante. Pour ce paramètre, le type de ressource est endpoint et l’identifiant unique est le nom de la variante. Par exemple endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace : définissez cette valeur sur sagemaker.

  • ScalableDimension : définissez cette valeur sur sagemaker:variant:DesiredProvisionedConcurrency.

L’exemple suivant utilise l’API Application Auto Scaling pour supprimer une stratégie de mise à l’échelle nommée MyScalingPolicy du modèle nommé MyVariant.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Annulation de l’enregistrement d’un modèle

Vous pouvez annuler l’enregistrement d’un modèle avec la AWS Management Console, l’AWS CLI ou l’API Application Auto Scaling.

Annulation de l’enregistrement d’un modèle (AWS CLI)

Pour annuler l’enregistrement d’un modèle d’Application Auto Scaling, utilisez la commande deregister-scalable-target de l’AWS CLI avec les paramètres suivants :

  • --resource-id : identifiant de la ressource pour la variante. Pour ce paramètre, le type de ressource est endpoint et l’identifiant unique est le nom de la variante. Par exemple endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace : définissez cette valeur sur sagemaker.

  • --scalable-dimension : définissez cette valeur sur sagemaker:variant:DesiredProvisionedConcurrency.

L’exemple suivant annule l’enregistrement d’un modèle nommé MyVariant d’Application Auto Scaling.

aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Annulation de l’enregistrement d’un modèle (API Application Auto Scaling)

Pour annuler l’enregistrement d’un modèle d’Application Auto Scaling, utilisez l’action d’API Application Auto Scaling DeregisterScalableTarget avec les paramètres suivants :

  • ResourceId : identifiant de la ressource pour la variante. Pour ce paramètre, le type de ressource est endpoint et l’identifiant unique est le nom de la variante. Par exemple endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace : définissez cette valeur sur sagemaker.

  • ScalableDimension : définissez cette valeur sur sagemaker:variant:DesiredProvisionedConcurrency.

L’exemple suivant utilise l’API Application Auto Scaling pour annuler l’enregistrement d’un modèle nommé MyVariant d’Application Auto Scaling.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Annulation de l’enregistrement d’un modèle (AWS Management Console)

Pour annuler l’enregistrement d’un modèle (variante de production) avec la AWS Management Console :

  1. Ouvrez la console Amazon SageMaker AI.

  2. Sous le panneau de navigation, choisissez Inférence.

  3. Choisissez Points de terminaison pour afficher la liste de vos points de terminaison.

  4. Choisissez le point de terminaison sans serveur hébergeant la variante de production. Une page contenant les paramètres du point de terminaison apparaîtra, avec les variantes de production répertoriées dans la section Paramètres d’exécution de point de terminaison.

  5. Sélectionnez la variante de production dont vous souhaitez annuler l’enregistrement, puis choisissez Configurer Auto Scaling. La boîte de dialogue Configurer la scalabilité automatique d’une variante s’affiche.

  6. Choisissez Annuler l’enregistrement de la scalabilité automatique.