View a markdown version of this page

Limpeza - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Limpeza

Depois de terminar de usar o ajuste de escala automático para o endpoint sem servidor com simultaneidade provisionada, você deve limpar os recursos que criou. Isso envolve excluir a política de ajuste de escala e cancelar o registro do modelo do Application Auto Scaling. A limpeza garante que você não incorra em custos desnecessários com recursos que você não está mais utilizando.

Excluir uma política de escalabilidade

Você pode excluir uma política de ajuste de escala usando o Console de gerenciamento da AWS, AWS CLI ou a API da aplicação Auto Scaling. Para ter mais informações sobre como excluir uma política de ajuste de escala com o Console de gerenciamento da AWS, consulte Excluir uma política de escalabilidade na documentação de ajuste de escala automático do SageMaker AI.

Excluir uma política de escalabilidade (AWS CLI)

Para aplicar uma política de escalabilidade ao modelo, use o comando delete-scaling-policy AWS CLI com os seguintes parâmetros:

  • --policy-name: o nome da política de ajuste de escala.

  • --resource-id: o identificador do recurso para a variante. Para esse parâmetro, o tipo de recurso é endpoint e o identificador exclusivo é o nome da variante. Por exemplo, endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace: defina este valor como sagemaker.

  • --scalable-dimension: defina este valor como sagemaker:variant:DesiredProvisionedConcurrency.

O exemplo a seguir exclui a uma política de escalabilidade MyScalingPolicy do modelo chamado MyVariant.

aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Exclua uma política de escalabilidade (API do Application Auto Scaling)

Para excluir uma política de ajuste de escala ao seu modelo, use a ação DeleteScalingPolicy da API da aplicação Auto Scaling com os seguintes parâmetros:

  • PolicyName: o nome da política de ajuste de escala.

  • ResourceId: o identificador do recurso para a variante. Para esse parâmetro, o tipo de recurso é endpoint e o identificador exclusivo é o nome da variante. Por exemplo, endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace: defina este valor como sagemaker.

  • ScalableDimension: defina este valor como sagemaker:variant:DesiredProvisionedConcurrency.

O seguinte exemplo usa a API da aplicação Auto Scaling para excluir uma política de ajuste de escala chamada MyScalingPolicy de um modelo chamado MyVariant:

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Cancelar o registro de um modelo

Você pode cancelar o registro de um modelo usando o Console de gerenciamento da AWS, AWS CLI ou a API da aplicação Auto Scaling.

Cancelar o registro de um modelo (AWS CLI)

Para cancelar o registro de um modelo da aplicação Auto Scaling, use deregister-scalable-target AWS CLI; comando com os seguintes parâmetros:

  • --resource-id: o identificador do recurso para a variante. Para esse parâmetro, o tipo de recurso é endpoint e o identificador exclusivo é o nome da variante. Por exemplo, endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace: defina este valor como sagemaker.

  • --scalable-dimension: defina este valor como sagemaker:variant:DesiredProvisionedConcurrency.

O seguinte exemplo cancela o registro de um modelo chamado MyVariant da aplicação Auto Scaling:

aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Cancelar o registro de um modelo (API da aplicação Auto Scaling)

Para cancelar o registro de um modelo da aplicação Auto Scaling, use a ação DeregisterScalableTarget da API da aplicação Auto Scaling com os seguintes parâmetros:

  • ResourceId: o identificador do recurso para a variante. Para esse parâmetro, o tipo de recurso é endpoint e o identificador exclusivo é o nome da variante. Por exemplo, endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace: defina este valor como sagemaker.

  • ScalableDimension: defina este valor como sagemaker:variant:DesiredProvisionedConcurrency.

O exemplo a seguir usa a API da aplicação Auto Scaling para cancelar o registro de um modelo chamado MyVariant da aplicação Auto Scaling.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Cancelar o registro de um modelo (Console de gerenciamento da AWS)

Para cancelar o registro de um modelo (variante de produção) com: Console de gerenciamento da AWS

  1. Abra o console do Amazon SageMaker AI.

  2. No painel de navegação, escolha Inferência.

  3. Escolha Endpoints para ver uma lista dos seus endpoints.

  4. Escolha o endpoint sem servidor que hospeda a variante de produção. Uma página com as configurações do endpoint será exibida, com as variantes de produção listadas na seção Configurações de runtime do endpoint.

  5. Selecione a variante de produção cujo registro você deseja cancelar e escolha Configurar ajuste de escala automático. A caixa de diálogo Configurar ajuste de escala automático da variante é exibida.

  6. Escolha Cancelar registro de ajuste de escala automático.