View a markdown version of this page

Fazer a limpeza. - SageMaker Inteligência Artificial da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Fazer a limpeza.

Depois de terminar de usar o ajuste de escala automático para o endpoint sem servidor com simultaneidade provisionada, você deve limpar os recursos que criou. Isso envolve excluir a política de ajuste de escala e cancelar o registro do modelo do Application Auto Scaling. A limpeza garante que você não incorra em custos desnecessários com recursos que você não está mais utilizando.

Excluir uma política de escalabilidade

Você pode excluir uma política de escalabilidade com a Console de gerenciamento da AWS, a ou a API AWS CLI Application Auto Scaling. Para obter mais informações sobre como excluir uma política de escalabilidade com o Console de gerenciamento da AWS, consulte Excluir uma política de escalabilidade a documentação do escalonamento automático de SageMaker IA.

Excluir uma política de escalabilidade (AWS CLI)

Para aplicar uma política de ajuste de escala ao modelo, use o comando delete-scaling-policy da AWS CLI com os seguintes parâmetros:

  • --policy-name: o nome da política de ajuste de escala.

  • --resource-id: o identificador do recurso para a variante. Para esse parâmetro, o tipo de recurso é endpoint e o identificador exclusivo é o nome da variante. Por exemplo, endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace: defina este valor como sagemaker.

  • --scalable-dimension: defina este valor como sagemaker:variant:DesiredProvisionedConcurrency.

O exemplo a seguir exclui a uma política de escalabilidade MyScalingPolicy do modelo chamado MyVariant.

aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Exclua uma política de escalabilidade (API do Application Auto Scaling)

Para excluir uma política de ajuste de escala ao seu modelo, use a ação DeleteScalingPolicy da API da aplicação Auto Scaling com os seguintes parâmetros:

  • PolicyName: o nome da política de ajuste de escala.

  • ResourceId: o identificador do recurso para a variante. Para esse parâmetro, o tipo de recurso é endpoint e o identificador exclusivo é o nome da variante. Por exemplo, endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace: defina este valor como sagemaker.

  • ScalableDimension: defina este valor como sagemaker:variant:DesiredProvisionedConcurrency.

O seguinte exemplo usa a API da aplicação Auto Scaling para excluir uma política de ajuste de escala chamada MyScalingPolicy de um modelo chamado MyVariant:

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Cancelar o registro de um modelo

Você pode cancelar o registro de um modelo com a API Application Auto Console de gerenciamento da AWS Scaling ou com a AWS CLI API Application Auto Scaling.

Cancele o registro de um modelo (AWS CLI)

Para cancelar o registro de um modelo da aplicação Auto Scaling, use deregister-scalable-target AWS CLI; comando com os seguintes parâmetros:

  • --resource-id: o identificador do recurso para a variante. Para esse parâmetro, o tipo de recurso é endpoint e o identificador exclusivo é o nome da variante. Por exemplo, endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace: defina este valor como sagemaker.

  • --scalable-dimension: defina este valor como sagemaker:variant:DesiredProvisionedConcurrency.

O seguinte exemplo cancela o registro de um modelo chamado MyVariant da aplicação Auto Scaling:

aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Cancelar o registro de um modelo (API da aplicação Auto Scaling)

Para cancelar o registro de um modelo da aplicação Auto Scaling, use a ação DeregisterScalableTarget da API da aplicação Auto Scaling com os seguintes parâmetros:

  • ResourceId: o identificador do recurso para a variante. Para esse parâmetro, o tipo de recurso é endpoint e o identificador exclusivo é o nome da variante. Por exemplo, endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace: defina este valor como sagemaker.

  • ScalableDimension: defina este valor como sagemaker:variant:DesiredProvisionedConcurrency.

O exemplo a seguir usa a API da aplicação Auto Scaling para cancelar o registro de um modelo chamado MyVariant da aplicação Auto Scaling.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Cancele o registro de um modelo (Console de gerenciamento da AWS)

Para cancelar o registro de um modelo (variante de produção) com: Console de gerenciamento da AWS

  1. Abra o console Amazon SageMaker AI.

  2. No painel de navegação, escolha Inferência.

  3. Escolha Endpoints para ver uma lista dos seus endpoints.

  4. Escolha o endpoint sem servidor que hospeda a variante de produção. Uma página com as configurações do endpoint será exibida, com as variantes de produção listadas na seção Configurações de runtime do endpoint.

  5. Selecione a variante de produção cujo registro você deseja cancelar e escolha Configurar ajuste de escala automático. A caixa de diálogo Configurar ajuste de escala automático da variante é exibida.

  6. Escolha Cancelar registro de ajuste de escala automático.