Eliminazione - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Eliminazione

Dopo aver finito di utilizzare il dimensionamento automatico per l’endpoint serverless con Provisioned Concurrency, è necessario ripulire le risorse create. Questo comporta l’eliminazione della policy di dimensionamento e l’annullamento della registrazione del modello da Application Auto Scaling. La pulizia garantisce di non incorrere in costi inutili per le risorse che non utilizzi più.

Eliminazione di una policy di dimensionamento

È possibile eliminare una policy di dimensionamento con la Console di gestione AWS, AWS CLI o l'API di Application Auto Scaling. Per ulteriori informazioni sull’eliminazione di una policy di dimensionamento con la Console di gestione AWS, consulta Eliminazione di una policy di dimensionamento nella documentazione sul dimensionamento automatico di SageMaker AI.

Eliminazione una policy di dimensionamento (AWS CLI)

Per applicare una policy di dimensionamento al tuo modello, utilizza il comando delete-scaling-policy dell’AWS CLI con i parametri seguenti:

  • --policy-name – Il nome della policy di dimensionamento.

  • --resource-id – L'identificatore di risorse per la variante. Per questo parametro, il tipo di risorsa è endpoint e l'identificatore univoco è il nome della variante. Ad esempio, endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace – Impostare questo valore su sagemaker.

  • --scalable-dimension – Impostare questo valore su sagemaker:variant:DesiredProvisionedConcurrency.

L'esempio seguente elimina una policy di dimensionamento denominata MyScalingPolicy da un modello denominato MyVariant.

aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Eliminazione di una policy di dimensionamento (API Application Auto Scaling)

Per eliminare una policy di dimensionamento al modello, utilizzare l'azione dell’API DeleteScalingPolicy Application Auto Scaling con i parametri seguenti:

  • PolicyName – Il nome della policy di dimensionamento.

  • ResourceId – L'identificatore di risorse per la variante. Per questo parametro, il tipo di risorsa è endpoint e l'identificatore univoco è il nome della variante. Ad esempio, endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace – Impostare questo valore su sagemaker.

  • ScalableDimension – Impostare questo valore su sagemaker:variant:DesiredProvisionedConcurrency.

Nell'esempio seguente viene utilizzata l'API Application Auto Scaling per eliminare una policy di dimensionamento denominata MyScalingPolicy da un modello denominato MyVariant.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Annullamento della registrazione di un modello

È possibile annullare la registrazione di un modello con la Console di gestione AWS, AWS CLI o l'API di Application Auto Scaling.

Annullamento della registrazione di un modello (AWS CLI)

Per annullare la registrazione di un modello da Application Auto Scaling, utilizza il comando deregister-scalable-target AWS CLI; con i parametri seguenti:

  • --resource-id – L'identificatore di risorse per la variante. Per questo parametro, il tipo di risorsa è endpoint e l'identificatore univoco è il nome della variante. Ad esempio, endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace – Impostare questo valore su sagemaker.

  • --scalable-dimension – Impostare questo valore su sagemaker:variant:DesiredProvisionedConcurrency.

Nell'esempio seguente viene annullata la registrazione di un modello denominato MyVariant da Application Auto Scaling.

aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Annullamento della registrazione di un modello (API di dimensionamento automatico dell’applicazione)

Per annullare la registrazione di un modello da DeregisterScalableTarget Application Auto Scaling, usa l'azione dell’API Application Auto Scaling con i seguenti parametri:

  • ResourceId – L'identificatore di risorse per la variante. Per questo parametro, il tipo di risorsa è endpoint e l'identificatore univoco è il nome della variante. Ad esempio, endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace – Impostare questo valore su sagemaker.

  • ScalableDimension – Impostare questo valore su sagemaker:variant:DesiredProvisionedConcurrency.

L'esempio seguente utilizza l'API Application Auto Scaling per annullare la registrazione di un modello denominato MyVariant da Application Auto Scaling.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Annullamento della registrazione di un modello (Console di gestione AWS)

Per annullare la registrazione di un modello (variante di produzione) con la Console di gestione AWS:

  1. Apri la console di Amazon SageMaker AI.

  2. Nel pannello di navigazione, scegli Inferenza.

  3. Scegli Endpoint per visualizzare un elenco degli endpoint.

  4. Scegli l'endpoint serverless che ospita la variante di produzione. Apparirà una pagina con le impostazioni dell'endpoint, con le varianti di produzione elencate nella sezione Impostazioni di runtime dell'endpoint.

  5. Seleziona la variante di produzione per cui desideri annullare la registrazione e scegli Configurazione di Auto Scaling. Viene visualizzata la pagina Configura il dimensionamento automatico della variante.

  6. Selezionare Annulla registrazione del dimensionamento automatico.