Applicazione di una policy di scalabilità - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Applicazione di una policy di scalabilità

Dopo la registrazione di un modello e la definizione di una policy di dimensionamento, applica la policy di dimensionamento al modello registrato. Questa sezione mostra come applicare una policy di dimensionamento utilizzando l’ AWS Command Line Interface (AWS CLI) o l’API Application Auto Scaling.

Applicare una policy di dimensionamento con monitoraggio delle destinazioni (AWS CLI)

Per applicare una politica di scalabilità al tuo modello, usa il put-scaling-policy AWS CLI comando con i seguenti parametri:

  • --policy-name – Il nome della policy di dimensionamento.

  • --policy-type – Impostare questo valore su TargetTrackingScaling.

  • --resource-id – L'identificatore di risorsa per la variante. Per questo parametro, il tipo di risorsa è endpoint e l'identificatore univoco è il nome della variante. Ad esempio, endpoint/my-endpoint/variant/my-variant.

  • --service-namespace – Impostare questo valore su sagemaker.

  • --scalable-dimension – Impostare questo valore su sagemaker:variant:DesiredInstanceCount.

  • --target-tracking-scaling-policy-configuration - La configurazione di una policy di dimensionamento con monitoraggio delle destinazioni da utilizzare per il modello.

Esempio

L’esempio seguente applica una policy di dimensionamento con monitoraggio delle destinazioni denominata my-scaling-policy a una variante denominata my-variant, in esecuzione sull’endpoint my-endpoint. Per l’opzione --target-tracking-scaling-policy-configuration specifica il file config.json creato in precedenza.

aws application-autoscaling put-scaling-policy \ --policy-name my-scaling-policy \ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json

Applica una policy di dimensionamento (API di Application Auto Scaling)

Per applicare una policy di dimensionamento a una variante con l'API Application Auto Scaling, utilizzare l'azione API Application Auto Scaling PutScalingPolicy con i parametri seguenti:

  • PolicyName – Il nome della policy di dimensionamento.

  • ServiceNamespace – Impostare questo valore su sagemaker.

  • ResourceID – L'identificatore di risorsa per la variante. Per questo parametro, il tipo di risorsa è endpoint e l'identificatore univoco è il nome della variante. Ad esempio, endpoint/my-endpoint/variant/my-variant.

  • ScalableDimension – Impostare questo valore su sagemaker:variant:DesiredInstanceCount.

  • PolicyType – Impostare questo valore su TargetTrackingScaling.

  • TargetTrackingScalingPolicyConfiguration – La configurazione di una policy di dimensionamento di monitoraggio dei target da utilizzare per la variante.

Esempio

L’esempio seguente applica una policy di dimensionamento con monitoraggio delle destinazioni denominata my-scaling-policy a una variante denominata my-variant, in esecuzione sull’endpoint my-endpoint. La configurazione della policy mantiene la media delle invocazioni per istanza a 70.

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }