Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Applicazione di una policy di scalabilità
Dopo la registrazione di un modello e la definizione di una policy di dimensionamento, applica la policy di dimensionamento al modello registrato. Questa sezione mostra come applicare una policy di dimensionamento utilizzando l’ AWS Command Line Interface (AWS CLI) o l’API Application Auto Scaling.
Argomenti
Applicare una policy di dimensionamento con monitoraggio delle destinazioni (AWS CLI)
Per applicare una politica di scalabilità al tuo modello, usa il put-scaling-policy AWS CLI comando con i seguenti parametri:
-
--policy-name– Il nome della policy di dimensionamento. -
--policy-type– Impostare questo valore suTargetTrackingScaling. -
--resource-id– L'identificatore di risorsa per la variante. Per questo parametro, il tipo di risorsa èendpointe l'identificatore univoco è il nome della variante. Ad esempio,endpoint/.my-endpoint/variant/my-variant -
--service-namespace– Impostare questo valore susagemaker. -
--scalable-dimension– Impostare questo valore susagemaker:variant:DesiredInstanceCount. -
--target-tracking-scaling-policy-configuration- La configurazione di una policy di dimensionamento con monitoraggio delle destinazioni da utilizzare per il modello.
Esempio
L’esempio seguente applica una policy di dimensionamento con monitoraggio delle destinazioni denominata a una variante denominata my-scaling-policy, in esecuzione sull’endpoint my-variant. Per l’opzione my-endpoint--target-tracking-scaling-policy-configuration specifica il file config.json creato in precedenza.
aws application-autoscaling put-scaling-policy \ --policy-namemy-scaling-policy\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Applica una policy di dimensionamento (API di Application Auto Scaling)
Per applicare una policy di dimensionamento a una variante con l'API Application Auto Scaling, utilizzare l'azione API Application Auto Scaling PutScalingPolicy con i parametri seguenti:
-
PolicyName– Il nome della policy di dimensionamento. -
ServiceNamespace– Impostare questo valore susagemaker. -
ResourceID– L'identificatore di risorsa per la variante. Per questo parametro, il tipo di risorsa èendpointe l'identificatore univoco è il nome della variante. Ad esempio,endpoint/.my-endpoint/variant/my-variant -
ScalableDimension– Impostare questo valore susagemaker:variant:DesiredInstanceCount. -
PolicyType– Impostare questo valore suTargetTrackingScaling. -
TargetTrackingScalingPolicyConfiguration– La configurazione di una policy di dimensionamento di monitoraggio dei target da utilizzare per la variante.
Esempio
L’esempio seguente applica una policy di dimensionamento con monitoraggio delle destinazioni denominata a una variante denominata my-scaling-policy, in esecuzione sull’endpoint my-variant. La configurazione della policy mantiene la media delle invocazioni per istanza a 70.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }