本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
套用擴展政策
註冊模型並定義擴展政策後,請將擴展政策套用至已註冊的模型。本節說明如何使用 AWS Command Line Interface (AWS CLI) 或 Application Auto Scaling API 套用擴展政策。
套用目標追蹤擴展政策 (AWS CLI)
若要將擴展政策套用至模型,請使用 put-scaling-policy AWS CLI 命令搭配下列參數:
-
--policy-name—擴展政策的名稱。 -
--policy-type—將此值設定為TargetTrackingScaling。 -
--resource-id—此變體的資源識別符。針對這項參數,資源的類型為endpoint,而唯一識別符是變體的名稱。例如endpoint/。my-endpoint/variant/my-variant -
--service-namespace—將此值設定為sagemaker。 -
--scalable-dimension—將此值設定為sagemaker:variant:DesiredInstanceCount。 -
--target-tracking-scaling-policy-configuration- 要用於模型的目標追蹤擴展政策組態。
下列範例會將名為 的目標追蹤擴展政策套用至在my-scaling-policy端點上執行my-endpoint、名為 的變體。針對 my-variant--target-tracking-scaling-policy-configuration選項,指定您先前建立config.json的檔案。
aws application-autoscaling put-scaling-policy \ --policy-namemy-scaling-policy\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
套用擴展政策 (Application Auto Scaling API)
若要使用 Application Auto Scaling API 將擴展政策套用至變體,請使用 PutScalingPolicy Application Auto Scaling API 動作搭配下列參數:
-
PolicyName—擴展政策的名稱。 -
ServiceNamespace—將此值設定為sagemaker。 -
ResourceID—此變體的資源識別符。針對這項參數,資源的類型為endpoint,而唯一識別符是變體的名稱。例如endpoint/。my-endpoint/variant/my-variant -
ScalableDimension—將此值設定為sagemaker:variant:DesiredInstanceCount。 -
PolicyType—將此值設定為TargetTrackingScaling。 -
TargetTrackingScalingPolicyConfiguration—要用於變體的目標追蹤擴展政策組態。
下列範例會將名為 的目標追蹤擴展政策套用至在my-scaling-policy端點上執行my-endpoint、名為 的變體。政策組態會將每個執行個體的平均調用保持在 70。my-variant
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }