本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
清除
使用佈建並行為無伺服器端點使用自動擴展之後,您應清除您建立的資源。這包括刪除擴展政策和從應用程式自動擴展取消註冊模型。清除動作確保您不再使用的資源不會產生不必要的成本。
刪除擴展政策
您可以使用 AWS 管理主控台、AWS CLI 或應用程式自動擴展 API,來刪除擴展政策。如需有關使用 AWS 管理主控台 刪除擴展政策的詳細資訊,請參閱 SageMaker AI 自動擴展文件中的 刪除擴展政策。
刪除擴展政策 (AWS CLI)
若要將擴展政策套用到您的模型,請使用 delete-scaling-policy AWS CLI 命令搭配下列參數:
-
--policy-name– 擴展政策的名稱。 -
--resource-id— 變體的資源識別符。針對這項參數,資源的類型為endpoint,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant。 -
--service-namespace– 將此值設定為sagemaker。 -
--scalable-dimension– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency。
下列的範例從名為 MyVariant 的模型中,刪除了名為 MyScalingPolicy 的擴展政策。
aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
刪除擴展政策 (應用程式自動擴展 API)
若要從模型刪除擴展政策,請使用 DeleteScalingPolicy 應用程式自動擴展 API 動作並搭配下列參數:
-
PolicyName– 擴展政策的名稱。 -
ResourceId— 變體的資源識別符。針對這項參數,資源的類型為endpoint,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant。 -
ServiceNamespace– 將此值設定為sagemaker。 -
ScalableDimension– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency。
以下範例使用應用程式自動擴展 API,從名為 MyVariant 的模型刪除名為 MyScalingPolicy 的擴展政策。
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
取消註冊模型
您可以使 用AWS 管理主控台、AWS CLI 或應用程式自動擴展 API,來取消註冊模型。
取消註冊模型 (AWS CLI)
若要取消註冊應用程式自動擴展模型,請使用 deregister-scalable-target AWS CLI; 命令並搭配下列參數:
-
--resource-id— 變體的資源識別符。針對這項參數,資源的類型為endpoint,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant。 -
--service-namespace– 將此值設定為sagemaker。 -
--scalable-dimension– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency。
以下範例可看到如何從應用程式自動擴展取消註冊名為 MyVariant 的模型。
aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
取消註冊模型 (應用程式自動擴展 API)
若要從應用程式自動擴展取消註冊模型,請使用 DeregisterScalableTarget 應用程式自動擴展 API 動作並搭配下列參數:
-
ResourceId— 變體的資源識別符。針對這項參數,資源的類型為endpoint,而唯一識別符是變體的名稱。例如endpoint/MyEndpoint/variant/MyVariant。 -
ServiceNamespace– 將此值設定為sagemaker。 -
ScalableDimension– 將此值設定為sagemaker:variant:DesiredProvisionedConcurrency。
下列範例使用應用程式自動擴展 API,以從應用程式自動擴展取消註冊名為 MyVariant 的模型。
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
取消註冊模型 (AWS 管理主控台)
若要使用 AWS 管理主控台 取消註冊模型 (生產變體):
-
在導覽窗格中,選擇 Inference (推論)。
-
選擇 Endpoints (端點) 以檢視端點清單。
-
選擇託管生產變體的無伺服器端點。畫面將顯示一個包含端點設定的頁面,其中生產變體會列在 Endpoint runtime settings (端點執行期設定)區段下方。
-
選取您要取消註冊的生產變體,然後選擇 Configure auto scaling (設定 Auto Scaling)。畫面會顯示 Configure variant automatic scaling (設定變體自動擴展) 對話框。
-
選擇取消登錄自動擴展。