View a markdown version of this page

清除 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

清除

使用佈建並行為無伺服器端點使用自動擴展之後,您應清除您建立的資源。這包括刪除擴展政策和從應用程式自動擴展取消註冊模型。清除動作確保您不再使用的資源不會產生不必要的成本。

刪除擴展政策

您可以使用 AWS 管理主控台、AWS CLI 或應用程式自動擴展 API,來刪除擴展政策。如需有關使用 AWS 管理主控台 刪除擴展政策的詳細資訊,請參閱 SageMaker AI 自動擴展文件中的 刪除擴展政策

刪除擴展政策 (AWS CLI)

若要將擴展政策套用到您的模型,請使用 delete-scaling-policy AWS CLI 命令搭配下列參數:

  • --policy-name – 擴展政策的名稱。

  • --resource-id — 變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如 endpoint/MyEndpoint/variant/MyVariant

  • --service-namespace – 將此值設定為 sagemaker

  • --scalable-dimension – 將此值設定為 sagemaker:variant:DesiredProvisionedConcurrency

下列的範例從名為 MyVariant 的模型中,刪除了名為 MyScalingPolicy 的擴展政策。

aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

刪除擴展政策 (應用程式自動擴展 API)

若要從模型刪除擴展政策,請使用 DeleteScalingPolicy 應用程式自動擴展 API 動作並搭配下列參數:

  • PolicyName – 擴展政策的名稱。

  • ResourceId — 變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如 endpoint/MyEndpoint/variant/MyVariant

  • ServiceNamespace – 將此值設定為 sagemaker

  • ScalableDimension – 將此值設定為 sagemaker:variant:DesiredProvisionedConcurrency

以下範例使用應用程式自動擴展 API,從名為 MyVariant 的模型刪除名為 MyScalingPolicy 的擴展政策。

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

取消註冊模型

您可以使 用AWS 管理主控台、AWS CLI 或應用程式自動擴展 API,來取消註冊模型。

取消註冊模型 (AWS CLI)

若要取消註冊應用程式自動擴展模型,請使用 deregister-scalable-target AWS CLI; 命令並搭配下列參數:

  • --resource-id — 變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如 endpoint/MyEndpoint/variant/MyVariant

  • --service-namespace – 將此值設定為 sagemaker

  • --scalable-dimension – 將此值設定為 sagemaker:variant:DesiredProvisionedConcurrency

以下範例可看到如何從應用程式自動擴展取消註冊名為 MyVariant 的模型。

aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

取消註冊模型 (應用程式自動擴展 API)

若要從應用程式自動擴展取消註冊模型,請使用 DeregisterScalableTarget 應用程式自動擴展 API 動作並搭配下列參數:

  • ResourceId — 變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如 endpoint/MyEndpoint/variant/MyVariant

  • ServiceNamespace – 將此值設定為 sagemaker

  • ScalableDimension – 將此值設定為 sagemaker:variant:DesiredProvisionedConcurrency

下列範例使用應用程式自動擴展 API,以從應用程式自動擴展取消註冊名為 MyVariant 的模型。

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

取消註冊模型 (AWS 管理主控台)

若要使用 AWS 管理主控台 取消註冊模型 (生產變體):

  1. 開啟 Amazon SageMaker AI 主控台

  2. 在導覽窗格中,選擇 Inference (推論)。

  3. 選擇 Endpoints (端點) 以檢視端點清單。

  4. 選擇託管生產變體的無伺服器端點。畫面將顯示一個包含端點設定的頁面,其中生產變體會列在 Endpoint runtime settings (端點執行期設定)區段下方。

  5. 選取您要取消註冊的生產變體,然後選擇 Configure auto scaling (設定 Auto Scaling)。畫面會顯示 Configure variant automatic scaling (設定變體自動擴展) 對話框。

  6. 選擇取消登錄自動擴展