翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
クリーンアップ
プロビジョニングされた同時実行によるサーバーレスエンドポイントの自動スケーリングを使用し終わったら、作成したリソースをクリーンアップする必要があります。これには、スケーリングポリシーの削除と、Application Auto Scaling からのモデルの登録解除が含まれます。クリーンアップすることで、使用していないリソースに不必要なコストが発生しなくなります。
スケーリングポリシーを削除する
AWS マネジメントコンソール、AWS CLI、または Application Auto Scaling API を使用してスケーリングポリシーを削除できます。AWS マネジメントコンソール を使用してスケーリングポリシーを削除する方法の詳細については、SageMaker AI 自動スケーリングドキュメントの「スケーリングポリシーを削除する」を参照してください。
スケーリングポリシーを削除する (AWS CLI)
スケーリングポリシーをモデルに適用するには、次のパラメータで delete-scaling-policy AWS CLI; コマンドを使用します。
-
--policy-name– スケーリングポリシーの名前。 -
--resource-id– バリアントのリソース識別子。このパラメータでは、リソースタイプはendpointで、一意の識別子はバリアントの名前です。例:endpoint/MyEndpoint/variant/MyVariant。 -
--service-namespaceこの値は に設定します。sagemaker -
--scalable-dimensionこの値は に設定します。sagemaker:variant:DesiredProvisionedConcurrency
次の例では、MyVariant という名前のモデルから MyScalingPolicy という名前のスケーリングポリシーを削除します。
aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
スケーリングポリシーを削除する (Application Auto Scaling API)
モデルにスケーリングポリシーを削除するには、次のパラメータで DeleteScalingPolicy Application Auto Scaling API アクションを使用します。
-
PolicyName– スケーリングポリシーの名前。 -
ResourceId– バリアントのリソース識別子。このパラメータでは、リソースタイプはendpointで、一意の識別子はバリアントの名前です。例:endpoint/MyEndpoint/variant/MyVariant。 -
ServiceNamespaceこの値は に設定します。sagemaker -
ScalableDimensionこの値は に設定します。sagemaker:variant:DesiredProvisionedConcurrency
次の例では、Application Auto Scaling API を使用して、MyVariant という名前のモデルから MyScalingPolicy というスケーリングポリシーを削除します。
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
モデルの登録解除
AWS マネジメントコンソール、AWS CLI または Application Auto Scaling API を使用して、モデルを登録解除できます。
モデルの登録解除 (AWS CLI)
Application Auto Scaling からモデルを登録解除するには、次のパラメータで、deregister-scalable-target AWS CLI; コマンドを使用します。
-
--resource-id– バリアントのリソース識別子。このパラメータでは、リソースタイプはendpointで、一意の識別子はバリアントの名前です。例:endpoint/MyEndpoint/variant/MyVariant。 -
--service-namespaceこの値は に設定します。sagemaker -
--scalable-dimensionこの値は に設定します。sagemaker:variant:DesiredProvisionedConcurrency
次の例では、Application Auto Scaling から MyVariant という名前のモデルを登録解除します。
aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
モデルの登録解除 (Application Auto Scaling API)
Application Auto Scaling からモデルの登録を解除するには、次のパラメータを指定して DeregisterScalableTarget Application Auto Scaling API アクションを使用します。
-
ResourceId– バリアントのリソース識別子。このパラメータでは、リソースタイプはendpointで、一意の識別子はバリアントの名前です。例:endpoint/MyEndpoint/variant/MyVariant。 -
ServiceNamespaceこの値は に設定します。sagemaker -
ScalableDimensionこの値は に設定します。sagemaker:variant:DesiredProvisionedConcurrency
次の例では、Application Auto Scaling API を使用して、MyVariant という名前のモデルを Application Auto Scaling から登録解除します。
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
モデルの登録解除 (AWS マネジメントコンソール)
AWS マネジメントコンソール でモデル (本番稼働用バリアント) の登録を解除するには:
-
[ナビゲーション] タブで、[推論] を選択します。
-
[エンドポイント] を選択すると、エンドポイントのリストが表示されます。
-
本番稼働用バリアントをホストするサーバーレスエンドポイントを選択します。エンドポイントの設定を含むページが表示され、[エンドポイントのランタイム設定] セクションに本番稼働用バリアントが一覧表示されます。
-
登録を解除する本番稼働用バリアントを選択し、[自動スケーリングの設定] を選択します。[バリアントの自動スケーリングの設定] ダイアログボックスが表示されます。
-
[Auto Scaling の登録解除] を選択します。