翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
モデルの登録
モデルにスケーリングポリシーを追加する前に、まずモデルを自動スケーリングに登録し、モデルのスケーリング制限を定義する必要があります。
次の手順では、 AWS Command Line Interface () または Application Auto Scaling API を使用して自動スケーリング用のモデル (本番稼働用バリアントAWS CLI) を登録する方法について説明します。
モデルの登録 (AWS CLI)
本番稼働用バリアントを登録するには、register-scalable-target コマンドを次のパラメータとともに使用します。
-
--service-namespace- この値はsagemakerに設定します。 -
--resource-id- モデルのリソース識別子 (具体的には本番稼働用バリアント)。このパラメータでは、リソースタイプはendpointで、一意の識別子は本番稼働用バリアントの名前です。例えば、endpoint/。my-endpoint/variant/my-variant -
--scalable-dimension- この値はsagemaker:variant:DesiredInstanceCountに設定します。 -
--min-capacity- インスタンスの最小数。この値は 1 以上、およびmax-capacityに指定された値以下である必要があります。 -
--max-capacity- インスタンスの最大数。この値は 1 以上、およびmin-capacityに指定された値以上である必要があります。
次の例では、 エンドポイントで実行されている my-endpoint という名前のバリアントを登録して、1 ~ 8 個のインスタンスを持つように動的にスケーリングする方法を示します。my-variant
aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant\ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity1\ --max-capacity8
モデルの登録 (Application Auto Scaling API)
Application Auto Scaling でモデルを登録するには、次のパラメータを指定して Application Auto Scaling API アクション RegisterScalableTarget を使用します。
-
ServiceNamespace- この値はsagemakerに設定します。 -
ResourceID- 本番稼働用バリアントのリソース識別子。このパラメータでは、リソースタイプはendpointで、一意の識別子はバリアントの名前です。例:endpoint/。my-endpoint/variant/my-variant -
ScalableDimension- この値はsagemaker:variant:DesiredInstanceCountに設定します。 -
MinCapacity- インスタンスの最小数。この値は 1 以上、およびMaxCapacityに指定された値以下である必要があります。 -
MaxCapacity- インスタンスの最大数。この値は 1 以上、およびMinCapacityに指定された値以上である必要があります。
次の例では、 エンドポイントで実行されている my-endpoint という名前のバリアントを登録して、1 ~ 8 個のインスタンスを使用するように動的にスケーリングする方法を示します。my-variant
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity":1, "MaxCapacity":8}