Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Anwenden einer Skalierungsrichtlinie
Nachdem Sie Ihr Modell registriert und eine Skalierungsrichtlinie definiert haben, wenden Sie die Skalierungsrichtlinie auf das registrierte Modell an. In diesem Abschnitt wird gezeigt, wie Sie eine Skalierungsrichtlinie mithilfe der AWS Command Line Interface (AWS CLI) oder der Application Auto Scaling Scaling-API anwenden.
Themen
Wenden Sie eine Skalierungsrichtlinie für die Zielverfolgung an (AWS CLI)
Verwenden Sie den put-scaling-policy AWS CLI Befehl mit den folgenden Parametern, um eine Skalierungsrichtlinie auf Ihr Modell anzuwenden:
-
--policy-name– Der Name der Skalierungsrichtlinie. -
--policy-type-Stellen Sie diesen Wert aufTargetTrackingScalingein. -
--resource-id- Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpointund die eindeutige Kennung ist der Name der Variante. Beispiel,endpoint/.my-endpoint/variant/my-variant -
--service-namespace-Stellen Sie diesen Wert aufsagemakerein. -
--scalable-dimension-Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCountein. -
--target-tracking-scaling-policy-configuration— Die Konfiguration der Skalierungsrichtlinie zur Zielverfolgung, die für das Modell verwendet werden soll.
Im folgenden Beispiel wird eine benannte Skalierungsrichtlinie für die Zielverfolgung auf eine Variante mit dem Namen, die auf dem my-scaling-policymy-variant Endpunkt ausgeführt wird, angewendet. Geben Sie für die my-endpoint--target-tracking-scaling-policy-configuration Option die config.json Datei an, die Sie zuvor erstellt haben.
aws application-autoscaling put-scaling-policy \ --policy-namemy-scaling-policy\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Wenden Sie eine Skalierungsrichtlinie an (Application Auto Scaling API)
Um auf eine Variante mit der Application Auto Scaling API eine Skalierungsrichtlinie anzuwenden, verwenden Sie die Aktion Application Auto Scaling API PutScalingPolicy mit den folgenden Parametern:
-
PolicyName– Der Name der Skalierungsrichtlinie. -
ServiceNamespace-Stellen Sie diesen Wert aufsagemakerein. -
ResourceID- Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpointund die eindeutige Kennung ist der Name der Variante. Beispiel,endpoint/.my-endpoint/variant/my-variant -
ScalableDimension-Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCountein. -
PolicyType-Stellen Sie diesen Wert aufTargetTrackingScalingein. -
TargetTrackingScalingPolicyConfiguration-Die für die Variante zu verwendende Konfiguration der Skalierungsrichtlinie für die Zielverfolgung.
Im folgenden Beispiel wird eine Skalierungsrichtlinie für die Zielverfolgung auf eine Variante mit dem Namenmy-scaling-policy, die auf dem my-variant Endpunkt ausgeführt wird, angewendet. Die Richtlinienkonfiguration hält die durchschnittlichen Aufrufe pro Instanz bei 70.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }