Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Bereinigen
Nachdem Sie die Verwendung von Auto Scaling für Ihren Serverless-Endpunkt mit Provisioned Concurrency abgeschlossen haben, sollten Sie die von Ihnen erstellten Ressourcen bereinigen. Dies beinhaltet das Löschen der Skalierungsrichtlinie und das Abmelden des Modells von Application Auto Scaling. Durch die Bereinigung wird sichergestellt, dass Ihnen keine unnötigen Kosten für Ressourcen entstehen, die Sie nicht mehr verwenden.
Löschen einer Skalierungsrichtlinie
Sie können eine Skalierungsrichtlinie über die AWS-Managementkonsole, die AWS CLI oder die Application-Auto-Scaling-API löschen. Weitere Informationen dazu, wie Sie mit dem AWS-Managementkonsole eine Skalierungsrichtlinie löschen können, finden Sie Löschen einer Skalierungsrichtlinie in der Dokumentation zur automatischen Skalierung von SageMaker AI.
Löschen einer Skalierungsrichtlinie (AWS CLI)
Um eine Skalierungsrichtlinie auf Ihr Modell anzuwenden, verwenden Sie den AWS CLI-Befehl delete-scaling-policy mit den folgenden Parametern:
-
--policy-name– Der Name der Skalierungsrichtlinie. -
--resource-id– Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpointund die eindeutige Kennung ist der Name der Variante. Zum Beispielendpoint/MyEndpoint/variant/MyVariant. -
--service-namespace– Legen Sie diesen Wert aufsagemakerfest. -
--scalable-dimension– Legen Sie diesen Wert aufsagemaker:variant:DesiredProvisionedConcurrencyfest.
Das folgende Beispiel löscht die Skalierungsrichtlinie namens MyScalingPolicy aus einem Modell namens MyVariant.
aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
Löschen Sie eine Skalierungsrichtlinie (Application Auto Scaling API)
Um eine Skalierungsrichtlinie für Ihr Modell zu löschen, verwenden Sie die DeleteScalingPolicy API-Aktion Application Auto Scaling mit den folgenden Parametern:
-
PolicyName– Der Name der Skalierungsrichtlinie. -
ResourceId– Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpointund die eindeutige Kennung ist der Name der Variante. Zum Beispielendpoint/MyEndpoint/variant/MyVariant. -
ServiceNamespace– Legen Sie diesen Wert aufsagemakerfest. -
ScalableDimension– Legen Sie diesen Wert aufsagemaker:variant:DesiredProvisionedConcurrencyfest.
Im folgenden Beispiel wird die Application Auto Scaling-API verwendet, um eine Skalierungsrichtlinie namens MyScalingPolicy aus einem Modell namens MyVariant zu löschen.
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
Ein Modell abmelden
Sie können die Registrierung eines Modells über die AWS-Managementkonsole, die AWS CLI oder die Application Auto Scaling Anwendungen-API abmelden.
Ein Modell deregistrieren (AWS CLI)
Um ein Modell von Application Auto Scaling abzumelden, verwenden Sie den deregister-scalable-targetAWS CLI; -Befehl mit den folgenden Parametern:
-
--resource-id– Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpointund die eindeutige Kennung ist der Name der Variante. Zum Beispielendpoint/MyEndpoint/variant/MyVariant. -
--service-namespace– Legen Sie diesen Wert aufsagemakerfest. -
--scalable-dimension– Legen Sie diesen Wert aufsagemaker:variant:DesiredProvisionedConcurrencyfest.
Das folgende Beispiel deregistriert ein Modell namens dasda von MyVariant Application Auto Scaling.
aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
Einen Model abmelden (Application Auto Scaling Anwendungen-API)
Um ein Modell von Application Auto Scaling abmelden zu lassen, verwenden Sie die DeregisterScalableTarget Application Auto Scaling Anwendungen-API-Aktion mit den folgenden Parametern:
-
ResourceId– Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpointund die eindeutige Kennung ist der Name der Variante. Zum Beispielendpoint/MyEndpoint/variant/MyVariant. -
ServiceNamespace– Legen Sie diesen Wert aufsagemakerfest. -
ScalableDimension– Legen Sie diesen Wert aufsagemaker:variant:DesiredProvisionedConcurrencyfest.
Das folgende Beispiel verwendet die Application Auto Scaling-API, um ein Modell namens MyVariant von Application Auto Scaling abzumelden.
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
Ein Modell deregistrieren (AWS-Managementkonsole)
Um ein Modell (Produktionsvariante) abzumelden mit AWS-Managementkonsole:
-
Öffnen Sie die Konsole von Amazon SageMaker AI
. -
Wählen Sie im Navigationsbereich Inferenz aus.
-
Wählen Sie Endpunkte aus, um eine Liste Ihrer Endpunkte anzuzeigen.
-
Wählen Sie den Serverless-Endpunkt aus, der die Produktionsvariante hostet. Eine Seite mit den Einstellungen des Endpunkts wird angezeigt. Die Produktionsvarianten sind im Abschnitt Endpunkt-Laufzeiteinstellungen aufgeführt.
-
Wählen Sie die Produktionsvariante aus, die Sie abmelden möchten, und wählen Sie Auto Scaling konfigurieren. Die Seite Configure variant automatic scaling (Auto Scaling von Varianten konfigurieren) wird angezeigt.
-
Wählen Sie Deregister auto scaling (Auto Scaling abmelden) aus.