Bereinigen - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bereinigen

Nachdem Sie die Verwendung von Auto Scaling für Ihren Serverless-Endpunkt mit Provisioned Concurrency abgeschlossen haben, sollten Sie die von Ihnen erstellten Ressourcen bereinigen. Dies beinhaltet das Löschen der Skalierungsrichtlinie und das Abmelden des Modells von Application Auto Scaling. Durch die Bereinigung wird sichergestellt, dass Ihnen keine unnötigen Kosten für Ressourcen entstehen, die Sie nicht mehr verwenden.

Löschen einer Skalierungsrichtlinie

Sie können eine Skalierungsrichtlinie über die AWS-Managementkonsole, die AWS CLI oder die Application-Auto-Scaling-API löschen. Weitere Informationen dazu, wie Sie mit dem AWS-Managementkonsole eine Skalierungsrichtlinie löschen können, finden Sie Löschen einer Skalierungsrichtlinie in der Dokumentation zur automatischen Skalierung von SageMaker AI.

Löschen einer Skalierungsrichtlinie (AWS CLI)

Um eine Skalierungsrichtlinie auf Ihr Modell anzuwenden, verwenden Sie den AWS CLI-Befehl delete-scaling-policy mit den folgenden Parametern:

  • --policy-name – Der Name der Skalierungsrichtlinie.

  • --resource-id – Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Variante. Zum Beispiel endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace – Legen Sie diesen Wert auf sagemaker fest.

  • --scalable-dimension – Legen Sie diesen Wert auf sagemaker:variant:DesiredProvisionedConcurrency fest.

Das folgende Beispiel löscht die Skalierungsrichtlinie namens MyScalingPolicy aus einem Modell namens MyVariant.

aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Löschen Sie eine Skalierungsrichtlinie (Application Auto Scaling API)

Um eine Skalierungsrichtlinie für Ihr Modell zu löschen, verwenden Sie die DeleteScalingPolicy API-Aktion Application Auto Scaling mit den folgenden Parametern:

  • PolicyName – Der Name der Skalierungsrichtlinie.

  • ResourceId – Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Variante. Zum Beispiel endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace – Legen Sie diesen Wert auf sagemaker fest.

  • ScalableDimension – Legen Sie diesen Wert auf sagemaker:variant:DesiredProvisionedConcurrency fest.

Im folgenden Beispiel wird die Application Auto Scaling-API verwendet, um eine Skalierungsrichtlinie namens MyScalingPolicy aus einem Modell namens MyVariant zu löschen.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Ein Modell abmelden

Sie können die Registrierung eines Modells über die AWS-Managementkonsole, die AWS CLI oder die Application Auto Scaling Anwendungen-API abmelden.

Ein Modell deregistrieren (AWS CLI)

Um ein Modell von Application Auto Scaling abzumelden, verwenden Sie den deregister-scalable-targetAWS CLI; -Befehl mit den folgenden Parametern:

  • --resource-id – Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Variante. Zum Beispiel endpoint/MyEndpoint/variant/MyVariant.

  • --service-namespace – Legen Sie diesen Wert auf sagemaker fest.

  • --scalable-dimension – Legen Sie diesen Wert auf sagemaker:variant:DesiredProvisionedConcurrency fest.

Das folgende Beispiel deregistriert ein Modell namens dasda von MyVariant Application Auto Scaling.

aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant

Einen Model abmelden (Application Auto Scaling Anwendungen-API)

Um ein Modell von Application Auto Scaling abmelden zu lassen, verwenden Sie die DeregisterScalableTarget Application Auto Scaling Anwendungen-API-Aktion mit den folgenden Parametern:

  • ResourceId – Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Variante. Zum Beispiel endpoint/MyEndpoint/variant/MyVariant.

  • ServiceNamespace – Legen Sie diesen Wert auf sagemaker fest.

  • ScalableDimension – Legen Sie diesen Wert auf sagemaker:variant:DesiredProvisionedConcurrency fest.

Das folgende Beispiel verwendet die Application Auto Scaling-API, um ein Modell namens MyVariant von Application Auto Scaling abzumelden.

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }

Ein Modell deregistrieren (AWS-Managementkonsole)

Um ein Modell (Produktionsvariante) abzumelden mit AWS-Managementkonsole:

  1. Öffnen Sie die Konsole von Amazon SageMaker AI.

  2. Wählen Sie im Navigationsbereich Inferenz aus.

  3. Wählen Sie Endpunkte aus, um eine Liste Ihrer Endpunkte anzuzeigen.

  4. Wählen Sie den Serverless-Endpunkt aus, der die Produktionsvariante hostet. Eine Seite mit den Einstellungen des Endpunkts wird angezeigt. Die Produktionsvarianten sind im Abschnitt Endpunkt-Laufzeiteinstellungen aufgeführt.

  5. Wählen Sie die Produktionsvariante aus, die Sie abmelden möchten, und wählen Sie Auto Scaling konfigurieren. Die Seite Configure variant automatic scaling (Auto Scaling von Varianten konfigurieren) wird angezeigt.

  6. Wählen Sie Deregister auto scaling (Auto Scaling abmelden) aus.