Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Limpieza
Una vez que haya terminado de usar el escalado automático para el punto de conexión sin servidor con la simultaneidad aprovisionada, debe limpiar los recursos que ha creado. Esto implica eliminar la política de escalado y anular el registro del modelo en Application Auto Scaling. La limpieza garantiza que no incurra en costos innecesarios por los recursos que ya no utilice.
Eliminación de una política de escalado
Puede eliminar una política de escalado utilizando la Consola de administración de AWS, la AWS CLI o la API de Application Auto Scaling. Para obtener más información sobre cómo eliminar una política de escalado con la Consola de administración de AWS, consulte Eliminación de una política de escalado en Automatic scaling of Amazon SageMaker AI models.
Eliminación de una política de escalado (AWS CLI)
Para aplicar una política de escalado a su modelo, use el comando delete-scaling-policy de la AWS CLI con los siguientes parámetros:
-
--policy-name: el nombre de la política de escalado. -
--resource-id: el identificador de recurso para la variante. Para este parámetro, el tipo de recurso esendpointy el identificador único es el nombre de la variante. Por ejemplo,endpoint/MyEndpoint/variant/MyVariant. -
--service-namespace: establezca este valor ensagemaker. -
--scalable-dimension: establezca este valor ensagemaker:variant:DesiredProvisionedConcurrency.
En el siguiente ejemplo se elimina una política de escalado denominada MyScalingPolicy de una variante llamada MyVariant.
aws application-autoscaling delete-scaling-policy \ --policy-name MyScalingPolicy \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
Eliminación de una política de escalado (API de Application Auto Scaling)
Para eliminar una política de escalado de su modelo, use la acción de la API de Application Auto Scaling DeleteScalingPolicy con los siguientes parámetros:
-
PolicyName: el nombre de la política de escalado. -
ResourceId: el identificador de recurso para la variante. Para este parámetro, el tipo de recurso esendpointy el identificador único es el nombre de la variante. Por ejemplo,endpoint/MyEndpoint/variant/MyVariant. -
ServiceNamespace: establezca este valor ensagemaker. -
ScalableDimension: establezca este valor ensagemaker:variant:DesiredProvisionedConcurrency.
El siguiente ejemplo usa la API de Application Auto Scaling para eliminar una política de escalado denominada MyScalingPolicy de un modelo denominadoMyVariant.
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeleteScalingPolicy X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "MyScalingPolicy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
Anular el registro de un modelo
Puede anular del registro de un modelo con la Consola de administración de AWS, AWS CLI o la API de Application Auto Scaling.
Anular el registro de un modelo (AWS CLI)
Para anular el registro de un modelo de Application Auto Scaling, use el comando deregister-scalable-target de la AWS CLI con los siguientes parámetros:
-
--resource-id: el identificador de recurso para la variante. Para este parámetro, el tipo de recurso esendpointy el identificador único es el nombre de la variante. Por ejemplo,endpoint/MyEndpoint/variant/MyVariant. -
--service-namespace: establezca este valor ensagemaker. -
--scalable-dimension: establezca este valor ensagemaker:variant:DesiredProvisionedConcurrency.
El siguiente ejemplo anula del registro de un modelo denominado MyVariant de Application Auto Scaling.
aws application-autoscaling deregister-scalable-target \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredProvisionedConcurrency \ --resource-id endpoint/MyEndpoint/variant/MyVariant
Anular el registro de un modelo (API de Application Auto Scaling)
Para anular el registro de un modelo de Application Auto Scaling, use la acción de la API Application Auto Scaling DeregisterScalableTarget con los siguientes parámetros:
-
ResourceId: el identificador de recurso para la variante. Para este parámetro, el tipo de recurso esendpointy el identificador único es el nombre de la variante. Por ejemplo,endpoint/MyEndpoint/variant/MyVariant. -
ServiceNamespace: establezca este valor ensagemaker. -
ScalableDimension: establezca este valor ensagemaker:variant:DesiredProvisionedConcurrency.
El siguiente ejemplo usa la API de Application Auto Scaling para anular el registro de un modelo denominado MyVariant de Application Auto Scaling.
POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.DeregisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndpoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredProvisionedConcurrency", }
Anular el registro de un modelo (Consola de administración de AWS)
Para anular el registro de un modelo (variante de producción) con el Consola de administración de AWS:
-
Abra la consola de Amazon SageMaker AI
. -
En el panel de navegación, elija Inferencia.
-
Elija puntos de conexión para ver una lista de sus puntos de conexión.
-
Elija el punto de conexión sin servidor que aloja la variante de producción. Aparecerá una página con la configuración del punto de conexión, con las variantes de producción listadas en la sección Configuración de tiempo de ejecución de punto de conexión.
-
Seleccione la variante de producción que quiera anular del registro y elija Configurar autoescalado. Aparecerá la página Configurar escalado automático de variantes.
-
Seleccione Anular el registro de escalado automático.