Actualización de puntos de conexión que utilizan el escalado automático
Cuando actualiza un punto de conexión, Application Auto Scaling realiza la comprobación para ver si alguno de los modelos de ese punto de conexión es el objetivo del escalado automático. Si la actualización cambia el tipo de instancia de cualquier modelo que sea un destino para el escalado automático, se producirá un error en la actualización.
En la Consola de administración de AWS, verá un mensaje de advertencia que indica que debe anular el registro del modelo del escalado automático para poder actualizarla. Si intenta actualizar el punto de conexión llamando a la API UpdateEndpoint, se produce un error en la llamada. Antes de actualizar el punto de conexión, elimine las políticas de escalado configuradas para ese punto y anule el registro de la variante como un destino escalable llamando a la acción de API Application Auto Scaling DeregisterScalableTarget. Después de actualizar el punto de conexión, puede registrar la variante como destino escalable y asociar una política de escalado.
Existe una excepción. Si cambia el modelo de una variante que está configurada para el escalado automático, el escalado automático de Amazon SageMaker AI permite la actualización. Esto se debe a que cambiar el modelo no afecta normalmente lo suficiente al rendimiento como para cambiar el comportamiento de escalado. Si actualiza un modelo para una variante configurada para el escalado automático, asegúrese de que el cambio al modelo no afecte significativamente al rendimiento y al comportamiento del escalado automático.
Cuando actualice puntos de conexión de SageMaker AI que tengan aplicado el escalado automático, siga los pasos que se describen a continuación:
Actualización de un punto de conexión que tiene aplicado el escalado automático
-
Anule el registro del punto de enlace como destino escalable llamando a DeregisterScalableTarget.
-
Dado que el escalado automático está bloqueado mientras la operación de actualización está en curso (o si desactivó el escalado automático en el paso anterior), es posible que desee tomar la precaución adicional de aumentar el número de instancias del punto de conexión durante la actualización. Para ello, actualice el recuento de instancias para las variantes de producción alojadas en el punto de conexión llamando a UpdateEndpointWeightsAndCapacities.
-
Llame a DescribeEndpoint repetidamente hasta que el valor del campo
EndpointStatusde la respuesta seaInService. -
Llame a DescribeEndpointConfig para obtener los valores de la configuración del punto de conexión actual.
-
Cree una configuración de punto de conexión nueva llamando a CreateEndpointConfig. Para las variantes de producción en las que desea mantener el recuento o el peso de las instancias existentes, utilice el mismo nombre de variante de la respuesta de la llamada a DescribeEndpointConfig en el paso anterior. Para todos los demás valores, utilice los valores que obtuvo como respuesta cuando llamó a DescribeEndpointConfig en el paso anterior.
-
Actualice el punto de conexión llamando a UpdateEndpoint. Especifique la configuración de punto de enlace que ha creado en el paso anterior en el campo
EndpointConfig. Si desea conservar las propiedades de variante, como el recuento de instancias o el peso, establezca el valor del parámetroRetainAllVariantPropertiesenTrue. Esto especifica que las variantes de producción con el mismo nombre se actualizarán con elDesiredInstanceCountmás reciente de la respuesta de la llamada aDescribeEndpoint, independientemente de los valores del campoInitialInstanceCounten el nuevoEndpointConfig. -
(Opcional) Vuelva a activar el escalado automático llamando a RegisterScalableTarget y PutScalingPolicy.
nota
Los pasos 1 y 7 solo son necesarios si actualiza un punto de enlace con los siguientes cambios:
-
Cambio del tipo de instancia para una variante de producción que tenga configurado el escalado automático
-
Eliminación de una variante de producción con el escalado automático configurado.