Habilitar métricas mejoradas Instance-level métricas de uso Métricas de invocación a nivel de instancia y contenedor Container-level métricas de utilización Frecuencia métrica configurable Ejemplos de código: configurar métricas mejoradas

Métricas mejoradas de Amazon SageMaker AI para puntos finales de inferencia

Las métricas mejoradas proporcionan datos de monitoreo a nivel de instancia y contenedor para los puntos de conexión en tiempo real de Amazon AI. SageMaker Cuando habilitas las métricas mejoradas, las CloudWatch métricas de Amazon pueden incluir InstanceId y AcceleratorId dimensiones (la disponibilidad varía según el espacio de nombres) para una visibilidad granular por instancia, por contenedor y por GPU. ContainerId Hay métricas mejoradas disponibles para los puntos finales y los componentes de inferencia de un solo modelo. Multi-Container Los puntos finales (MCE) admiten métricas mejoradas a nivel de instancia, pero no a nivel de contenedor.

Características clave de las métricas mejoradas:

Instance-level granularidad. Las métricas de utilización e invocación incluyen una InstanceId dimensión que identifica la instancia específica que aloja el punto final. Está disponible para todos los puntos finales en tiempo real.
Container-level granularidad. En el caso de los puntos finales que utilizan componentes de inferencia, las métricas incluyen una ContainerId dimensión que identifica el contenedor específico que ejecuta el modelo. Container-level las dimensiones aparecen tanto en el espacio de AWS/SageMaker nombres (métricas de invocación) como en el espacio de /aws/sagemaker/InferenceComponents nombres (métricas de utilización).
Per-GPU granularidad. Las métricas de uso de la GPU incluyen una AcceleratorId dimensión que identifica la GPU específica de una instancia.
Frecuencia de publicación configurable. Puede configurar el intervalo de publicación métrico en 10, 30, 60, 120, 180, 240 o 300 segundos. El valor predeterminado es de 60 segundos. Este intervalo se aplica a las métricas de uso independientemente de si las métricas mejoradas están habilitadas. Con las métricas mejoradas habilitadas, también se aplica a las métricas de invocación.

Habilitar métricas mejoradas

Para habilitar las métricas mejoradas, EnableEnhancedMetrics True establézcalas en el MetricsConfigparámetro al llamar a la CreateEndpointConfigAPI.

El MetricsConfig parámetro tiene los siguientes campos:

MetricsConfig parámetros
Parámetro	Tipo	Obligatorio/a	Predeterminado	Description (Descripción)
`EnableEnhancedMetrics`	Booleano	No	`False`	Permite dimensiones métricas a nivel de instancia y de contenedor.
`MetricPublishFrequencyInSeconds`	Entero	No	`60`	El intervalo, en segundos, en el que se publican las métricas en Amazon CloudWatch. El valor predeterminado es `60`. Valores válidos: `1030`,`60`,`120`,`180`,`240`,`300`. Si `EnableEnhancedMetrics` se establece en`False`, este intervalo se aplica únicamente a las métricas de uso; las métricas de invocación se siguen publicando en el intervalo predeterminado de 60 segundos. Si se establece en`True`, este intervalo se aplica tanto a las métricas de utilización como a las de invocación.

nota

MetricsConfigse establece en el nivel de configuración del punto final. No puede configurar diferentes ajustes para los componentes de inferencia individuales en el mismo punto final.

Para habilitar las métricas mejoradas en un punto final existente, cree una nueva configuración de punto final con la MetricsConfig configuración deseada y, a continuación, llame UpdateEndpointcon el nombre de la nueva configuración de punto final. Esto desencadena un despliegue continuo blue/green o continuo. Las métricas mejoradas no aparecen hasta que se completa la implementación. El mismo proceso se aplica al cambiar la MetricsConfig configuración en un punto final ya configurado.

Al configurarMetricsConfig, ambos DescribeEndpointy DescribeEndpointConfigdevuelven MetricsConfig la respuesta.

Al habilitar las métricas mejoradas, la SageMaker IA añade dimensiones adicionales a las métricas en tres CloudWatch espacios de nombres: /aws/sagemaker/Endpoints para las métricas de utilización, para las métricas de invocación y AWS/SageMaker /aws/sagemaker/InferenceComponents para las métricas de utilización de los componentes de inferencia.

Instance-level métricas de uso

El espacio de /aws/sagemaker/Endpoints nombres incluye métricas de uso para todos los puntos finales en tiempo real, incluidos los que utilizan componentes de inferencia. Al habilitar las métricas mejoradas, las dimensiones InstanceId y AcceleratorId (solo métricas de GPU) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. SageMaker Métricas de puntos finales de IA

Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:

Dimensiones adicionales para las métricas de uso a nivel de instancia
Dimensión	Description (Descripción)
`InstanceId`	Filtra las métricas de uso de una instancia específica.
`AcceleratorId`	(Solo métricas de GPU) Filtra las métricas de uso de una GPU específica.

Métricas de invocación a nivel de instancia y contenedor

El AWS/SageMaker espacio de nombres incluye métricas de invocación. Al habilitar las métricas mejoradas, las dimensiones InstanceId y ContainerId (solo los componentes de inferencia) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. SageMaker Métricas de invocación de puntos finales de IA

Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:

Dimensiones adicionales para las métricas de invocación
Dimensión	Description (Descripción)
`InstanceId`	Filtra las métricas de invocación de una instancia específica.
`ContainerId`	(Solo componentes de inferencia) Filtra las métricas de invocación de un contenedor específico.

Container-level métricas de utilización

El espacio de /aws/sagemaker/InferenceComponents nombres incluye métricas de uso para los puntos finales que utilizan componentes de inferencia. Al habilitar las métricas mejoradas, las dimensiones InstanceIdContainerId, y AcceleratorId (solo métricas de GPU) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. SageMaker Métricas de componentes de inferencia de IA

Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:

Dimensiones adicionales para las métricas de utilización a nivel de contenedor
Dimensión	Description (Descripción)
`InstanceId`	Filtra las métricas de uso de una instancia específica.
`ContainerId`	Filtra las métricas de uso de un contenedor específico.
`AcceleratorId`	(Solo métricas de GPU) Filtra las métricas de uso de una GPU específica.

Frecuencia métrica configurable

Puede configurar el intervalo en el que se publican las métricas CloudWatch. La frecuencia predeterminada es de 60 segundos.

Valores válidos: 10, 30, 60, 120, 180, 240 o 300 segundos.

Si EnableEnhancedMetrics se establece enFalse, esta frecuencia se aplica únicamente a las métricas de uso; las métricas de invocación se siguen publicando en el intervalo predeterminado de 60 segundos. Si se establece enTrue, esta frecuencia se aplica tanto a las métricas de utilización como a las de invocación.

nota

Las métricas publicadas a intervalos inferiores a 60 segundos (alta resolución) se conservan durante 3 horas.

CloudWatch El precio estándar se aplica por métrica y combinación de dimensiones única. Las métricas mejoradas aumentan la cantidad de flujos de métricas porque cada instancia, contenedor y GPU crea combinaciones de dimensiones adicionales. Para obtener más información sobre los precios, consulta CloudWatch los precios de Amazon.

Ejemplos de código: configurar métricas mejoradas

Los siguientes ejemplos muestran cómo crear una configuración de punto final con las métricas mejoradas habilitadas y cómo verificar la configuración.

Cree una configuración de punto final con métricas mejoradas

Verifique la configuración de métricas mejorada

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Métricas en CloudWatch

Observabilidad detallada

Métricas mejoradas de Amazon SageMaker AI para puntos finales de inferencia

Habilitar métricas mejoradas

nota

Instance-level métricas de uso

Métricas de invocación a nivel de instancia y contenedor

Container-level métricas de utilización

Frecuencia métrica configurable

nota

Ejemplos de código: configurar métricas mejoradas

Cree una configuración de punto final con métricas mejoradas

ejemplo Cree una configuración de punto final con métricas mejoradas

ejemplo Cree una configuración de punto final con métricas mejoradas

Verifique la configuración de métricas mejorada

ejemplo Verifique la configuración de métricas mejorada

ejemplo Verifique la configuración de métricas mejorada