Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Métricas mejoradas de Amazon SageMaker AI para puntos finales de inferencia
Las métricas mejoradas proporcionan datos de monitoreo a nivel de instancia y contenedor para los puntos de conexión en tiempo real de Amazon AI. SageMaker Cuando habilitas las métricas mejoradas, las CloudWatch métricas de Amazon pueden incluir InstanceId y AcceleratorId dimensiones (la disponibilidad varía según el espacio de nombres) para una visibilidad granular por instancia, por contenedor y por GPU. ContainerId Hay métricas mejoradas disponibles para los puntos finales y los componentes de inferencia de un solo modelo. Multi-Container Los puntos finales (MCE) admiten métricas mejoradas a nivel de instancia, pero no a nivel de contenedor.
Características clave de las métricas mejoradas:
-
Instance-level granularidad. Las métricas de utilización e invocación incluyen una
InstanceIddimensión que identifica la instancia específica que aloja el punto final. Está disponible para todos los puntos finales en tiempo real. -
Container-level granularidad. En el caso de los puntos finales que utilizan componentes de inferencia, las métricas incluyen una
ContainerIddimensión que identifica el contenedor específico que ejecuta el modelo. Container-level las dimensiones aparecen tanto en el espacio deAWS/SageMakernombres (métricas de invocación) como en el espacio de/aws/sagemaker/InferenceComponentsnombres (métricas de utilización). -
Per-GPU granularidad. Las métricas de uso de la GPU incluyen una
AcceleratorIddimensión que identifica la GPU específica de una instancia. -
Frecuencia de publicación configurable. Puede configurar el intervalo de publicación métrico en 10, 30, 60, 120, 180, 240 o 300 segundos. El valor predeterminado es de 60 segundos. Este intervalo se aplica a las métricas de uso independientemente de si las métricas mejoradas están habilitadas. Con las métricas mejoradas habilitadas, también se aplica a las métricas de invocación.
Habilitar métricas mejoradas
Para habilitar las métricas mejoradas, EnableEnhancedMetrics True establézcalas en el MetricsConfigparámetro al llamar a la CreateEndpointConfigAPI.
El MetricsConfig parámetro tiene los siguientes campos:
| Parámetro | Tipo | Obligatorio/a | Predeterminado | Description (Descripción) |
|---|---|---|---|---|
EnableEnhancedMetrics |
Booleano | No | False |
Permite dimensiones métricas a nivel de instancia y de contenedor. |
MetricPublishFrequencyInSeconds |
Entero | No | 60 |
El intervalo, en segundos, en el que se publican las métricas en Amazon CloudWatch. El valor predeterminado es |
nota
MetricsConfigse establece en el nivel de configuración del punto final. No puede configurar diferentes ajustes para los componentes de inferencia individuales en el mismo punto final.
Para habilitar las métricas mejoradas en un punto final existente, cree una nueva configuración de punto final con la MetricsConfig configuración deseada y, a continuación, llame UpdateEndpointcon el nombre de la nueva configuración de punto final. Esto desencadena un despliegue continuo blue/green o continuo. Las métricas mejoradas no aparecen hasta que se completa la implementación. El mismo proceso se aplica al cambiar la MetricsConfig configuración en un punto final ya configurado.
Al configurarMetricsConfig, ambos DescribeEndpointy DescribeEndpointConfigdevuelven MetricsConfig la respuesta.
Al habilitar las métricas mejoradas, la SageMaker IA añade dimensiones adicionales a las métricas en tres CloudWatch espacios de nombres: /aws/sagemaker/Endpoints para las métricas de utilización, para las métricas de invocación y AWS/SageMaker /aws/sagemaker/InferenceComponents para las métricas de utilización de los componentes de inferencia.
Instance-level métricas de uso
El espacio de /aws/sagemaker/Endpoints nombres incluye métricas de uso para todos los puntos finales en tiempo real, incluidos los que utilizan componentes de inferencia. Al habilitar las métricas mejoradas, las dimensiones InstanceId y AcceleratorId (solo métricas de GPU) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. SageMaker Métricas de puntos finales de IA
Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:
| Dimensión | Description (Descripción) |
|---|---|
InstanceId |
Filtra las métricas de uso de una instancia específica. |
AcceleratorId |
(Solo métricas de GPU) Filtra las métricas de uso de una GPU específica. |
Métricas de invocación a nivel de instancia y contenedor
El AWS/SageMaker espacio de nombres incluye métricas de invocación. Al habilitar las métricas mejoradas, las dimensiones InstanceId y ContainerId (solo los componentes de inferencia) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. SageMaker Métricas de invocación de puntos finales de IA
Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:
| Dimensión | Description (Descripción) |
|---|---|
InstanceId |
Filtra las métricas de invocación de una instancia específica. |
ContainerId |
(Solo componentes de inferencia) Filtra las métricas de invocación de un contenedor específico. |
Container-level métricas de utilización
El espacio de /aws/sagemaker/InferenceComponents nombres incluye métricas de uso para los puntos finales que utilizan componentes de inferencia. Al habilitar las métricas mejoradas, las dimensiones InstanceIdContainerId, y AcceleratorId (solo métricas de GPU) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. SageMaker Métricas de componentes de inferencia de IA
Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:
| Dimensión | Description (Descripción) |
|---|---|
InstanceId |
Filtra las métricas de uso de una instancia específica. |
ContainerId |
Filtra las métricas de uso de un contenedor específico. |
AcceleratorId |
(Solo métricas de GPU) Filtra las métricas de uso de una GPU específica. |
Frecuencia métrica configurable
Puede configurar el intervalo en el que se publican las métricas CloudWatch. La frecuencia predeterminada es de 60 segundos.
Valores válidos: 10, 30, 60, 120, 180, 240 o 300 segundos.
Si EnableEnhancedMetrics se establece enFalse, esta frecuencia se aplica únicamente a las métricas de uso; las métricas de invocación se siguen publicando en el intervalo predeterminado de 60 segundos. Si se establece enTrue, esta frecuencia se aplica tanto a las métricas de utilización como a las de invocación.
nota
Las métricas publicadas a intervalos inferiores a 60 segundos (alta resolución) se conservan durante 3 horas.
CloudWatch El precio estándar se aplica por métrica y combinación de dimensiones única. Las métricas mejoradas aumentan la cantidad de flujos de métricas porque cada instancia, contenedor y GPU crea combinaciones de dimensiones adicionales. Para obtener más información sobre los precios, consulta CloudWatch los precios de Amazon
Ejemplos de código: configurar métricas mejoradas
Los siguientes ejemplos muestran cómo crear una configuración de punto final con las métricas mejoradas habilitadas y cómo verificar la configuración.