View a markdown version of this page

Métricas mejoradas de Amazon SageMaker AI para puntos finales de inferencia - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Métricas mejoradas de Amazon SageMaker AI para puntos finales de inferencia

Las métricas mejoradas proporcionan datos de monitoreo a nivel de instancia y contenedor para los puntos de conexión en tiempo real de Amazon AI. SageMaker Cuando habilitas las métricas mejoradas, las CloudWatch métricas de Amazon pueden incluir InstanceId y AcceleratorId dimensiones (la disponibilidad varía según el espacio de nombres) para una visibilidad granular por instancia, por contenedor y por GPU. ContainerId Hay métricas mejoradas disponibles para los puntos finales y los componentes de inferencia de un solo modelo. Multi-Container Los puntos finales (MCE) admiten métricas mejoradas a nivel de instancia, pero no a nivel de contenedor.

Características clave de las métricas mejoradas:

  • Instance-level granularidad. Las métricas de utilización e invocación incluyen una InstanceId dimensión que identifica la instancia específica que aloja el punto final. Está disponible para todos los puntos finales en tiempo real.

  • Container-level granularidad. En el caso de los puntos finales que utilizan componentes de inferencia, las métricas incluyen una ContainerId dimensión que identifica el contenedor específico que ejecuta el modelo. Container-level las dimensiones aparecen tanto en el espacio de AWS/SageMaker nombres (métricas de invocación) como en el espacio de /aws/sagemaker/InferenceComponents nombres (métricas de utilización).

  • Per-GPU granularidad. Las métricas de uso de la GPU incluyen una AcceleratorId dimensión que identifica la GPU específica de una instancia.

  • Frecuencia de publicación configurable. Puede configurar el intervalo de publicación métrico en 10, 30, 60, 120, 180, 240 o 300 segundos. El valor predeterminado es de 60 segundos. Este intervalo se aplica a las métricas de uso independientemente de si las métricas mejoradas están habilitadas. Con las métricas mejoradas habilitadas, también se aplica a las métricas de invocación.

Habilitar métricas mejoradas

Para habilitar las métricas mejoradas, EnableEnhancedMetrics True establézcalas en el MetricsConfigparámetro al llamar a la CreateEndpointConfigAPI.

El MetricsConfig parámetro tiene los siguientes campos:

MetricsConfig parámetros
Parámetro Tipo Obligatorio/a Predeterminado Description (Descripción)
EnableEnhancedMetrics Booleano No False

Permite dimensiones métricas a nivel de instancia y de contenedor.

MetricPublishFrequencyInSeconds Entero No 60

El intervalo, en segundos, en el que se publican las métricas en Amazon CloudWatch. El valor predeterminado es 60. Valores válidos: 1030,60,120,180,240,300. Si EnableEnhancedMetrics se establece enFalse, este intervalo se aplica únicamente a las métricas de uso; las métricas de invocación se siguen publicando en el intervalo predeterminado de 60 segundos. Si se establece enTrue, este intervalo se aplica tanto a las métricas de utilización como a las de invocación.

nota

MetricsConfigse establece en el nivel de configuración del punto final. No puede configurar diferentes ajustes para los componentes de inferencia individuales en el mismo punto final.

Para habilitar las métricas mejoradas en un punto final existente, cree una nueva configuración de punto final con la MetricsConfig configuración deseada y, a continuación, llame UpdateEndpointcon el nombre de la nueva configuración de punto final. Esto desencadena un despliegue continuo blue/green o continuo. Las métricas mejoradas no aparecen hasta que se completa la implementación. El mismo proceso se aplica al cambiar la MetricsConfig configuración en un punto final ya configurado.

Al configurarMetricsConfig, ambos DescribeEndpointy DescribeEndpointConfigdevuelven MetricsConfig la respuesta.

Al habilitar las métricas mejoradas, la SageMaker IA añade dimensiones adicionales a las métricas en tres CloudWatch espacios de nombres: /aws/sagemaker/Endpoints para las métricas de utilización, para las métricas de invocación y AWS/SageMaker /aws/sagemaker/InferenceComponents para las métricas de utilización de los componentes de inferencia.

Instance-level métricas de uso

El espacio de /aws/sagemaker/Endpoints nombres incluye métricas de uso para todos los puntos finales en tiempo real, incluidos los que utilizan componentes de inferencia. Al habilitar las métricas mejoradas, las dimensiones InstanceId y AcceleratorId (solo métricas de GPU) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. SageMaker Métricas de puntos finales de IA

Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:

Dimensiones adicionales para las métricas de uso a nivel de instancia
Dimensión Description (Descripción)
InstanceId

Filtra las métricas de uso de una instancia específica.

AcceleratorId

(Solo métricas de GPU) Filtra las métricas de uso de una GPU específica.

Métricas de invocación a nivel de instancia y contenedor

El AWS/SageMaker espacio de nombres incluye métricas de invocación. Al habilitar las métricas mejoradas, las dimensiones InstanceId y ContainerId (solo los componentes de inferencia) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. SageMaker Métricas de invocación de puntos finales de IA

Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:

Dimensiones adicionales para las métricas de invocación
Dimensión Description (Descripción)
InstanceId

Filtra las métricas de invocación de una instancia específica.

ContainerId

(Solo componentes de inferencia) Filtra las métricas de invocación de un contenedor específico.

Container-level métricas de utilización

El espacio de /aws/sagemaker/InferenceComponents nombres incluye métricas de uso para los puntos finales que utilizan componentes de inferencia. Al habilitar las métricas mejoradas, las dimensiones InstanceIdContainerId, y AcceleratorId (solo métricas de GPU) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. SageMaker Métricas de componentes de inferencia de IA

Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:

Dimensiones adicionales para las métricas de utilización a nivel de contenedor
Dimensión Description (Descripción)
InstanceId

Filtra las métricas de uso de una instancia específica.

ContainerId

Filtra las métricas de uso de un contenedor específico.

AcceleratorId

(Solo métricas de GPU) Filtra las métricas de uso de una GPU específica.

Frecuencia métrica configurable

Puede configurar el intervalo en el que se publican las métricas CloudWatch. La frecuencia predeterminada es de 60 segundos.

Valores válidos: 10, 30, 60, 120, 180, 240 o 300 segundos.

Si EnableEnhancedMetrics se establece enFalse, esta frecuencia se aplica únicamente a las métricas de uso; las métricas de invocación se siguen publicando en el intervalo predeterminado de 60 segundos. Si se establece enTrue, esta frecuencia se aplica tanto a las métricas de utilización como a las de invocación.

nota

Las métricas publicadas a intervalos inferiores a 60 segundos (alta resolución) se conservan durante 3 horas.

CloudWatch El precio estándar se aplica por métrica y combinación de dimensiones única. Las métricas mejoradas aumentan la cantidad de flujos de métricas porque cada instancia, contenedor y GPU crea combinaciones de dimensiones adicionales. Para obtener más información sobre los precios, consulta CloudWatch los precios de Amazon.

Ejemplos de código: configurar métricas mejoradas

Los siguientes ejemplos muestran cómo crear una configuración de punto final con las métricas mejoradas habilitadas y cómo verificar la configuración.

Cree una configuración de punto final con métricas mejoradas

AWS SDK for Python (Boto3)
ejemplo Cree una configuración de punto final con métricas mejoradas
import boto3 sagemaker_client = boto3.client('sagemaker') response = sagemaker_client.create_endpoint_config( EndpointConfigName='my-enhanced-metrics-config', ProductionVariants=[ { 'VariantName': 'AllTraffic', 'ModelName': 'my-model', 'InstanceType': 'ml.m5.xlarge', 'InitialInstanceCount': 2, } ], MetricsConfig={ 'EnableEnhancedMetrics': True, 'MetricPublishFrequencyInSeconds': 60 } )
AWS CLI
ejemplo Cree una configuración de punto final con métricas mejoradas
aws sagemaker create-endpoint-config \ --endpoint-config-name my-enhanced-metrics-config \ --production-variants file://production-variants.json \ --metrics-config file://metrics-config.json

Donde metrics-config.json contiene:

{ "EnableEnhancedMetrics": true, "MetricPublishFrequencyInSeconds": 60 }

Verifique la configuración de métricas mejorada

AWS SDK for Python (Boto3)
ejemplo Verifique la configuración de métricas mejorada
response = sagemaker_client.describe_endpoint_config( EndpointConfigName='my-enhanced-metrics-config' ) print(response['MetricsConfig']) # {'EnableEnhancedMetrics': True, 'MetricPublishFrequencyInSeconds': 60} response = sagemaker_client.describe_endpoint( EndpointName='my-endpoint' ) print(response['MetricsConfig'])
AWS CLI
ejemplo Verifique la configuración de métricas mejorada
aws sagemaker describe-endpoint-config \ --endpoint-config-name my-enhanced-metrics-config \ --query 'MetricsConfig'
aws sagemaker describe-endpoint \ --endpoint-name my-endpoint \ --query 'MetricsConfig'