View a markdown version of this page

Métricas aprimoradas da Amazon SageMaker AI para endpoints de inferência - SageMaker Inteligência Artificial da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Métricas aprimoradas da Amazon SageMaker AI para endpoints de inferência

As métricas aprimoradas fornecem dados de monitoramento em nível de instância e de contêiner para endpoints em tempo real da Amazon AI. SageMaker Quando você ativa métricas aprimoradas, as CloudWatch métricas da Amazon podem incluir InstanceIdContainerId, e AcceleratorId dimensões (a disponibilidade varia de acordo com o namespace) para visibilidade granular por instância, por contêiner e por GPU. Métricas aprimoradas estão disponíveis para endpoints de modelo único e componentes de inferência. Multi-Container Os endpoints (MCE) oferecem suporte a métricas aprimoradas em nível de instância, mas não a métricas em nível de contêiner.

Principais características das métricas aprimoradas:

  • Instance-level granularidade. As métricas de utilização e invocação incluem uma InstanceId dimensão que identifica a instância específica que hospeda o endpoint. Isso está disponível para todos os endpoints em tempo real.

  • Container-level granularidade. Para endpoints que usam componentes de inferência, as métricas incluem uma ContainerId dimensão que identifica o contêiner específico que executa o modelo. Container-level as dimensões aparecem no AWS/SageMaker namespace (métricas de invocação) e no /aws/sagemaker/InferenceComponents namespace (métricas de utilização).

  • Per-GPU granularidade. As métricas de utilização da GPU incluem uma AcceleratorId dimensão que identifica a GPU específica em uma instância.

  • Frequência de publicação configurável. Você pode configurar o intervalo de publicação da métrica para 10, 30, 60, 120, 180, 240 ou 300 segundos. O padrão é 60 segundos. Esse intervalo se aplica às métricas de utilização, independentemente de as métricas aprimoradas estarem habilitadas. Com as métricas aprimoradas ativadas, isso também se aplica às métricas de invocação.

Habilitando métricas aprimoradas

Você ativa as métricas aprimoradas definindo EnableEnhancedMetrics MetricsConfigcomo True no parâmetro ao chamar a CreateEndpointConfigAPI.

O MetricsConfig parâmetro tem os seguintes campos:

MetricsConfig parâmetros
Parâmetro Tipo Obrigatório Padrão Description
EnableEnhancedMetrics Booleano Não False

Ativa dimensões métricas em nível de instância e em nível de contêiner.

MetricPublishFrequencyInSeconds Inteiro Não 60

O intervalo, em segundos, no qual as métricas são publicadas na Amazon CloudWatch. O padrão é 60. Valores válidos:10,30,60,120,180,240,300. Quando EnableEnhancedMetrics definido comoFalse, esse intervalo se aplica somente às métricas de utilização; as métricas de invocação continuam sendo publicadas no intervalo padrão de 60 segundos. Quando definido comoTrue, esse intervalo se aplica às métricas de utilização e invocação.

nota

MetricsConfigé definido no nível de configuração do endpoint. Você não pode definir configurações diferentes para componentes de inferência individuais no mesmo endpoint.

Para habilitar métricas aprimoradas em um endpoint existente, crie uma nova configuração de endpoint com as MetricsConfig configurações desejadas e, em seguida, chame UpdateEndpointcom o novo nome da configuração do endpoint. Isso aciona uma blue/green implantação contínua. As métricas aprimoradas não aparecem até que a implantação seja concluída. O mesmo processo se aplica ao alterar MetricsConfig as configurações em um endpoint já configurado.

Quando você configuraMetricsConfig, ambos DescribeEndpointe DescribeEndpointConfigretorna MetricsConfig na resposta.

Quando você ativa métricas aprimoradas, a SageMaker IA adiciona dimensões adicionais às métricas em três CloudWatch namespaces: /aws/sagemaker/Endpoints para métricas de utilização, AWS/SageMaker métricas de invocação e métricas de utilização de componentes /aws/sagemaker/InferenceComponents de inferência.

Instance-level métricas de utilização

O /aws/sagemaker/Endpoints namespace inclui métricas de utilização para todos os endpoints em tempo real, incluindo aqueles que usam componentes de inferência. Quando você ativa as métricas aprimoradas, as dimensões InstanceId e AcceleratorId (somente métricas da GPU) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulteSageMaker Métricas de endpoint de IA.

Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:

Dimensões adicionais para métricas de utilização em nível de instância
Dimensão Description
InstanceId

Filtra as métricas de utilização de uma instância específica.

AcceleratorId

(Somente métricas da GPU) Filtra as métricas de utilização de uma GPU específica.

Métricas de invocação em nível de instância e contêiner

O AWS/SageMaker namespace inclui métricas de invocação. Quando você ativa as métricas aprimoradas, as dimensões InstanceId e ContainerId (somente componentes de inferência) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulteSageMaker Métricas de invocação de endpoints de IA.

Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:

Dimensões adicionais para métricas de invocação
Dimensão Description
InstanceId

Filtra métricas de invocação para uma instância específica.

ContainerId

(Somente componentes de inferência) Filtra métricas de invocação para um contêiner específico.

Container-level métricas de utilização

O /aws/sagemaker/InferenceComponents namespace inclui métricas de utilização para endpoints que usam componentes de inferência. Quando você ativa as métricas aprimoradas, as dimensões InstanceIdContainerId, e AcceleratorId (somente métricas da GPU) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulteSageMaker Métricas do componente de inferência de IA.

Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:

Dimensões adicionais para métricas de utilização em nível de contêiner
Dimensão Description
InstanceId

Filtra as métricas de utilização de uma instância específica.

ContainerId

Filtra as métricas de utilização de um contêiner específico.

AcceleratorId

(Somente métricas da GPU) Filtra as métricas de utilização de uma GPU específica.

Frequência métrica configurável

Você pode configurar o intervalo no qual as métricas são publicadas CloudWatch. A frequência padrão é de 60 segundos.

Valores válidos: 10, 30, 60, 120, 180, 240 ou 300 segundos.

Quando EnableEnhancedMetrics definida comoFalse, essa frequência se aplica somente às métricas de utilização; as métricas de invocação continuam sendo publicadas no intervalo padrão de 60 segundos. Quando definida comoTrue, essa frequência se aplica às métricas de utilização e invocação.

nota

As métricas publicadas em intervalos inferiores a 60 segundos (alta resolução) são retidas por 3 horas.

CloudWatch O preço padrão se aplica por métrica por combinação única de dimensões. As métricas aprimoradas aumentam o número de fluxos de métricas porque cada instância, contêiner e GPU cria combinações de dimensões adicionais. Para obter detalhes sobre preços, consulte os CloudWatch preços da Amazon.

Exemplos de código: configure métricas aprimoradas

Os exemplos a seguir mostram como criar uma configuração de endpoint com métricas aprimoradas ativadas e como verificar a configuração.

Crie uma configuração de endpoint com métricas aprimoradas

AWS SDK for Python (Boto3)
exemplo Crie uma configuração de endpoint com métricas aprimoradas
import boto3 sagemaker_client = boto3.client('sagemaker') response = sagemaker_client.create_endpoint_config( EndpointConfigName='my-enhanced-metrics-config', ProductionVariants=[ { 'VariantName': 'AllTraffic', 'ModelName': 'my-model', 'InstanceType': 'ml.m5.xlarge', 'InitialInstanceCount': 2, } ], MetricsConfig={ 'EnableEnhancedMetrics': True, 'MetricPublishFrequencyInSeconds': 60 } )
AWS CLI
exemplo Crie uma configuração de endpoint com métricas aprimoradas
aws sagemaker create-endpoint-config \ --endpoint-config-name my-enhanced-metrics-config \ --production-variants file://production-variants.json \ --metrics-config file://metrics-config.json

Onde metrics-config.json contém:

{ "EnableEnhancedMetrics": true, "MetricPublishFrequencyInSeconds": 60 }

Verifique a configuração aprimorada das métricas

AWS SDK for Python (Boto3)
exemplo Verifique a configuração aprimorada das métricas
response = sagemaker_client.describe_endpoint_config( EndpointConfigName='my-enhanced-metrics-config' ) print(response['MetricsConfig']) # {'EnableEnhancedMetrics': True, 'MetricPublishFrequencyInSeconds': 60} response = sagemaker_client.describe_endpoint( EndpointName='my-endpoint' ) print(response['MetricsConfig'])
AWS CLI
exemplo Verifique a configuração aprimorada das métricas
aws sagemaker describe-endpoint-config \ --endpoint-config-name my-enhanced-metrics-config \ --query 'MetricsConfig'
aws sagemaker describe-endpoint \ --endpoint-name my-endpoint \ --query 'MetricsConfig'