Habilitando métricas aprimoradas Instance-level métricas de utilização Métricas de invocação em nível de instância e contêiner Container-level métricas de utilização Frequência métrica configurável Exemplos de código: configure métricas aprimoradas

Métricas aprimoradas da Amazon SageMaker AI para endpoints de inferência

As métricas aprimoradas fornecem dados de monitoramento em nível de instância e de contêiner para endpoints em tempo real da Amazon AI. SageMaker Quando você ativa métricas aprimoradas, as CloudWatch métricas da Amazon podem incluir InstanceIdContainerId, e AcceleratorId dimensões (a disponibilidade varia de acordo com o namespace) para visibilidade granular por instância, por contêiner e por GPU. Métricas aprimoradas estão disponíveis para endpoints de modelo único e componentes de inferência. Multi-Container Os endpoints (MCE) oferecem suporte a métricas aprimoradas em nível de instância, mas não a métricas em nível de contêiner.

Principais características das métricas aprimoradas:

Instance-level granularidade. As métricas de utilização e invocação incluem uma InstanceId dimensão que identifica a instância específica que hospeda o endpoint. Isso está disponível para todos os endpoints em tempo real.
Container-level granularidade. Para endpoints que usam componentes de inferência, as métricas incluem uma ContainerId dimensão que identifica o contêiner específico que executa o modelo. Container-level as dimensões aparecem no AWS/SageMaker namespace (métricas de invocação) e no /aws/sagemaker/InferenceComponents namespace (métricas de utilização).
Per-GPU granularidade. As métricas de utilização da GPU incluem uma AcceleratorId dimensão que identifica a GPU específica em uma instância.
Frequência de publicação configurável. Você pode configurar o intervalo de publicação da métrica para 10, 30, 60, 120, 180, 240 ou 300 segundos. O padrão é 60 segundos. Esse intervalo se aplica às métricas de utilização, independentemente de as métricas aprimoradas estarem habilitadas. Com as métricas aprimoradas ativadas, isso também se aplica às métricas de invocação.

Habilitando métricas aprimoradas

Você ativa as métricas aprimoradas definindo EnableEnhancedMetrics MetricsConfigcomo True no parâmetro ao chamar a CreateEndpointConfigAPI.

O MetricsConfig parâmetro tem os seguintes campos:

MetricsConfig parâmetros
Parâmetro	Tipo	Obrigatório	Padrão	Description
`EnableEnhancedMetrics`	Booleano	Não	`False`	Ativa dimensões métricas em nível de instância e em nível de contêiner.
`MetricPublishFrequencyInSeconds`	Inteiro	Não	`60`	O intervalo, em segundos, no qual as métricas são publicadas na Amazon CloudWatch. O padrão é `60`. Valores válidos:`10`,`30`,`60`,`120`,`180`,`240`,`300`. Quando `EnableEnhancedMetrics` definido como`False`, esse intervalo se aplica somente às métricas de utilização; as métricas de invocação continuam sendo publicadas no intervalo padrão de 60 segundos. Quando definido como`True`, esse intervalo se aplica às métricas de utilização e invocação.

nota

MetricsConfigé definido no nível de configuração do endpoint. Você não pode definir configurações diferentes para componentes de inferência individuais no mesmo endpoint.

Para habilitar métricas aprimoradas em um endpoint existente, crie uma nova configuração de endpoint com as MetricsConfig configurações desejadas e, em seguida, chame UpdateEndpointcom o novo nome da configuração do endpoint. Isso aciona uma blue/green implantação contínua. As métricas aprimoradas não aparecem até que a implantação seja concluída. O mesmo processo se aplica ao alterar MetricsConfig as configurações em um endpoint já configurado.

Quando você configuraMetricsConfig, ambos DescribeEndpointe DescribeEndpointConfigretorna MetricsConfig na resposta.

Quando você ativa métricas aprimoradas, a SageMaker IA adiciona dimensões adicionais às métricas em três CloudWatch namespaces: /aws/sagemaker/Endpoints para métricas de utilização, AWS/SageMaker métricas de invocação e métricas de utilização de componentes /aws/sagemaker/InferenceComponents de inferência.

Instance-level métricas de utilização

O /aws/sagemaker/Endpoints namespace inclui métricas de utilização para todos os endpoints em tempo real, incluindo aqueles que usam componentes de inferência. Quando você ativa as métricas aprimoradas, as dimensões InstanceId e AcceleratorId (somente métricas da GPU) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulteSageMaker Métricas de endpoint de IA.

Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:

Dimensões adicionais para métricas de utilização em nível de instância
Dimensão	Description
`InstanceId`	Filtra as métricas de utilização de uma instância específica.
`AcceleratorId`	(Somente métricas da GPU) Filtra as métricas de utilização de uma GPU específica.

Métricas de invocação em nível de instância e contêiner

O AWS/SageMaker namespace inclui métricas de invocação. Quando você ativa as métricas aprimoradas, as dimensões InstanceId e ContainerId (somente componentes de inferência) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulteSageMaker Métricas de invocação de endpoints de IA.

Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:

Dimensões adicionais para métricas de invocação
Dimensão	Description
`InstanceId`	Filtra métricas de invocação para uma instância específica.
`ContainerId`	(Somente componentes de inferência) Filtra métricas de invocação para um contêiner específico.

Container-level métricas de utilização

O /aws/sagemaker/InferenceComponents namespace inclui métricas de utilização para endpoints que usam componentes de inferência. Quando você ativa as métricas aprimoradas, as dimensões InstanceIdContainerId, e AcceleratorId (somente métricas da GPU) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulteSageMaker Métricas do componente de inferência de IA.

Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:

Dimensões adicionais para métricas de utilização em nível de contêiner
Dimensão	Description
`InstanceId`	Filtra as métricas de utilização de uma instância específica.
`ContainerId`	Filtra as métricas de utilização de um contêiner específico.
`AcceleratorId`	(Somente métricas da GPU) Filtra as métricas de utilização de uma GPU específica.

Frequência métrica configurável

Você pode configurar o intervalo no qual as métricas são publicadas CloudWatch. A frequência padrão é de 60 segundos.

Valores válidos: 10, 30, 60, 120, 180, 240 ou 300 segundos.

Quando EnableEnhancedMetrics definida comoFalse, essa frequência se aplica somente às métricas de utilização; as métricas de invocação continuam sendo publicadas no intervalo padrão de 60 segundos. Quando definida comoTrue, essa frequência se aplica às métricas de utilização e invocação.

nota

As métricas publicadas em intervalos inferiores a 60 segundos (alta resolução) são retidas por 3 horas.

CloudWatch O preço padrão se aplica por métrica por combinação única de dimensões. As métricas aprimoradas aumentam o número de fluxos de métricas porque cada instância, contêiner e GPU cria combinações de dimensões adicionais. Para obter detalhes sobre preços, consulte os CloudWatch preços da Amazon.

Exemplos de código: configure métricas aprimoradas

Os exemplos a seguir mostram como criar uma configuração de endpoint com métricas aprimoradas ativadas e como verificar a configuração.

Crie uma configuração de endpoint com métricas aprimoradas

Verifique a configuração aprimorada das métricas

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Métricas em CloudWatch

Observabilidade detalhada

Métricas aprimoradas da Amazon SageMaker AI para endpoints de inferência

Habilitando métricas aprimoradas

nota

Instance-level métricas de utilização

Métricas de invocação em nível de instância e contêiner

Container-level métricas de utilização

Frequência métrica configurável

nota

Exemplos de código: configure métricas aprimoradas

Crie uma configuração de endpoint com métricas aprimoradas

exemplo Crie uma configuração de endpoint com métricas aprimoradas

exemplo Crie uma configuração de endpoint com métricas aprimoradas

Verifique a configuração aprimorada das métricas

exemplo Verifique a configuração aprimorada das métricas

exemplo Verifique a configuração aprimorada das métricas