As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Métricas aprimoradas da Amazon SageMaker AI para endpoints de inferência
As métricas aprimoradas fornecem dados de monitoramento em nível de instância e de contêiner para endpoints em tempo real da Amazon AI. SageMaker Quando você ativa métricas aprimoradas, as CloudWatch métricas da Amazon podem incluir InstanceIdContainerId, e AcceleratorId dimensões (a disponibilidade varia de acordo com o namespace) para visibilidade granular por instância, por contêiner e por GPU. Métricas aprimoradas estão disponíveis para endpoints de modelo único e componentes de inferência. Multi-Container Os endpoints (MCE) oferecem suporte a métricas aprimoradas em nível de instância, mas não a métricas em nível de contêiner.
Principais características das métricas aprimoradas:
-
Instance-level granularidade. As métricas de utilização e invocação incluem uma
InstanceIddimensão que identifica a instância específica que hospeda o endpoint. Isso está disponível para todos os endpoints em tempo real. -
Container-level granularidade. Para endpoints que usam componentes de inferência, as métricas incluem uma
ContainerIddimensão que identifica o contêiner específico que executa o modelo. Container-level as dimensões aparecem noAWS/SageMakernamespace (métricas de invocação) e no/aws/sagemaker/InferenceComponentsnamespace (métricas de utilização). -
Per-GPU granularidade. As métricas de utilização da GPU incluem uma
AcceleratorIddimensão que identifica a GPU específica em uma instância. -
Frequência de publicação configurável. Você pode configurar o intervalo de publicação da métrica para 10, 30, 60, 120, 180, 240 ou 300 segundos. O padrão é 60 segundos. Esse intervalo se aplica às métricas de utilização, independentemente de as métricas aprimoradas estarem habilitadas. Com as métricas aprimoradas ativadas, isso também se aplica às métricas de invocação.
Habilitando métricas aprimoradas
Você ativa as métricas aprimoradas definindo EnableEnhancedMetrics MetricsConfigcomo True no parâmetro ao chamar a CreateEndpointConfigAPI.
O MetricsConfig parâmetro tem os seguintes campos:
| Parâmetro | Tipo | Obrigatório | Padrão | Description |
|---|---|---|---|---|
EnableEnhancedMetrics |
Booleano | Não | False |
Ativa dimensões métricas em nível de instância e em nível de contêiner. |
MetricPublishFrequencyInSeconds |
Inteiro | Não | 60 |
O intervalo, em segundos, no qual as métricas são publicadas na Amazon CloudWatch. O padrão é |
nota
MetricsConfigé definido no nível de configuração do endpoint. Você não pode definir configurações diferentes para componentes de inferência individuais no mesmo endpoint.
Para habilitar métricas aprimoradas em um endpoint existente, crie uma nova configuração de endpoint com as MetricsConfig configurações desejadas e, em seguida, chame UpdateEndpointcom o novo nome da configuração do endpoint. Isso aciona uma blue/green implantação contínua. As métricas aprimoradas não aparecem até que a implantação seja concluída. O mesmo processo se aplica ao alterar MetricsConfig as configurações em um endpoint já configurado.
Quando você configuraMetricsConfig, ambos DescribeEndpointe DescribeEndpointConfigretorna MetricsConfig na resposta.
Quando você ativa métricas aprimoradas, a SageMaker IA adiciona dimensões adicionais às métricas em três CloudWatch namespaces: /aws/sagemaker/Endpoints para métricas de utilização, AWS/SageMaker métricas de invocação e métricas de utilização de componentes /aws/sagemaker/InferenceComponents de inferência.
Instance-level métricas de utilização
O /aws/sagemaker/Endpoints namespace inclui métricas de utilização para todos os endpoints em tempo real, incluindo aqueles que usam componentes de inferência. Quando você ativa as métricas aprimoradas, as dimensões InstanceId e AcceleratorId (somente métricas da GPU) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulteSageMaker Métricas de endpoint de IA.
Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:
| Dimensão | Description |
|---|---|
InstanceId |
Filtra as métricas de utilização de uma instância específica. |
AcceleratorId |
(Somente métricas da GPU) Filtra as métricas de utilização de uma GPU específica. |
Métricas de invocação em nível de instância e contêiner
O AWS/SageMaker namespace inclui métricas de invocação. Quando você ativa as métricas aprimoradas, as dimensões InstanceId e ContainerId (somente componentes de inferência) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulteSageMaker Métricas de invocação de endpoints de IA.
Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:
| Dimensão | Description |
|---|---|
InstanceId |
Filtra métricas de invocação para uma instância específica. |
ContainerId |
(Somente componentes de inferência) Filtra métricas de invocação para um contêiner específico. |
Container-level métricas de utilização
O /aws/sagemaker/InferenceComponents namespace inclui métricas de utilização para endpoints que usam componentes de inferência. Quando você ativa as métricas aprimoradas, as dimensões InstanceIdContainerId, e AcceleratorId (somente métricas da GPU) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulteSageMaker Métricas do componente de inferência de IA.
Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:
| Dimensão | Description |
|---|---|
InstanceId |
Filtra as métricas de utilização de uma instância específica. |
ContainerId |
Filtra as métricas de utilização de um contêiner específico. |
AcceleratorId |
(Somente métricas da GPU) Filtra as métricas de utilização de uma GPU específica. |
Frequência métrica configurável
Você pode configurar o intervalo no qual as métricas são publicadas CloudWatch. A frequência padrão é de 60 segundos.
Valores válidos: 10, 30, 60, 120, 180, 240 ou 300 segundos.
Quando EnableEnhancedMetrics definida comoFalse, essa frequência se aplica somente às métricas de utilização; as métricas de invocação continuam sendo publicadas no intervalo padrão de 60 segundos. Quando definida comoTrue, essa frequência se aplica às métricas de utilização e invocação.
nota
As métricas publicadas em intervalos inferiores a 60 segundos (alta resolução) são retidas por 3 horas.
CloudWatch O preço padrão se aplica por métrica por combinação única de dimensões. As métricas aprimoradas aumentam o número de fluxos de métricas porque cada instância, contêiner e GPU cria combinações de dimensões adicionais. Para obter detalhes sobre preços, consulte os CloudWatch preços da Amazon
Exemplos de código: configure métricas aprimoradas
Os exemplos a seguir mostram como criar uma configuração de endpoint com métricas aprimoradas ativadas e como verificar a configuração.