View a markdown version of this page

Monitore o uso da reserva de capacidade com CloudWatch as métricas da Amazon - SageMaker Inteligência Artificial da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Monitore o uso da reserva de capacidade com CloudWatch as métricas da Amazon

Você pode usar CloudWatch as métricas da Amazon para monitorar a utilização das reservas de capacidade associadas aos seus planos de SageMaker treinamento. Esse recurso fornece acesso a métricas históricas e em tempo real sobre o uso da instância, no nível do plano individual e em todos os planos da sua conta, para que você possa tomar decisões informadas sobre capacidade e custo. Essas métricas serão publicadas diretamente em sua conta, e o serviço de planos de SageMaker treinamento não terá acesso a elas.

Considerações sobre a integração

A função AWSServiceRoleForSageMakerCapacityReservation vinculada ao serviço (SLR) deve existir em sua conta para que as métricas sejam publicadas. Você precisa adicionar a iam:CreateServiceLinkedRole permissão à função da sua conta. SageMaker A IA configurará automaticamente a SLR necessária na próxima vez que você ligarCreateTrainingPlan. Depois que a SLR estiver configurada, CloudWatch as métricas estarão disponíveis para compras de novos planos.

A declaração a seguir precisa ser adicionada à sua política do IAM:

{ "Effect": "Allow", "Action": "iam:CreateServiceLinkedRole", "Resource": "*", "Condition": { "StringEquals": { "iam:AWSServiceName": "capacityreservation.sagemaker.amazonaws.com" } } }
nota

Enquanto o Resource campo estiver definido como "*" (obrigatório paraCreateServiceLinkedRole), o Condition bloco restringe essa permissão para criar somente a SLR de reserva de capacidade de SageMaker IA. Além disso, se a função for excluída por algum motivo, ela será recriada na próxima CreateTrainingPlan chamada por meio da API ou do console.

Criação manual de uma função vinculada ao serviço

Você também pode criar a SLR por meio do, AWS CLI em vez de depender da SageMaker IA para configurá-la, executando o seguinte comando:

aws iam create-service-linked-role --aws-service-name capacityreservation.sagemaker.amazonaws.com

Esse comando cria a AWSServiceRoleForSageMakerCapacityReservation função na sua conta. Para obter mais informações sobre as funções vinculadas a um serviço, consulte Como usar funções vinculadas a serviços.

Importante

O serviço começa a publicar as métricas somente após a criação da SLR. Os planos adquiridos antes da criação da SLR não mostrarão dados de utilização mais antigos. CloudWatch

Métricas de uso da reserva de capacidade

SageMaker A AI publica as seguintes métricas no aws/sagemaker/CapacityReservations namespace.

Métrica Descrição
UsedInstanceCount O número de instâncias que estão em uso no momento. Unidade: contagem
AvailableInstanceCount O número de instâncias disponíveis. Unidade: Contagem
TotalInstanceCount O número total de instâncias em seu plano de treinamento. Unidade: Contagem
InstanceUtilization A porcentagem de instâncias de capacidade reservada que estão em uso no momento. Unidade: percentual

Dimensões métricas de reserva de capacidade

Você pode usar as seguintes dimensões para filtrar as métricas.

Dimensão Description
ReservationName Filtra as métricas pelo nome.
ComponentType Filtra métricas por componente de SageMaker IA, como SageMaker HyperPod cluster, Training Job, endpoint de inferência ou aplicativo Studio.
AvailabilityZone Filtra métricas por zona de disponibilidade.
InstanceType Filtra métricas por tipo de instância.
ReservationType Filtra métricas por tipo de reserva (TrainingPlan).

Veja as CloudWatch métricas da Amazon para reservas de capacidade

Você pode visualizar as métricas de reserva de capacidade usando o CloudWatch console da Amazon ou AWS CLI o.

Para visualizar as métricas de reserva de capacidade usando o CloudWatch console da Amazon
  1. Abra o CloudWatch console em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, escolha Métricas e, em seguida, Todas as métricas.

  3. Selecione o namespace aws/sagemaker/CapacityReservations.

  4. Escolha uma dimensão métrica pela qual filtrar.

  5. Marque a caixa de seleção ao lado de uma métrica para representá-la graficamente.

Para listar as métricas disponíveis usando o AWS CLI, execute o seguinte comando:

aws cloudwatch list-metrics --namespace "aws/sagemaker/CapacityReservations"