Configurando o complemento de SageMaker HyperPod observabilidade - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configurando o complemento de SageMaker HyperPod observabilidade

A lista a seguir descreve os pré-requisitos para configurar o complemento de observabilidade.

Para que as métricas do seu cluster Amazon SageMaker HyperPod (SageMaker HyperPod) sejam enviadas para um espaço de trabalho do Amazon Managed Service for Prometheus e, opcionalmente, visualizá-las no Amazon Managed Grafana, primeiro anexe as seguintes políticas e permissões gerenciadas à sua função de console.

  • Para usar o Amazon Managed Grafana, habilite Centro de Identidade do AWS IAM (IAM Identity Center) em um local onde o Região da AWS Amazon Managed Grafana esteja disponível. Para obter instruções detalhadas, consulte Getting started with IAM Identity Center no Guia do usuário do Centro de Identidade do AWS IAM. Para ver uma lista de Regiões da AWS onde o Amazon Managed Grafana está disponível, consulte Supported Regions no Guia do usuário do Amazon Managed Grafana.

  • Crie pelo menos um usuário no Centro de Identidade do IAM.

  • Você deve instalar o complemento Agente de Identidade de Pods do Amazon EKS em seu cluster do Amazon EKS. O complemento Amazon EKS Pod Identity Agent possibilita que o complemento de SageMaker HyperPod observabilidade obtenha as credenciais para interagir com o Amazon Managed Service for Prometheus and Logs. CloudWatch Para verificar se seu cluster do Amazon EKS tem o complemento, acesse o console do Amazon EKS e verifique a guia Complementos do seu cluster. Para ter informações sobre como instalar o complemento se ele ainda não estiver instalado, consulte Criar complemento (Console de gerenciamento da AWS) no Guia do usuário do Amazon EKS.

  • Certifique-se de ter pelo menos um nó em seu SageMaker HyperPod cluster antes de instalar o complemento SageMaker HyperPod de observabilidade. O menor tipo de EC2 instância da Amazon que funciona nesse caso é4xlarge. Esse requisito mínimo de tamanho de nó garante que o nó possa acomodar todos os pods que o complemento de SageMaker HyperPod observabilidade cria junto com quaisquer outros pods já em execução no cluster.

  • Adicione as políticas e permissões a seguir ao seu perfil.

    • AWSpolítica gerenciada: AmazonSageMakerHyperPodObservabilityAdminAccess

    • AWSpolítica gerenciada: AWSGrafana WorkspacePermissionManagement V2

    • AWSpolítica gerenciada: AmazonSageMakerFullAccess

    • Permissões adicionais para configurar os perfis do IAM necessários para acesso complementar ao Amazon Managed Grafana e ao Amazon Elastic Kubernetes Service:

      JSON
      { "Version":"2012-10-17", "Statement": [ { "Sid": "CreateRoleAccess", "Effect": "Allow", "Action": [ "iam:CreateRole", "iam:CreatePolicy", "iam:AttachRolePolicy", "iam:ListRoles" ], "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityAddonPolicy*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityGrafanaPolicy*" ] } ] }
    • Permissões adicionais necessárias para gerenciar usuários do Centro de Identidade do IAM para o Amazon Managed Grafana:

      JSON
      { "Version":"2012-10-17", "Statement": [ { "Sid": "SSOAccess", "Effect": "Allow", "Action": [ "sso:ListProfileAssociations", "sso-directory:SearchUsers", "sso-directory:SearchGroups", "sso:AssociateProfile", "sso:DisassociateProfile" ], "Resource": [ "*" ] } ] }

Depois que tiver certeza de que atendeu aos pré-requisitos acima, você poderá instalar o complemento de observabilidade.

Como instalar rapidamente o complemento de observabilidade
  1. Abra o console do Amazon SageMaker AI em https://console.aws.amazon.com/sagemaker/.

  2. Acesse a página de detalhes do seu cluster.

  3. Na guia Painel, localize o complemento chamado HyperPod Monitoramento e observabilidade e escolha Instalação rápida.

Como fazer uma instalação personalizada do complemento de observabilidade
  1. Acesse a página de detalhes do seu cluster.

  2. Na guia Painel, localize o complemento chamado HyperPod Monitoramento e observabilidade e escolha Instalação personalizada.

  3. Especifique as categorias de métricas que você deseja visualizar. Para ter mais informações sobre essas categorias de métricas, consulte SageMaker HyperPod métricas de cluster.

  4. Especifique se você deseja ativar o Amazon CloudWatch Logs.

  5. Especifique se você quer que o serviço crie um espaço de trabalho do Amazon Managed Service for Prometheus.

  6. Para poder visualizar as métricas nos painéis do Amazon Managed Grafana, marque a caixa Use um espaço de trabalho do Amazon Managed Grafana. Você pode especificar seu próprio espaço de trabalho ou deixar que o serviço crie um para você.

    nota

    O Amazon Managed Grafana não está disponível em todas as Regiões da AWS áreas em que o Amazon Managed Service for Prometheus está disponível. No entanto, você pode configurar um espaço de trabalho do Grafana em qualquer Região da AWS e configurá-lo para obter dados de métricas de um espaço de trabalho do Prometheus que resida em outra Região da AWS. Para ter informações, consulte Use AWS data source configuration to add Amazon Managed Service for Prometheus as a data source e Connect to Amazon Managed Service for Prometheus and open-source Prometheus data sources.