As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configuração do painel
Use as informações a seguir para configurar o complemento Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS. Isso configura você com um painel visual detalhado que fornece uma visão das métricas do hardware, alocação de equipe e tarefas do seu cluster EKS.
Se você estiver tendo problemas na configuração, consulte as soluções Solução de problemas de solução de problemas conhecidas.
HyperPod Pré-requisitos do complemento Amazon CloudWatch Observability EKS
A seção a seguir inclui os pré-requisitos necessários antes de instalar o complemento Amazon EKS Observability.
-
Certifique-se de ter a política de permissão mínima para administradores de HyperPod cluster, emUsuários do IAM para administração de cluster.
-
Anexe a política CloudWatchAgentServerPolicy
do IAM aos seus nós de trabalho. Para fazer isso, insira o comando a seguir. my-worker-node-role
Substitua pela função do IAM usada pelos nós de trabalho do Kubernetes.
aws iam attach-role-policy \
--role-name my-worker-node-role
\
--policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy
HyperPod Configuração do complemento Amazon CloudWatch Observability EKS
Use as seguintes opções para configurar o complemento Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS.
- Setup using the SageMaker AI console
-
As permissões a seguir são necessárias para configurar e visualizar o painel de controle de HyperPod tarefas. Esta seção expande as permissões listadas emUsuários do IAM para administração de cluster.
Para gerenciar a governança de tarefas, use o exemplo de política:
JSON
- JSON
-
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"sagemaker:ListClusters",
"sagemaker:DescribeCluster",
"sagemaker:ListComputeQuotas",
"sagemaker:CreateComputeQuota",
"sagemaker:UpdateComputeQuota",
"sagemaker:DescribeComputeQuota",
"sagemaker:DeleteComputeQuota",
"sagemaker:ListClusterSchedulerConfigs",
"sagemaker:DescribeClusterSchedulerConfig",
"sagemaker:CreateClusterSchedulerConfig",
"sagemaker:UpdateClusterSchedulerConfig",
"sagemaker:DeleteClusterSchedulerConfig",
"eks:ListAddons",
"eks:CreateAddon",
"eks:DescribeAddon",
"eks:DescribeCluster",
"eks:DescribeAccessEntry",
"eks:ListAssociatedAccessPolicies",
"eks:AssociateAccessPolicy",
"eks:DisassociateAccessPolicy"
],
"Resource": "*"
}
]
}
Para conceder permissões para gerenciar o Amazon CloudWatch Observability (Amazon EKS) e visualizar o painel do HyperPod cluster por meio do console de SageMaker IA, use o exemplo de política abaixo:
JSON
- JSON
-
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"eks:ListAddons",
"eks:CreateAddon",
"eks:UpdateAddon",
"eks:DescribeAddon",
"eks:DescribeAddonVersions",
"sagemaker:DescribeCluster",
"sagemaker:DescribeClusterNode",
"sagemaker:ListClusterNodes",
"sagemaker:ListClusters",
"sagemaker:ListComputeQuotas",
"sagemaker:DescribeComputeQuota",
"sagemaker:ListClusterSchedulerConfigs",
"sagemaker:DescribeClusterSchedulerConfig",
"eks:DescribeCluster",
"cloudwatch:GetMetricData",
"eks:AccessKubernetesApi"
],
"Resource": "*"
}
]
}
Navegue até a guia Painel no SageMaker HyperPod console para instalar o Amazon CloudWatch Observability EKS. Para garantir que as métricas relacionadas à governança de tarefas sejam incluídas no Painel, ative a caixa de seleção Kueue metrics. Ativar as métricas do Kueue ativa os custos CloudWatch das métricas, após o limite do nível gratuito ser atingido. Para obter mais informações, consulte Métricas nos CloudWatchpreços da Amazon.
- Setup using the EKS AWS CLI
-
Use o seguinte AWS CLI comando EKS para instalar o complemento:
aws eks create-addon --cluster-name cluster-name
--addon-name amazon-cloudwatch-observability
--configuration-values "configuration json
"
Abaixo está um exemplo do JSON dos valores de configuração:
{
"agent": {
"config": {
"logs": {
"metrics_collected": {
"kubernetes": {
"kueue_container_insights": true,
"enhanced_container_insights": true
},
"application_signals": { }
}
},
"traces": {
"traces_collected": {
"application_signals": { }
}
}
},
},
}
- Setup using the EKS Console UI
-
-
Navegue até o console EKS.
-
Escolha seu cluster.
-
Escolha Complementos.
-
Encontre o complemento Amazon CloudWatch Observability e instale. Instale a versão >= 2.4.0 para o complemento.
-
Inclua os seguintes valores de configuração JSON:
{
"agent": {
"config": {
"logs": {
"metrics_collected": {
"kubernetes": {
"kueue_container_insights": true,
"enhanced_container_insights": true
},
"application_signals": { }
},
},
"traces": {
"traces_collected": {
"application_signals": { }
}
}
},
},
}
Depois que o complemento EKS Observability for instalado com sucesso, você poderá visualizar as métricas do cluster EKS na guia Painel do HyperPod console.