Configuración del panel - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración del panel

Utilice la siguiente información para configurar el complemento SageMaker HyperPod Amazon CloudWatch Observability EKS. Esto le proporciona un panel visual detallado que proporciona una vista de las métricas del hardware de su clúster de EKS, la asignación de equipos y las tareas.

Si tiene problemas con la configuración, consulte las soluciones Solución de problemas de solución de problemas conocidas.

HyperPod Requisitos previos del complemento Amazon CloudWatch Observability EKS

La siguiente sección incluye los requisitos previos necesarios antes de instalar el complemento Amazon EKS Observability.

  • Asegúrese de tener la política de permisos mínimos para los administradores de HyperPod clústeres, en. Usuarios de IAM para la administración de clústeres

  • Adjunte la política de CloudWatchAgentServerPolicy IAM a sus nodos de trabajo. Para ello, introduzca el siguiente comando. my-worker-node-roleSustitúyala por la función de IAM que utilizan tus nodos de trabajo de Kubernetes.

    aws iam attach-role-policy \ --role-name my-worker-node-role \ --policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy

HyperPod Configuración del complemento Amazon CloudWatch Observability EKS

Utilice las siguientes opciones para configurar el complemento Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS.

Setup using the SageMaker AI console

Se requieren los siguientes permisos para configurar y visualizar el panel de control de HyperPod tareas. En esta sección se amplían los permisos que se enumeran enUsuarios de IAM para la administración de clústeres.

Para gestionar la gobernanza de las tareas, utilice la política de ejemplo:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:ListClusters", "sagemaker:DescribeCluster", "sagemaker:ListComputeQuotas", "sagemaker:CreateComputeQuota", "sagemaker:UpdateComputeQuota", "sagemaker:DescribeComputeQuota", "sagemaker:DeleteComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "sagemaker:CreateClusterSchedulerConfig", "sagemaker:UpdateClusterSchedulerConfig", "sagemaker:DeleteClusterSchedulerConfig", "eks:ListAddons", "eks:CreateAddon", "eks:DescribeAddon", "eks:DescribeCluster", "eks:DescribeAccessEntry", "eks:ListAssociatedAccessPolicies", "eks:AssociateAccessPolicy", "eks:DisassociateAccessPolicy" ], "Resource": "*" } ] }

Para conceder permisos para gestionar Amazon CloudWatch Observability Amazon EKS y ver el panel del HyperPod clúster a través de la consola de SageMaker IA, utilice el ejemplo de política que se muestra a continuación:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "eks:ListAddons", "eks:CreateAddon", "eks:UpdateAddon", "eks:DescribeAddon", "eks:DescribeAddonVersions", "sagemaker:DescribeCluster", "sagemaker:DescribeClusterNode", "sagemaker:ListClusterNodes", "sagemaker:ListClusters", "sagemaker:ListComputeQuotas", "sagemaker:DescribeComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "eks:DescribeCluster", "cloudwatch:GetMetricData", "eks:AccessKubernetesApi" ], "Resource": "*" } ] }

Vaya a la pestaña Panel de control de la SageMaker HyperPod consola para instalar Amazon CloudWatch Observability EKS. Para asegurarse de que las métricas relacionadas con la gobernanza de las tareas estén incluidas en el panel, active la casilla de verificación de las métricas de Kueue. Al activar las métricas de Kueue, se activan los costes de CloudWatch Metrics una vez alcanzado el límite del nivel gratuito. Para obtener más información, consulta Métricas en Amazon CloudWatch Pricing.

Setup using the EKS AWS CLI

Usa el siguiente AWS CLI comando EKS para instalar el complemento:

aws eks create-addon --cluster-name cluster-name --addon-name amazon-cloudwatch-observability --configuration-values "configuration json"

A continuación se muestra un ejemplo del JSON de los valores de configuración:

{ "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } } }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }
Setup using the EKS Console UI
  1. Navegue hasta la consola EKS.

  2. Elija su clúster.

  3. Elegir Complementos.

  4. Busque el complemento Amazon CloudWatch Observability e instálelo. Instale la versión >= 2.4.0 del complemento.

  5. Incluya los siguientes valores de configuración de JSON:

    { "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } }, }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }

Una vez que el complemento EKS Observability se haya instalado correctamente, podrá ver las métricas del clúster de EKS en la pestaña del panel de control de la HyperPod consola.