Configuration du tableau de bord
Utilisez les informations suivantes pour configurer le module complémentaire EKS d’observabilité Amazon CloudWatch d’Amazon SageMaker HyperPod. Cela vous permet de disposer d’un tableau de bord visuel détaillé qui fournit une vue des métriques relatives au matériel de votre cluster EKS, à l’allocation des équipes et aux tâches.
Si vous rencontrez des problèmes lors de la configuration, consultez Dépannage pour découvrir les solutions de dépannage connues.
Conditions préalables requises relatives au module complémentaire EKS d’observabilité Amazon CloudWatch d’HyperPod
La section suivante décrit les conditions préalables requises avant d’installer le module complémentaire d’observabilité Amazon EKS.
-
Veillez à disposer de la politique d’autorisation minimale pour les administrateurs de cluster HyperPod, dans Utilisateurs IAM pour l’administrateur de cluster.
-
Attachez la politique IAM CloudWatchAgentServerPolicy à vos composants master. Pour ce faire, entrez la commande suivante. Remplacez my-worker-node-role par le rôle IAM utilisé par vos composants master Kubernetes.
aws iam attach-role-policy \
--role-name my-worker-node-role \
--policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy
Configuration du module complémentaire EKS d’observabilité Amazon CloudWatch d’HyperPod
Utilisez les options suivantes pour configurer le module complémentaire EKS d’observabilité Amazon CloudWatch d’Amazon SageMaker HyperPod.
- Setup using the SageMaker AI console
-
Les autorisations suivantes sont requises pour configurer et visualiser le tableau de bord de gouvernance des tâches HyperPod. Cette section développe les autorisations répertoriées dans Utilisateurs IAM pour l’administrateur de cluster.
Pour gérer la gouvernance des tâches, utilisez l’exemple de politique :
JSON
- JSON
-
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"sagemaker:ListClusters",
"sagemaker:DescribeCluster",
"sagemaker:ListComputeQuotas",
"sagemaker:CreateComputeQuota",
"sagemaker:UpdateComputeQuota",
"sagemaker:DescribeComputeQuota",
"sagemaker:DeleteComputeQuota",
"sagemaker:ListClusterSchedulerConfigs",
"sagemaker:DescribeClusterSchedulerConfig",
"sagemaker:CreateClusterSchedulerConfig",
"sagemaker:UpdateClusterSchedulerConfig",
"sagemaker:DeleteClusterSchedulerConfig",
"eks:ListAddons",
"eks:CreateAddon",
"eks:DescribeAddon",
"eks:DescribeCluster",
"eks:DescribeAccessEntry",
"eks:ListAssociatedAccessPolicies",
"eks:AssociateAccessPolicy",
"eks:DisassociateAccessPolicy"
],
"Resource": "*"
}
]
}
Pour accorder des autorisations permettant de gérer le module Amazon EKS d’observabilité Amazon CloudWatch et de consulter le tableau de bord du cluster HyperPod via la console SageMaker AI, utilisez l’exemple de politique ci-dessous :
JSON
- JSON
-
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"eks:ListAddons",
"eks:CreateAddon",
"eks:UpdateAddon",
"eks:DescribeAddon",
"eks:DescribeAddonVersions",
"sagemaker:DescribeCluster",
"sagemaker:DescribeClusterNode",
"sagemaker:ListClusterNodes",
"sagemaker:ListClusters",
"sagemaker:ListComputeQuotas",
"sagemaker:DescribeComputeQuota",
"sagemaker:ListClusterSchedulerConfigs",
"sagemaker:DescribeClusterSchedulerConfig",
"eks:DescribeCluster",
"cloudwatch:GetMetricData",
"eks:AccessKubernetesApi"
],
"Resource": "*"
}
]
}
Accédez à l’onglet Tableau de bord de la console SageMaker HyperPod pour installer le module EKS d’observabilité Amazon CloudWatch. Pour vous assurer que les métriques liées à la gouvernance des tâches sont incluses dans le tableau de bord, cochez la case des métriques Kueue. L’activation des métriques Kueue active les coûts des métriques CloudWatch, une fois la limite du niveau gratuit atteinte. Pour plus d’informations, consultez Métriques dans Tarification d’Amazon CloudWatch.
- Setup using the EKS AWS CLI
-
Utilisez la commande AWS CLI EKS suivante pour installer le module complémentaire :
aws eks create-addon --cluster-name cluster-name
--addon-name amazon-cloudwatch-observability
--configuration-values "configuration json"
Voici un exemple du code JSON des valeurs de configuration :
{
"agent": {
"config": {
"logs": {
"metrics_collected": {
"kubernetes": {
"kueue_container_insights": true,
"enhanced_container_insights": true
},
"application_signals": { }
}
},
"traces": {
"traces_collected": {
"application_signals": { }
}
}
},
},
}
- Setup using the EKS Console UI
-
-
Accédez à la console EKS.
-
Choisissez votre cluster.
-
Choisissez Modules complémentaires.
-
Recherchez le module complémentaire d’observabilité Amazon CloudWatch et installez-le. Installez la version >= 2.4.0 pour le module complémentaire.
-
Incluez les valeurs de configuration JSON suivantes :
{
"agent": {
"config": {
"logs": {
"metrics_collected": {
"kubernetes": {
"kueue_container_insights": true,
"enhanced_container_insights": true
},
"application_signals": { }
},
},
"traces": {
"traces_collected": {
"application_signals": { }
}
}
},
},
}
Après avoir correctement installé le module complémentaire d’observabilité EKS, vous pouvez consulter les métriques de votre cluster EKS sous l’onglet Tableau de bord de la console HyperPod.