Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Configuration du tableau de bord
Utilisez les informations suivantes pour configurer le module complémentaire Amazon  SageMaker  HyperPod  Amazon  CloudWatch Observability EKS. Cela vous permet de disposer d'un tableau de bord visuel détaillé qui fournit une vue des métriques relatives au matériel de votre cluster EKS, à la répartition des équipes et aux tâches.
Si vous rencontrez des problèmes lors de la configuration, consultez Dépannage les solutions de dépannage connues.
                HyperPod Conditions préalables requises pour le module complémentaire Amazon  CloudWatch Observability EKS
                La section suivante décrit les conditions requises avant d'installer le module complémentaire Amazon EKS Observability.
                
                     
                     
                - 
                        Assurez-vous que vous disposez de la politique d'autorisation minimale pour les administrateurs de  HyperPod  cluster, dansUtilisateurs IAM pour l'administrateur du cluster. 
- 
                        Attachez la politique CloudWatchAgentServerPolicyIAM à vos nœuds de travail. Pour ce faire, entrez la commande suivante.my-worker-node-role
 aws iam attach-role-policy \
--role-name my-worker-node-role\
--policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy
 
 
             
                HyperPod Configuration du module complémentaire Amazon  CloudWatch Observability EKS
                Utilisez les options suivantes pour configurer le module complémentaire Amazon  SageMaker  HyperPod  Amazon  CloudWatch Observability EKS.
                
                    - Setup using the SageMaker AI console
- 
                            Les autorisations suivantes sont requises pour configurer et visualiser le tableau de bord de gouvernance des  HyperPod  tâches. Cette section développe les autorisations répertoriées dansUtilisateurs IAM pour l'administrateur du cluster.  Pour gérer la gouvernance des tâches, utilisez l'exemple de politique : JSON - JSON
- 
     
- 
        
- 
             
                
                {
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "sagemaker:ListClusters",
                "sagemaker:DescribeCluster",
                "sagemaker:ListComputeQuotas",
                "sagemaker:CreateComputeQuota",
                "sagemaker:UpdateComputeQuota",
                "sagemaker:DescribeComputeQuota",
                "sagemaker:DeleteComputeQuota",
                "sagemaker:ListClusterSchedulerConfigs",
                "sagemaker:DescribeClusterSchedulerConfig",
                "sagemaker:CreateClusterSchedulerConfig",
                "sagemaker:UpdateClusterSchedulerConfig",
                "sagemaker:DeleteClusterSchedulerConfig",
                "eks:ListAddons",
                "eks:CreateAddon",
                "eks:DescribeAddon",
                "eks:DescribeCluster",
                "eks:DescribeAccessEntry",
                "eks:ListAssociatedAccessPolicies",
                "eks:AssociateAccessPolicy",
                "eks:DisassociateAccessPolicy"
            ],
            "Resource": "*"
        }
    ]
}
 
 
 
 
Pour accorder des autorisations permettant de gérer Amazon  CloudWatch  Observability Amazon EKS et de consulter le tableau de bord du  HyperPod  cluster via la console  SageMaker  AI, utilisez l'exemple de politique ci-dessous : JSON - JSON
- 
     
- 
        
- 
             
                
                {
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "eks:ListAddons",
                "eks:CreateAddon",
                "eks:UpdateAddon",
                "eks:DescribeAddon",
                "eks:DescribeAddonVersions",
                "sagemaker:DescribeCluster",
                "sagemaker:DescribeClusterNode",
                "sagemaker:ListClusterNodes",
                "sagemaker:ListClusters",
                "sagemaker:ListComputeQuotas",
                "sagemaker:DescribeComputeQuota",
                "sagemaker:ListClusterSchedulerConfigs",
                "sagemaker:DescribeClusterSchedulerConfig",
                "eks:DescribeCluster",
                "cloudwatch:GetMetricData",
                "eks:AccessKubernetesApi"
            ],
            "Resource": "*"
        }
    ]
}
 
 
 
 
Accédez à l'onglet Tableau de bord de la  SageMaker  HyperPod  console pour installer Amazon  CloudWatch  Observability EKS. Pour vous assurer que les métriques liées à la gouvernance des tâches sont incluses dans le tableau de bord, cochez la case Kueue metrics. L'activation des métriques Kueue permet d'augmenter  CloudWatch les coûts des métriques, une fois la limite du niveau gratuit atteinte. Pour plus d'informations, consultez la section Mesures dans Amazon  CloudWatch Pricing. 
- Setup using the EKS AWS CLI
- 
                            Utilisez la AWS CLI commande EKS suivante pour installer le module complémentaire : aws eks create-addon --cluster-name cluster-name--addon-name amazon-cloudwatch-observability 
--configuration-values "configuration json"
 Vous trouverez ci-dessous un exemple du JSON des valeurs de configuration : {
    "agent": {
        "config": {
            "logs": {
                "metrics_collected": {
                    "kubernetes": {
                        "kueue_container_insights": true,
                        "enhanced_container_insights": true
                    },
                    "application_signals": { }
                }
            },
            "traces": {
                "traces_collected": {
                    "application_signals": { }
                }
            }
        },
    },
}
 
- Setup using the EKS Console UI
- 
                            - 
                                    Accédez à la console EKS. 
- 
                                    Choisissez votre cluster. 
- 
                                    Choisissez Modules complémentaires. 
- 
                                    Trouvez le module complémentaire Amazon  CloudWatch  Observability et installez-le. Installez la version >= 2.4.0 pour le module complémentaire.  
- 
                                    Incluez les valeurs de configuration JSON suivantes : {
    "agent": {
        "config": {
            "logs": {
                "metrics_collected": {
                    "kubernetes": {
                        "kueue_container_insights": true,
                        "enhanced_container_insights": true
                    },
                    "application_signals": { }
                },
            },
            "traces": {
                "traces_collected": {
                    "application_signals": { }
                }
            }
        },
    },
}
 
 
Une fois le module complémentaire EKS Observability installé avec succès, vous pouvez consulter les métriques de votre cluster EKS sous l'onglet Tableau de bord de la  HyperPod  console.