Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Einrichtung des Dashboards
Verwenden Sie die folgenden Informationen, um das Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS-Add-on einzurichten. Auf diese Weise steht Ihnen ein detailliertes visuelles Dashboard zur Verfügung, das einen Überblick über die Kennzahlen Ihrer EKS-Cluster-Hardware, Teamzuweisung und Aufgaben bietet.
Falls Sie Probleme bei der Einrichtung haben, finden Fehlerbehebung Sie hier bekannte Lösungen zur Problembehebung.
HyperPod Voraussetzungen für das Amazon CloudWatch Observability EKS-Add-on
Der folgende Abschnitt enthält die Voraussetzungen, die für die Installation des Amazon EKS Observability-Add-ons erforderlich sind.
-
Stellen Sie sicher, dass Sie über die Mindestberechtigungsrichtlinie für HyperPod Clusteradministratoren verfügen, unterIAM-Benutzer für den Cluster-Administrator.
-
Hängen Sie die CloudWatchAgentServerPolicy
IAM-Richtlinie an Ihre Worker-Knoten an. Geben Sie dazu den folgenden Befehl ein. my-worker-node-role
Ersetzen Sie sie durch die IAM-Rolle, die von Ihren Kubernetes-Worker-Knoten verwendet wird.
aws iam attach-role-policy \
--role-name my-worker-node-role
\
--policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy
HyperPod Einrichtung des Amazon CloudWatch Observability EKS-Add-ons
Verwenden Sie die folgenden Optionen, um das Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS-Add-on einzurichten.
- Setup using the SageMaker AI console
-
Die folgenden Berechtigungen sind für die Einrichtung und Visualisierung des HyperPod Task-Governance-Dashboards erforderlich. In diesem Abschnitt werden die unter aufgeführten Berechtigungen erweitert. IAM-Benutzer für den Cluster-Administrator
Verwenden Sie die Beispielrichtlinie, um die Task-Governance zu verwalten:
JSON
- JSON
-
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"sagemaker:ListClusters",
"sagemaker:DescribeCluster",
"sagemaker:ListComputeQuotas",
"sagemaker:CreateComputeQuota",
"sagemaker:UpdateComputeQuota",
"sagemaker:DescribeComputeQuota",
"sagemaker:DeleteComputeQuota",
"sagemaker:ListClusterSchedulerConfigs",
"sagemaker:DescribeClusterSchedulerConfig",
"sagemaker:CreateClusterSchedulerConfig",
"sagemaker:UpdateClusterSchedulerConfig",
"sagemaker:DeleteClusterSchedulerConfig",
"eks:ListAddons",
"eks:CreateAddon",
"eks:DescribeAddon",
"eks:DescribeCluster",
"eks:DescribeAccessEntry",
"eks:ListAssociatedAccessPolicies",
"eks:AssociateAccessPolicy",
"eks:DisassociateAccessPolicy"
],
"Resource": "*"
}
]
}
Verwenden Sie die folgende Beispielrichtlinie, um Berechtigungen zur Verwaltung von Amazon CloudWatch Observability Amazon EKS und zur Anzeige des HyperPod Cluster-Dashboards über die SageMaker KI-Konsole zu erteilen:
JSON
- JSON
-
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"eks:ListAddons",
"eks:CreateAddon",
"eks:UpdateAddon",
"eks:DescribeAddon",
"eks:DescribeAddonVersions",
"sagemaker:DescribeCluster",
"sagemaker:DescribeClusterNode",
"sagemaker:ListClusterNodes",
"sagemaker:ListClusters",
"sagemaker:ListComputeQuotas",
"sagemaker:DescribeComputeQuota",
"sagemaker:ListClusterSchedulerConfigs",
"sagemaker:DescribeClusterSchedulerConfig",
"eks:DescribeCluster",
"cloudwatch:GetMetricData",
"eks:AccessKubernetesApi"
],
"Resource": "*"
}
]
}
Navigieren Sie in der SageMaker HyperPod Konsole zur Registerkarte Dashboard, um Amazon CloudWatch Observability EKS zu installieren. Um sicherzustellen, dass Kennzahlen zur Task-Governance im Dashboard enthalten sind, aktivieren Sie das Kontrollkästchen Warteschlangen-Metriken. Wenn Sie die Kueue-Metriken aktivieren, werden Metrik-Kosten aktiviert CloudWatch, sobald das Limit für das kostenlose Nutzungskontingent erreicht ist. Weitere Informationen finden Sie unter Kennzahlen in der CloudWatchAmazon-Preisgestaltung.
- Setup using the EKS AWS CLI
-
Verwenden Sie den folgenden AWS CLI EKS-Befehl, um das Add-on zu installieren:
aws eks create-addon --cluster-name cluster-name
--addon-name amazon-cloudwatch-observability
--configuration-values "configuration json
"
Im Folgenden finden Sie ein Beispiel für das JSON der Konfigurationswerte:
{
"agent": {
"config": {
"logs": {
"metrics_collected": {
"kubernetes": {
"kueue_container_insights": true,
"enhanced_container_insights": true
},
"application_signals": { }
}
},
"traces": {
"traces_collected": {
"application_signals": { }
}
}
},
},
}
- Setup using the EKS Console UI
-
-
Navigieren Sie zur EKS-Konsole.
-
Wählen Sie Ihren Cluster aus.
-
Wählen Sie Add-Ons.
-
Suchen Sie das Amazon CloudWatch Observability-Add-on und installieren Sie es. Installieren Sie Version >= 2.4.0 für das Add-on.
-
Fügen Sie die folgenden JSON-Konfigurationswerte hinzu:
{
"agent": {
"config": {
"logs": {
"metrics_collected": {
"kubernetes": {
"kueue_container_insights": true,
"enhanced_container_insights": true
},
"application_signals": { }
},
},
"traces": {
"traces_collected": {
"application_signals": { }
}
}
},
},
}
Sobald das EKS-Observability-Add-on erfolgreich installiert wurde, können Sie Ihre EKS-Cluster-Metriken auf der Registerkarte Dashboard der HyperPod Konsole einsehen.