Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Observabilité
Surveillance standard de Kubernetes
Vous pouvez surveiller Spaces à l'aide d'outils Kubernetes standard tels que kubectl describe et logs. kubectl
Surveillance de l'état de l'espace
# List all Spaces with status kubectl get workspace -A # Get detailed information about a specific Space kubectl describe workspace <workspace-name>
Afficher les journaux de l'espace
# View workspace container logs kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace # View SSM agent sidecar logs (for remote IDE connectivity) kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c ssm-agent-sidecar # Follow logs in real-time kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace -f
Comprendre les conditions de l'espace
Les espaces indiquent quatre types de conditions dans leur statut :
-
Disponible :
Truelorsque l'espace est prêt à être utilisé. Toutes les ressources nécessaires (modules, services, stockage) fonctionnent et fonctionnent correctement. -
Progression :
Truelors de la création, de la mise à jour ou du rapprochement de l'espace. Transitionne versFalseune fois stable. -
Dégradé :
Truelorsque des erreurs sont détectées dans les ressources de l'espace. Consultez le message de condition pour plus de détails. -
Arrêté :
Truelorsque le statut Espace souhaité est défini surStopped. Les pods sont fermés mais le stockage et la configuration sont préservés.
CloudWatch Intégration des journaux
Vous pouvez installer le module complémentaire de CloudWatch journalisation pour envoyer les journaux Space à Amazon CloudWatch Logs afin de centraliser la gestion et la conservation des journaux. Cela permet l'agrégation des journaux sur plusieurs clusters et l'intégration avec CloudWatch Insights pour les requêtes et les analyses. Tous les kubectl journaux disponibles ci-dessus peuvent être interrogés CloudWatch avec ce plugin.
Référence : https://docs.aws.amazon.com/sagemaker/ latest/dg/sagemaker- hyperpod-eks-cluster-observability - cluster-cloudwatch-ci .html.
HyperPod Module complémentaire d'observabilité
Le module complémentaire SageMaker HyperPod d'observabilité fournit des tableaux de bord complets pour surveiller l'utilisation des ressources spatiales. Après avoir installé le module complémentaire, vous pouvez consulter l'espace, la mémoire et l'utilisation du processeur dans l'onglet Tâches de la HyperPod console, qui affiche les statistiques dans les tableaux de bord Amazon Managed Grafana.
Référence : https://docs.aws.amazon.com/sagemaker/ latest/dg/sagemaker- hyperpod-observability-addon .html
Principaux indicateurs disponibles :
-
Utilisation du processeur et de la mémoire par espace
-
Métriques du GPU (le cas échéant)