Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Osservabilità
Monitoraggio standard di Kubernetes
Puoi monitorare Spaces utilizzando strumenti Kubernetes standard come description e logs. kubectl kubectl
Monitoraggio dello stato dello spazio
# List all Spaces with status kubectl get workspace -A # Get detailed information about a specific Space kubectl describe workspace <workspace-name>
Visualizzazione dei registri spaziali
# View workspace container logs kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace # View SSM agent sidecar logs (for remote IDE connectivity) kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c ssm-agent-sidecar # Follow logs in real-time kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace -f
Comprensione delle condizioni dello spazio
Gli spazi riportano quattro tipi di condizioni nel loro stato:
-
Disponibile:
Truequando lo spazio è pronto per l'uso. Tutte le risorse richieste (pod, servizi, storage) sono funzionanti e integre. -
Progressione:
Truequando lo Spazio viene creato, aggiornato o riconciliato. Passa a una volta stabile.False -
Degradato:
Truequando vengono rilevati errori nelle risorse spaziali. Controlla il messaggio sulla condizione per i dettagli. -
Interrotto:
Truequando lo stato desiderato di Space è impostato suStopped. I pod vengono terminati ma l'archiviazione e la configurazione vengono preservate.
CloudWatch Integrazione dei log
Puoi installare il componente aggiuntivo di CloudWatch registrazione per inviare i log di Space ad Amazon CloudWatch Logs per la gestione e la conservazione centralizzate dei log. Ciò consente l'aggregazione dei log su più cluster e l'integrazione con Insights per l'interrogazione e l'analisi. CloudWatch Tutti i kubectl log sopra disponibili possono essere interrogati con questo plugin. CloudWatch
Riferimento: https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker- - .html hyperpod-eks-cluster-observability. cluster-cloudwatch-ci
HyperPod Componente aggiuntivo Observability
Il componente aggiuntivo SageMaker HyperPod Observability fornisce dashboard completi per il monitoraggio dell'utilizzo delle risorse spaziali. Dopo aver installato il componente aggiuntivo, puoi visualizzare lo spazio, la memoria e l'utilizzo della CPU nella scheda Attività della HyperPod console, che mostra le metriche nelle dashboard di Amazon Managed Grafana.
Metriche chiave disponibili:
-
Utilizzo della CPU e della memoria per spazio
-
Metriche della GPU (se applicabile)