Osservabilità - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Osservabilità

Monitoraggio standard di Kubernetes

Puoi monitorare Spaces utilizzando strumenti Kubernetes standard come description e logs. kubectl kubectl

Monitoraggio dello stato dello spazio

# List all Spaces with status kubectl get workspace -A # Get detailed information about a specific Space kubectl describe workspace <workspace-name>

Visualizzazione dei registri spaziali

# View workspace container logs kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace # View SSM agent sidecar logs (for remote IDE connectivity) kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c ssm-agent-sidecar # Follow logs in real-time kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace -f

Comprensione delle condizioni dello spazio

Gli spazi riportano quattro tipi di condizioni nel loro stato:

  • Disponibile: True quando lo spazio è pronto per l'uso. Tutte le risorse richieste (pod, servizi, storage) sono funzionanti e integre.

  • Progressione: True quando lo Spazio viene creato, aggiornato o riconciliato. Passa a una volta stabile. False

  • Degradato: True quando vengono rilevati errori nelle risorse spaziali. Controlla il messaggio sulla condizione per i dettagli.

  • Interrotto: True quando lo stato desiderato di Space è impostato suStopped. I pod vengono terminati ma l'archiviazione e la configurazione vengono preservate.

CloudWatch Integrazione dei log

Puoi installare il componente aggiuntivo di CloudWatch registrazione per inviare i log di Space ad Amazon CloudWatch Logs per la gestione e la conservazione centralizzate dei log. Ciò consente l'aggregazione dei log su più cluster e l'integrazione con Insights per l'interrogazione e l'analisi. CloudWatch Tutti i kubectl log sopra disponibili possono essere interrogati con questo plugin. CloudWatch

Riferimento: https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker- - .html hyperpod-eks-cluster-observability. cluster-cloudwatch-ci

HyperPod Componente aggiuntivo Observability

Il componente aggiuntivo SageMaker HyperPod Observability fornisce dashboard completi per il monitoraggio dell'utilizzo delle risorse spaziali. Dopo aver installato il componente aggiuntivo, puoi visualizzare lo spazio, la memoria e l'utilizzo della CPU nella scheda Attività della HyperPod console, che mostra le metriche nelle dashboard di Amazon Managed Grafana.

Riferimento: - .html https://docs.aws.amazon.com/sagemaker/ latest/dg/sagemaker hyperpod-observability-addon

Metriche chiave disponibili:

  • Utilizzo della CPU e della memoria per spazio

  • Metriche della GPU (se applicabile)