Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Osservabilità per SageMaker HyperPod cluster Amazon orchestrata da Amazon EKS
Per ottenere un'osservabilità completa nelle risorse e nei componenti software del cluster Amazon SageMaker HyperPod (SageMaker HyperPod), integra il cluster con Amazon CloudWatch Container Insights, AmazonManaged Service for Prometheus e Amazon Managed Grafana. Questi strumenti forniscono visibilità sullo stato del cluster, sulle metriche prestazionali e sull'utilizzo delle risorse.
L'integrazione con Amazon Managed Service for Prometheus consente l'esportazione di metriche relative alle HyperPod risorse del cluster, fornendo informazioni sulle loro prestazioni, utilizzo e integrità. L'integrazione con Amazon Managed Grafana consente la visualizzazione di queste metriche attraverso varie dashboard Grafana che offrono un'interfaccia intuitiva per il monitoraggio e l'analisi del comportamento del cluster. Sfruttando questi servizi, ottieni una visione centralizzata e unificata del HyperPod cluster, facilitando il monitoraggio proattivo, la risoluzione dei problemi e l'ottimizzazione dei carichi di lavoro di formazione distribuiti.
Nota
Mentre CloudWatch Amazon Managed Service for Prometheus e Amazon Managed Grafana si concentrano sulle metriche operative (ad esempio, lo stato del sistema, la formazione, le prestazioni lavorative SageMaker HyperPod ), i report sull'utilizzo completano la Task Governance per fornire informazioni sulla responsabilità finanziaria e delle risorse. Questi report tengono traccia di:
-
Utilizzo del calcolo (GPU/CPU/Neuron Core hours) across namespaces/teams
-
Attribuzione dei costi per le risorse allocate rispetto a quelle prese in prestito
-
Tendenze storiche (fino a 180 giorni) per il controllo e l'ottimizzazione
Per ulteriori informazioni sulla configurazione e la generazione di report sull'utilizzo, consulta Reporting Compute Usage in. HyperPod
Suggerimento
Per trovare esempi e soluzioni pratiche, consulta anche la sezione Osservabilità
Passa ai seguenti argomenti per configurare l'osservabilità dei SageMaker HyperPod cluster.