Osservabilità con Amazon CloudWatch - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Osservabilità con Amazon CloudWatch

Usa Amazon CloudWatch Container Insights per raccogliere, aggregare e riepilogare metriche e log dalle applicazioni containerizzate e dai microservizi sul cluster EKS associato a un cluster. HyperPod

Amazon CloudWatch Insights raccoglie parametri per le risorse di calcolo, come CPU, memoria, disco e rete. Container Insights fornisce inoltre informazioni diagnostiche, ad esempio errori di riavvio del container, che consentono di isolare i problemi e risolverli in modo rapido. Puoi anche impostare CloudWatch allarmi sui parametri raccolti da Container Insights.

Per trovare un elenco completo delle metriche, consulta le metriche di Amazon EKS e Kubernetes Container Insights nella Guida per l'utente di Amazon EKS.

CloudWatch Installa Container Insights

Gli utenti amministratori del cluster devono configurare CloudWatch Container Insights seguendo le istruzioni in Installa l' CloudWatch agente utilizzando il componente aggiuntivo Amazon CloudWatch Observability EKS o il grafico Helm nella Guida per l'CloudWatch utente. Per ulteriori informazioni sul componente aggiuntivo Amazon EKS, consulta anche Installa il componente aggiuntivo Amazon CloudWatch Observability EKS nella Guida per l'utente di Amazon EKS.

Una volta completata l'installazione, verifica che il componente aggiuntivo CloudWatch Observability sia visibile nella scheda del componente aggiuntivo del cluster EKS. Il caricamento del dashboard potrebbe richiedere circa un paio di minuti.

Nota

SageMaker HyperPod richiede CloudWatch Insight v2.0.1-eksbuild.1 o successivo.

CloudWatch Observability service card showing status, version, and IAM role information.

Accedi ai log di CloudWatch Container Insights

  1. Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/.

  2. Scegli Log e quindi Gruppi di log.

Quando HyperPod i cluster sono integrati con Amazon CloudWatch Container Insights, puoi accedere ai gruppi di log pertinenti nel seguente formato:/aws/containerinsights /<eks-cluster-name>/*. All'interno di questo gruppo di log, puoi trovare ed esplorare vari tipi di log come i log delle prestazioni, i log degli host, i log delle applicazioni e i log del piano dati.