Observabilidade com a Amazon CloudWatch - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Observabilidade com a Amazon CloudWatch

Use o Amazon CloudWatch Container Insights para coletar, agregar e resumir métricas e registros dos aplicativos e microsserviços em contêineres no cluster EKS associado a um cluster. HyperPod

O Amazon CloudWatch Insights coleta métricas para recursos computacionais, como CPU, memória, disco e rede. O Container Insights também fornece informações de diagnóstico, como falhas de reinicialização de contêiner, para ajudar a isolar problemas e resolvê-los rapidamente. Você também pode definir CloudWatch alarmes nas métricas que o Container Insights coleta.

Para encontrar uma lista completa de métricas, consulte as Métricas do Amazon EKS e do Kubernetes Container Insights no Guia do usuário do Amazon EKS.

Instale CloudWatch Container Insights

Os usuários administradores do cluster devem configurar o CloudWatch Container Insights seguindo as instruções em Instalar o CloudWatch agente usando o complemento Amazon CloudWatch Observability EKS ou o gráfico Helm no Guia do CloudWatch usuário. Para obter mais informações sobre o complemento Amazon EKS, consulte também Instalar o complemento Amazon CloudWatch Observability EKS no Guia do usuário do Amazon EKS.

Depois que a instalação for concluída, verifique se o complemento CloudWatch Observability está visível na guia do complemento do cluster EKS. Pode levar alguns minutos até que o painel seja carregado.

nota

SageMaker HyperPod requer o CloudWatch Insight v2.0.1-eksbuild.1 ou posterior.

Acesse registros de insights de CloudWatch contêineres

  1. Abra o CloudWatch console em https://console.aws.amazon.com/cloudwatch/.

  2. Escolha Logs e depois escolha Grupo de logs.

Quando você tem os HyperPod clusters integrados ao Amazon CloudWatch Container Insights, você pode acessar os grupos de log relevantes no seguinte formato:/aws/containerinsights /<eks-cluster-name>/*. Nesse grupo de logs, você pode encontrar e explorar vários tipos de logs, como logs de desempenho, logs de host, logs de aplicações e logs do plano de dados.