

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Monitoramento no Amazon EKS
<a name="monitoring"></a>

O monitoramento no Amazon EKS fornece visibilidade crítica sobre a integridade, o desempenho e a segurança de suas cargas de trabalho do Kubernetes. Sem o monitoramento adequado, você corre o risco de interrupções no serviço, violações de segurança e utilização ineficiente de recursos que podem afetar as operações comerciais e aumentar os custos. O monitoramento eficaz permite que você identifique e resolva problemas de forma proativa, otimize o uso de recursos e mantenha os requisitos de conformidade em seus aplicativos em contêineres. Ao implementar soluções de monitoramento abrangentes, você pode garantir alta disponibilidade, detectar anomalias precocemente e tomar decisões baseadas em dados para escalar e melhorar sua infraestrutura do Amazon EKS.

Esta seção explora os vários aspectos do monitoramento do Amazon EKS, incluindo diferentes tipos de monitoramento, ferramentas disponíveis e melhores práticas para ajudá-lo a criar uma estratégia de monitoramento robusta para seu ambiente Kubernetes.

**Topics**
+ [Tipos de monitoramento](monitoring-types.md)
+ [Ferramentas](monitoring-tools.md)
+ [Implementando alta disponibilidade](monitoring-ha-setup.md)
+ [Práticas recomendadas](monitoring-best-practices.md)
+ [Considerações avançadas](monitoring-considerations.md)

# Tipos de monitoramento no Amazon EKS
<a name="monitoring-types"></a>

A observabilidade efetiva no Amazon EKS envolve atividades de monitoramento de infraestrutura, aplicativos e segurança.

## Monitoramento da infraestrutura
<a name="infrastructure"></a>

O monitoramento da infraestrutura é um componente fundamental da observabilidade do Amazon EKS, que fornece insights profundos sobre a integridade e o desempenho dos elementos fundamentais do seu cluster Kubernetes. Basicamente, envolve rastrear os sinais vitais dos componentes do plano de controle e dos nós de trabalho e garantir que a plataforma subjacente permaneça estável e eficiente.
+ O **monitoramento do plano de controle** é crucial porque supervisiona os principais componentes, como o servidor de API, o banco de dados etcd e o agendador. Ao monitorar a latência do servidor da API, você pode identificar rapidamente os gargalos de desempenho que podem afetar as implantações de aplicativos ou as operações de escalabilidade. O monitoramento de desempenho do Etcd valida se o banco de dados de estado do cluster opera com eficiência e evita problemas de consistência de dados que podem afetar todo o cluster.
+ O **monitoramento em nível de nó** é igualmente essencial porque se concentra nos recursos computacionais que executam suas cargas de trabalho em contêineres. Isso inclui rastrear a utilização da CPU, o consumo de memória, a E/S de disco e o desempenho da rede em todos os nós de trabalho. A compreensão dessas métricas ajuda a evitar o esgotamento de recursos, otimizar as decisões de escalonamento de nós e garantir o planejamento adequado da capacidade.
+ O **monitoramento de rede** desempenha um papel vital na manutenção da comunicação confiável entre pods, serviços e recursos externos. Ao monitorar a taxa de transferência, a latência e os estados de conexão da rede, você pode identificar problemas de conectividade com antecedência e garantir uma comunicação fluida com os aplicativos. O monitoramento do armazenamento complementa o monitoramento da rede rastreando o desempenho do volume, a utilização da capacidade e I/O os padrões, para ajudar a evitar gargalos relacionados aos dados.

O monitoramento da infraestrutura serve como um sistema de alerta antecipado para possíveis problemas, permite a manutenção proativa e garante a alocação ideal de recursos. Sem um monitoramento robusto da infraestrutura, você corre o risco de tempo de inatividade inesperado, desempenho degradado e uso ineficiente de recursos que podem afetar significativamente as operações e os custos dos negócios.

## Monitoramento de aplicações
<a name="application"></a>

O monitoramento de aplicativos é essencial para manter aplicativos em contêineres saudáveis, com desempenho e confiabilidade em seu ambiente Amazon EKS. Esse nível de monitoramento se concentra nas cargas de trabalho reais que são executadas em seu cluster e fornece informações essenciais sobre como seus aplicativos se comportam, funcionam e interagem com outros serviços.

O monitoramento de aplicativos inclui monitoramento em nível de contêiner, monitoramento em nível de serviço e rastreamento distribuído.
+ No **nível do contêiner**, o monitoramento de aplicativos rastreia métricas cruciais, como status de integridade do contêiner, contagens de reinicializações e padrões de consumo de recursos. Essas métricas ajudam a identificar contêineres problemáticos que podem estar consumindo recursos excessivos ou enfrentando reinicializações frequentes, o que pode indicar problemas subjacentes, como vazamentos de memória ou problemas de configuração. Ao monitorar os eventos do ciclo de vida do contêiner, você pode garantir o comportamento adequado do aplicativo e solucionar rapidamente os problemas de implantação.
+ O **monitoramento em nível de serviço** fornece visibilidade das métricas de desempenho e confiabilidade do aplicativo, como tempos de resposta, taxas de erro e taxa de transferência de solicitações. Essas métricas são vitais para manter os objetivos de nível de serviço (SLOs) e garantir uma experiência positiva para o usuário final. Você pode monitorar a latência em diferentes endpoints de serviço, identificar gargalos de desempenho e monitorar padrões de erro para manter a confiabilidade do aplicativo.
+ O **rastreamento distribuído** é outro aspecto crítico do monitoramento de aplicativos, especialmente em arquiteturas de microsserviços. Ao implementar o rastreamento, você pode acompanhar as solicitações à medida que elas fluem por diferentes serviços, entender as dependências e identificar gargalos de desempenho. Essa end-to-end visibilidade ajuda você a otimizar as interações de serviço e solucionar problemas complexos que abrangem vários componentes.

As métricas personalizadas de aplicativos desempenham um papel crucial no fornecimento de insights específicos de negócios. Isso pode incluir métricas como taxas de processamento de pedidos, frequências de login de usuários ou taxas de sucesso de transações. Você pode correlacionar essas métricas personalizadas com métricas de infraestrutura e contêiner para entender melhor como o desempenho da infraestrutura afeta as operações comerciais e tomar decisões baseadas em dados para escalabilidade e otimização.

A importância do monitoramento de aplicativos está em sua capacidade de fornecer uma visão abrangente da integridade e do desempenho dos aplicativos. Esse monitoramento permite que você mantenha a alta qualidade do serviço, resolva problemas rapidamente e otimize continuamente seus aplicativos para atender aos objetivos de negócios.

## Monitoramento de segurança
<a name="security"></a>

O monitoramento de segurança no Amazon EKS é uma atividade crítica que ajuda as organizações a manter a integridade, a confidencialidade e a conformidade de seus ambientes Kubernetes. Essa abordagem de segurança abrangente combina vigilância contínua, detecção de ameaças e monitoramento de conformidade para proteger cargas de trabalho em contêineres contra possíveis riscos de segurança e acesso não autorizado. Inclui monitoramento de autenticação e autorização, monitoramento de segurança de rede e monitoramento de configuração e conformidade.
+ O **monitoramento de autenticação e autorização** forma a primeira linha de defesa ao rastrear todas as tentativas de acessar o cluster. Isso inclui monitorar solicitações do servidor de API, rastrear tentativas de login bem-sucedidas e malsucedidas e auditar alterações no controle de acesso baseado em função (RBAC). Ao manter registros de auditoria detalhados de quem acessou quais recursos e quando, você pode detectar rapidamente possíveis violações de segurança, tentativas de acesso não autorizado ou atividades de escalonamento de privilégios. Isso é particularmente crucial em ambientes com vários inquilinos, onde manter controles de acesso rígidos é essencial.
+ O **monitoramento da segurança de rede** se concentra em detectar e impedir a comunicação não autorizada entre pods e serviços. Ao monitorar violações de políticas de rede e padrões de tráfego incomuns, você pode identificar possíveis ameaças à segurança, como tentativas de fuga de contêineres ou movimentação lateral dentro do cluster. Isso inclui rastrear a comunicação interna do cluster e os padrões de tráfego externo para garantir que os contêineres se comuniquem somente com endpoints autorizados e sigam as políticas de segurança definidas.
+ O **monitoramento da configuração e da conformidade** é essencial para manter as linhas de base de segurança e atender aos requisitos regulatórios. Ela envolve a varredura contínua de imagens de contêineres em busca de vulnerabilidades, o monitoramento da segurança do tempo de execução e o rastreamento de alterações na configuração que possam afetar a postura de segurança. As auditorias regulares de conformidade garantem a adesão aos padrões do setor e às políticas de segurança organizacionais, e a detecção de desvios de configuração ajuda a evitar alterações não autorizadas que podem introduzir riscos à segurança.

O monitoramento de segurança no Amazon EKS fornece a visibilidade e o controle necessários para ajudar a proteger contra ameaças de segurança modernas e, ao mesmo tempo, garantir a conformidade com os requisitos regulatórios. Ao implementar um monitoramento de segurança abrangente, sua organização pode manter uma postura de segurança forte, responder rapidamente a incidentes de segurança e demonstrar conformidade com vários padrões regulatórios.

# Ferramentas de monitoramento para Amazon EKS
<a name="monitoring-tools"></a>

Esta seção discute três categorias de ferramentas de monitoramento do Amazon EKS: serviços de AWS monitoramento, soluções de código aberto ou proprietárias e ferramentas especializadas.

## AWS serviços
<a name="monitoring-services"></a>
+ [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html): serviço abrangente de monitoramento e registro

  CloudWatch forma a espinha dorsal das soluções de AWS monitoramento e fornece recursos abrangentes para ambientes Amazon EKS. Ele fornece o Container Insights para métricas granulares de contêineres e clusters, para que você possa monitorar o desempenho, a utilização de recursos e a integridade do aplicativo. O serviço é excelente em agregação e análise de registros e oferece suporte ao registro centralizado em contêineres e nós. CloudWatch se integra naturalmente com Serviços da AWS. Ele fornece configuração automática de alarmes e oferece suporte a métricas e painéis personalizados, o que o torna uma ferramenta essencial para o monitoramento do Amazon EKS.
+ [AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html): Plataforma avançada de rastreamento distribuído

  O X-Ray aumenta a observabilidade ao fornecer recursos sofisticados de rastreamento distribuído. Sua visualização do mapa de serviços oferece uma visão clara sobre a arquitetura e as dependências do aplicativo, e o rastreamento detalhado de solicitações ajuda a identificar gargalos de desempenho em todos os serviços. O X-Ray pode rastrear solicitações por meio de arquiteturas complexas de microsserviços, o que o torna inestimável para solução de problemas e otimização, especialmente em sistemas distribuídos que abrangem vários. Serviços da AWS
+ [AWS Distro para OpenTelemetry: estrutura](https://aws-otel.github.io/) unificada de observabilidade

  O Distro for OpenTelemetry fornece recursos unificados de coleta de dados com suporte multiplataforma, o que o torna ideal para ambientes híbridos. Esse serviço se integra a outros Serviços da AWS, oferece suporte a instrumentação personalizada e oferece flexibilidade na implementação de soluções abrangentes de monitoramento, mantendo a compatibilidade com os padrões do setor.
+ [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html): visualização de nível corporativo

  O Amazon Managed Grafana fornece um serviço totalmente gerenciado para visualização e análise de dados. Ele oferece integração perfeita com outros Serviços da AWS recursos de segurança integrados e escalabilidade de nível corporativo. O serviço simplifica a criação e o gerenciamento do painel, ao mesmo tempo em que fornece recursos avançados, como acesso a fontes de dados entre contas e integração com. Centro de Identidade do AWS IAM
+ [Amazon Managed Service para Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html): monitoramento gerenciado, seguro e altamente disponível

  O Amazon Managed Service for Prometheus é um serviço de monitoramento totalmente gerenciado e compatível com o Prometheus. Ele fornece escalabilidade automatizada, alta disponibilidade e ingestão e consulta seguras de métricas. O serviço se integra perfeitamente ao Amazon EKS e elimina a sobrecarga operacional do gerenciamento dos servidores Prometheus.

## Soluções de código aberto ou proprietárias
<a name="monitoring-open-source"></a>

As AWS ferramentas descritas na seção anterior oferecem integração perfeita e serviços gerenciados. As ferramentas de código aberto listadas nesta seção complementam Serviços da AWS fornecendo flexibilidade e amplas opções de personalização. Compreender os recursos e os casos de uso de cada ferramenta ajuda você a projetar estratégias de monitoramento que melhor atendam aos seus requisitos específicos.
+ [Prometheus](https://docs.aws.amazon.com/eks/latest/userguide/deploy-prometheus.html): kit de ferramentas de coleta de métricas

  O Prometheus é uma solução de código aberto para coleta de métricas em ambientes Kubernetes. Seu banco de dados de séries temporais e a linguagem de consulta PromQL permitem análises métricas sofisticadas. Os recursos de descoberta de serviços da plataforma se adaptam automaticamente aos ambientes dinâmicos do Kubernetes, e seu sistema de gerenciamento de alertas mantém você informado sobre problemas críticos. O Prometheus oferece amplas opções de integração, o que o torna uma opção versátil para monitoramento abrangente de métricas.
+ [Grafana: mecanismo](https://grafana.com/docs/grafana-cloud/monitor-infrastructure/kubernetes-monitoring/configuration/config-other-methods/config-aws-eks/) de visualização avançado

  A Grafana transforma dados de monitoramento complexos em insights acionáveis por meio de seus recursos de visualização. A plataforma cria painéis personalizados que combinam dados de várias fontes e fornecem uma visão unificada das métricas de infraestrutura e aplicativos. Seu suporte para várias fontes de dados e recursos de gerenciamento de alertas fornecem monitoramento abrangente. O Grafana pode ajudá-lo a visualizar dados históricos e em tempo real, para que você possa identificar tendências e tomar decisões informadas.
+ [Fluent Bit](https://fluentbit.io/): camada de registro unificada

  Essa solução de registro fornece coleta e gerenciamento de registros para ambientes Kubernetes. Sua integração nativa com o Kubernetes garante a coleta perfeita de registros de contêineres e nós, e seu suporte para vários destinos de saída oferece flexibilidade no armazenamento e análise de registros. Recursos avançados, como análise e filtragem de registros, permitem processar e rotear registros com base em requisitos específicos. A natureza leve do Fluent Bit o torna particularmente adequado para ambientes em contêineres.
+ [Datadog](https://www.datadoghq.com/blog/eks-monitoring-datadog/): observabilidade em pilha completa

  O Datadog fornece recursos abrangentes de monitoramento com suporte nativo ao Kubernetes. Ele oferece monitoramento de infraestrutura, monitoramento de desempenho de aplicativos (APM), gerenciamento de registros e análises em tempo real. Você pode usar a descoberta automática de serviços e o extenso catálogo de integração da plataforma para o monitoramento do Amazon EKS e seus recursos de aprendizado de máquina para detectar anomalias e prever possíveis problemas.
+ [New Relic: monitoramento](https://docs.newrelic.com/docs/infrastructure/amazon-integrations/connect/eks-add-on/) do desempenho de aplicativos

  A New Relic oferece visibilidade do desempenho do aplicativo e da integridade da infraestrutura. Sua integração com o Kubernetes fornece informações detalhadas sobre contêineres, rastreamento distribuído e painéis personalizados. A plataforma ajuda você a correlacionar o desempenho do aplicativo com as métricas da infraestrutura, para que você possa identificar e resolver problemas rapidamente.
+ [Elastic Stack (ELK Stack)](https://aws.amazon.com/opensearch-service/resources/the-benefits-of-the-elk-stack/): análise e pesquisa de registros

  O ELK Stack combina Elasticsearch, Logstash e Kibana para fornecer recursos de gerenciamento e análise de registros. Ele oferece funcionalidade avançada de pesquisa, ferramentas de visualização e recursos de aprendizado de máquina. Você pode usar a pilha para lidar com grandes volumes de dados de log de seus ambientes Amazon EKS.

## Ferramentas especializadas
<a name="monitoring-special"></a>

Você pode combinar as seguintes ferramentas com base em seus requisitos específicos de monitoramento, escala de operações e preferências organizacionais. A chave é criar uma pilha de monitoramento que forneça visibilidade abrangente e, ao mesmo tempo, permaneça gerenciável e econômica.
+ [kube-state-metrics (KSM): monitoramento](https://github.com/kubernetes/kube-state-metrics) do estado do Kubernetes

  Esse serviço complementar escuta o servidor da API Kubernetes e gera métricas sobre o estado dos objetos. Ele fornece informações sobre a integridade das implantações, pods e outros recursos do Kubernetes.
+ [Kubernetes Metrics Server: métricas](https://docs.aws.amazon.com/eks/latest/userguide/metrics-server.html) de recursos

  Esse servidor de métricas coleta métricas de recursos dos kubelets e as expõe por meio da API de métricas do Kubernetes. Ele fornece escalonamento automático horizontal de pods e métricas básicas de CPU e memória.
+ [Kubecost: monitoramento de custos do](https://github.com/kubecost/cost-analyzer-helm-chart) Kubernetes

  Ferramentas como o Kubecost fornecem análises detalhadas de custos e recomendações de otimização para clusters EKS. Eles ajudam você a entender e otimizar os gastos com a nuvem em diferentes namespaces, implantações e serviços.

# Implementando alta disponibilidade para soluções de monitoramento do Amazon EKS
<a name="monitoring-ha-setup"></a>

Uma estratégia robusta de alta disponibilidade (HA) para o monitoramento do Amazon EKS é crucial para garantir a visibilidade contínua do seu ambiente Kubernetes. Esta seção discute uma abordagem abrangente para implementar HA em diferentes aspectos de sua infraestrutura de monitoramento.

## Redundância e escalabilidade arquitetônicas
<a name="architecture"></a>

A construção de um sistema de monitoramento altamente disponível começa com um projeto arquitetônico adequado. Os componentes de monitoramento devem ser distribuídos em várias zonas de AWS disponibilidade para se protegerem contra falhas na zona. Isso inclui a implementação de escalabilidade horizontal para componentes críticos de monitoramento, como servidores Prometheus, coletores de registros e gerenciadores de alertas. Você pode usar serviços AWS gerenciados, como o Amazon Managed Service for Prometheus e o Amazon Managed Grafana, para ajudar a reduzir a sobrecarga operacional e, ao mesmo tempo, garantir a alta disponibilidade. Configure mecanismos de failover automático para manter a continuidade do serviço durante falhas nos componentes, com verificações de integridade e procedimentos de recuperação automatizados em vigor.

## Estratégia resiliente de armazenamento de dados
<a name="data-storage"></a>

A resiliência do armazenamento de dados é fundamental para manter a confiabilidade do sistema de monitoramento. A implementação de soluções de armazenamento distribuído garante que os dados e registros métricos permaneçam acessíveis mesmo se os nós de armazenamento individuais falharem. Isso inclui configurar a replicação adequada de dados em várias zonas de disponibilidade e usar diferentes back-ends de armazenamento para redundância. Estabeleça procedimentos regulares de backup para dados históricos, com processos de recuperação documentados para vários cenários de falha. Para bancos de dados de séries temporais, como o Prometheus, a implementação de soluções de armazenamento remoto ajuda a separar as preocupações de armazenamento da coleta de dados e melhora a confiabilidade geral do sistema.

## Gerenciamento redundante de alertas
<a name="alert-mgmt"></a>

O gerenciamento de alertas requer atenção especial em uma configuração de HA. A implantação de gerenciadores de alertas redundantes garante que as notificações críticas cheguem aos destinatários pretendidos mesmo durante falhas no sistema. Configure vários canais de notificação, como e-mail, SMS, Slack, e PagerDuty forneça caminhos alternativos de comunicação. Use mecanismos de desduplicação de alertas para evitar tempestades de alertas durante falhas parciais do sistema e métodos de notificação alternativa para garantir que alertas críticos nunca sejam perdidos. A implementação da correlação de alertas ajuda a manter o contexto durante cenários de failover e evita notificações duplicadas de sistemas redundantes.

## Balanceamento de carga e descoberta de serviços
<a name="load-balancing"></a>

O balanceamento de carga adequado é essencial para manter os serviços de monitoramento estáveis. AWS Os Application Load Balancers distribuem o tráfego de monitoramento de entrada em vários endpoints, e as verificações de integridade garantem que o tráfego seja roteado somente para instâncias íntegras. Os mecanismos de descoberta de serviços ajudam os componentes de monitoramento a se adaptarem automaticamente às mudanças no ambiente, como a adição de novos nós ou serviços. Implemente agentes de monitoramento de forma consistente em todos os nós usando DaemonSets para garantir uma cobertura abrangente à medida que o cluster se expande.

## Considerações adicionais de HA
<a name="ha-considerations"></a>

Resiliência de rede:
+ Implemente caminhos de rede redundantes.
+ Configure o design adequado da sub-rede em todas as zonas de disponibilidade.
+ Use [AWS Direct Connect](https://docs.aws.amazon.com/whitepapers/latest/aws-vpc-connectivity-options/aws-direct-connect.html)com rotas de backup.
+ Configure grupos de segurança e listas de controle de acesso à rede (rede ACLs) apropriados.

Monitorando os monitores:
+ Implante sistemas de monitoramento secundários.
+ Implemente o monitoramento entre regiões.
+ Configure alertas para sistemas que não respondem.
+ Teste os procedimentos de failover regularmente.

Planejamento de capacidade:
+ Monitore as tendências de uso de recursos.
+ Implemente o escalonamento preditivo.
+ Teste o desempenho regularmente.

Gerenciamento de dados:
+ Implemente políticas de retenção de dados.
+ Configure a agregação métrica.
+ Planeje o gerenciamento do ciclo de vida dos dados.
+ Otimize o armazenamento regularmente.

Procedimentos de recuperação:
+ Processos de recuperação de documentos.
+ Teste a recuperação de desastres regularmente.
+ Implemente a recuperação automatizada sempre que possível.
+ Identifique e implemente caminhos claros de escalonamento.

Ao implementar essas práticas de alta disponibilidade, você pode garantir que sua infraestrutura de monitoramento do Amazon EKS permaneça confiável e resiliente e que você tenha visibilidade contínua de seus ambientes Kubernetes, mesmo durante vários cenários de falha. Testes e atualizações regulares dessas configurações de HA garantem que elas permaneçam eficazes à medida que o ambiente evolui.

# Melhores práticas para monitoramento no Amazon EKS
<a name="monitoring-best-practices"></a>

## Abordagem de implementação estratégica
<a name="implementation"></a>

Uma estratégia de monitoramento bem-sucedida do Amazon EKS começa com uma abordagem de implementação em fases e bem planejada.
+ Comece identificando e monitorando métricas críticas que afetam diretamente suas operações comerciais e a confiabilidade dos aplicativos. Essa base deve incluir métricas essenciais de infraestrutura, indicadores-chave de desempenho de aplicativos e métricas críticas de segurança. Expanda gradualmente a cobertura de monitoramento com base nas necessidades operacionais e nas lições aprendidas e garanta que cada adição forneça um valor significativo.
+ Implemente processos de implantação automatizados usando ferramentas de infraestrutura como código (IaC), como o Terraform, ou CloudFormation para garantir consistência e repetibilidade.
+ Teste e valide sistemas de monitoramento para ajudar a manter a confiabilidade e a precisão.
+ Refine os parâmetros de monitoramento continuamente de acordo com as necessidades comerciais em evolução.

## Gerenciamento eficaz de dados
<a name="data-mgmt"></a>

O gerenciamento adequado de dados é crucial para manter uma solução de monitoramento eficiente e econômica.
+ Implemente políticas claras de retenção de dados que equilibrem as necessidades de análise histórica com os custos de armazenamento.
+ Configure taxas de amostragem apropriadas para diferentes tipos de métricas: maior frequência para métricas críticas e menor frequência para métricas menos críticas.
+ Use a agregação métrica para reduzir o volume de dados e, ao mesmo tempo, manter insights significativos, especialmente para análise de tendências de longo prazo.
+ Implemente procedimentos sistemáticos de retenção e arquivamento de registros em sistemas de registro centralizados (como CloudWatch registros) para gerenciar os custos de armazenamento e manter o acesso a dados importantes acessível.
**nota**  
A rotação de registros em nível de contêiner é feita automaticamente pelo kubelet na versão 1.21 ou posterior do Amazon EKS.
+ Considere implementar uma hot-warm-cold arquitetura para armazenamento de registros para otimizar a velocidade de acesso e a eficiência de custos.

## Configuração e gerenciamento de alertas
<a name="alert-config"></a>

A configuração do alerta exige uma análise cuidadosa para manter a eficácia sem causar fadiga do alerta.
+ Defina limites claros e acionáveis com base nos objetivos de nível de serviço (SLOs) e nos padrões históricos de desempenho.
+ Implemente um sistema hierárquico de severidade de alertas que diferencie claramente entre problemas críticos que exigem atenção imediata e assuntos menos urgentes.
+ Certifique-se de que os alertas forneçam contexto suficiente e informações práticas para facilitar a rápida resolução de problemas.
+ Estabeleça procedimentos claros de escalonamento com propriedade e tempos de resposta definidos para diferentes severidades de alerta.
+ Revise e refine as configurações de alerta regularmente para ajudar a manter sua relevância e eficácia.

## Otimização de recursos
<a name="resource"></a>

O monitoramento contínuo da utilização de recursos é essencial para manter as operações econômicas.
+ Implemente um monitoramento abrangente de recursos em todos os componentes do cluster, incluindo nós, pods e volumes persistentes.
+ Configure o escalonamento automático com base nos padrões reais de uso e nos requisitos de desempenho para garantir a utilização eficiente dos recursos e, ao mesmo tempo, manter o desempenho.
+ Use tags de alocação de custos para monitorar o consumo de recursos por diferentes equipes, aplicativos ou ambientes.
+ Analise regularmente as métricas de eficiência de recursos para identificar oportunidades de otimização e implementar melhorias.
+ Considere implementar ferramentas de gerenciamento de custos para monitorar e otimizar os gastos com a nuvem.

## Segurança
<a name="security"></a>

As considerações de segurança devem ser parte integrante de sua estratégia de monitoramento.
+ Implemente [princípios de acesso com privilégios mínimos](https://docs.aws.amazon.com/wellarchitected/latest/security-pillar/sec_permissions_least_privileges.html) para todos os componentes de monitoramento para garantir que usuários e serviços tenham somente as permissões de que precisam.
+ Habilite um registro de auditoria abrangente para rastrear todos os acessos e alterações nos sistemas de monitoramento.
+ Realize análises regulares de segurança das configurações de monitoramento e dos padrões de acesso para identificar possíveis vulnerabilidades.
+ Implemente criptografia para dados de monitoramento confidenciais em trânsito e em repouso.
+ Integre o monitoramento de segurança aos sistemas existentes de gerenciamento de eventos e informações de segurança (SIEM) para uma visibilidade abrangente da segurança.

# Considerações de monitoramento avançado no Amazon EKS
<a name="monitoring-considerations"></a>

Otimização do desempenho:
+ Otimize os intervalos de coleta de métricas.
+ Configure padrões de consulta eficientes.
+ Implemente a pré-agregação métrica.
+ Use soluções de armazenamento apropriadas.

Conformidade e governança:
+ Mantenha trilhas de auditoria.
+ Implemente o monitoramento de conformidade.
+ Forneça relatórios regulares de conformidade.
+ Procedimentos de monitoramento de documentos.

Recuperação de desastres:
+ Faça backup das configurações de monitoramento regularmente.
+ Procedimentos de recuperação de documentos.
+ Teste os processos de recuperação.

Melhoria contínua:
+ Monitore as sessões de revisão regularmente.
+ Otimize os ciclos de desempenho.
+ Atualize o monitoramento com base em incidentes.
+ Incorpore o feedback do usuário.

Essas melhores práticas fornecem uma estrutura para implementar e manter soluções de monitoramento eficazes para ambientes Amazon EKS. Revise e atualize regularmente essas práticas para que elas permaneçam alinhadas às suas necessidades organizacionais e aos padrões do setor. O monitoramento não é uma configuração única — é um processo contínuo que requer atenção e refinamento regulares.