Componentes e recursos do Network Flow Monitor - Amazon CloudWatch

Componentes e recursos do Network Flow Monitor

O Network Flow Monitor usa ou referencia os conceitos a seguir.

Agentes

Um agente no Network Flow Monitor é uma aplicação de software que você instala nos recursos da instância do Amazon EC2. A aplicação tem duas partes:

  • A primeira parte recebe eventos relacionados às conexões TCP e é registrada no kernel do Linux usando o eBPF. O eBPF é o recurso extended Berkley Packet Filter (eBPF) do Linux que permite que um programa designado receba determinados eventos gerados pelo kernel do Linux.

  • A segunda parte agrega as estatísticas coletadas pela parte do eBPF. O agente envia as métricas agregadas para o backend do Network Flow Monitor aproximadamente a cada 30 segundos, com uma possibilidade de instabilidade de cinco segundos (em outras palavras, 25 a 35 segundos).

Para obter mais informações sobre agentes, consulte Como funciona.

Principais responsáveis

Os principais colaboradores são os fluxos de rede que têm os valores mais altos de uma métrica específica (como retransmissões) no escopo do Network Flow Monitor ou entre os fluxos de rede que você está rastreando em um monitor. Analisar os fluxos com os maiores números relatados das medições de métricas de performance pode ajudar a ver onde há deficiências a serem investigadas. O Network Flow Monitor retorna as métricas de performance dos principais colaboradores no escopo de monitoramento dos insights de workloads. Além disso, se você criar um monitor, o Network Flow Monitor retornará métricas de performance dos principais colaboradores dos fluxos de rede que você escolher para ele.

Recursos locais e remotos

Um recurso local, em um fluxo bidirecional de uma workload, é o host em que o agente está instalado. Por exemplo, se uma workload consistir em uma interação entre um serviço Web e um banco de dados de backend (por exemplo, Amazon RDS), a instância do EC2 que hospedará o serviço Web, que também executa o agente, será o recurso local. Um recurso local pode ser uma sub-rede, uma VPC ou uma zona de disponibilidade. O recurso local é identificado pelo endereço IP e pela porta do protocolo de transporte, no mínimo.

Um recurso remoto é o outro endpoint no fluxo bidirecional de uma workload. Neste exemplo de um serviço Web com um banco de dados de backend do RDS, o Amazon RDS é o recurso remoto. Um recurso remoto pode ser uma sub-rede, uma VPC, uma zona de disponibilidade ou um serviço da AWS. Assim como um recurso local, um recurso remoto é identificado pelo endereço IP do endpoint e pela porta do protocolo de transporte.

Insights de workloads

Os Insights de workloads incluem as métricas de performance retornadas de todos os fluxos de rede no escopo. No AWS Management Console, a página Insights de workloads fornece dados de performance sobre workloads em que você instalou agentes do Network Flow Monitor em instâncias de workloads. A página Insights de workloads fornece uma visão das aplicações que inclui a quantidade de dados transferidos e várias outras métricas, agrupadas em categorias de workloads. Por exemplo, você pode ver todas as métricas de workloads com tráfego entre zonas de disponibilidade (AZs) ou dentro de uma AZ. Ao usar esses insights, você pode selecionar workloads para as quais deseja criar um monitor para ver mais detalhes e monitorar a performance da rede continuamente.

Monitores

Você cria um monitor para poder monitorar continuamente a performance da rede de uma ou várias workloads específicas e ver informações mais detalhadas sobre os fluxos da rede. Para cada monitor, o Network Flow Monitor publica métricas de performance de ponta a ponta e um indicador de integridade da rede (NHI), que você pode usar para ajudar a determinar a atribuição de deficiências. Recomendamos que você analise as informações na página Insights de workloads para ver em quais fluxos de rede você deseja se concentrar e, em seguida, crie um monitor para esses fluxos. Depois, ao analisar regularmente os Insights de workloads, você pode decidir se tem os monitores de que precisa ou se criar novos monitores seria útil.

Indicador de integridade da rede (NHI)

O indicador de integridade da rede (NHI) é um valor binário que informa se houve problemas de rede da AWS em um ou mais fluxos de rede rastreados por um monitor, durante um período de tempo que você escolher. Quando o valor do NHI é 1, ou Degradado, houve um problema de rede da AWS em pelo menos um fluxo de rede. Com as informações do NHI, você pode decidir rapidamente se deseja concentrar os esforços de solução de problemas em um problema de rede da AWS ou em problemas de rede originados nas workloads.

Para obter mais informações sobre agentes, consulte Visualize as métricas do Network Flow Monitor no CloudWatch.

Escopo

No Network Flow Monitor, o escopo refere-se à conta ou às contas sobre as quais você tem capacidade de observabilidade ao analisar os indicadores de performance da rede. Se você realizar o acesso com uma conta gerencial e configurar o AWS Organizations com o CloudWatch, terá a possibilidade de estabelecer seu escopo para diversas contas da organização, até um máximo de cem contas. Caso contrário, se você realizar o acesso com uma Conta da AWS que não contém permissões de gerenciamento no Organizations, ou se não tiver configurado o Organizations com o CloudWatch, o Network Flow Monitor definirá o escopo para a conta usada no momento do acesso.

O Network Flow Monitor gera um ID de escopo exclusivo para o escopo. As consultas de dados de métricas usam o ID do escopo para determinar os recursos para os quais o Network Flow Monitor gera métricas. (Você deve instalar agentes para coletar e enviar dados de métricas antes de poder visualizar as métricas de performance de uma conta com o Network Flow Monitor.)

ID da consulta

O Network Flow Monitor gera um ID de consulta exclusivo para cada consulta criada para recuperar dados de métricas de performance, como uma consulta para os principais colaboradores de um monitor. Ao usar um ID de consulta com uma chamada de API no Network Flow Monitor, você pode verificar o status de uma consulta, interromper uma consulta, executar a consulta novamente ou trabalhar com a consulta de outras formas.

Métricas de performance

O Network Flow Monitor coleta e calcula métricas de performance de ponta a ponta, incluindo tempo de ida e volta (RTT) de TCP, retransmissões de TCP, tempos limite de retransmissão de TCP e bytes transferidos de cada fluxo que está no escopo do Network Flow Monitor. O serviço agrega essas métricas e as retorna para o backend do serviço. Você pode ver os principais colaboradores por tipo de métrica. Ao ver uma anomalia no Network Flow Monitor, você também pode verificar o indicador de integridade da rede (NHI) para ver se há um problema de rede subjacente da AWS.

Lembre-se de que os dados do RTT podem ser esparsos, pois nem sempre o RTT é calculado.

Você também pode usar os recursos do Amazon CloudWatch para criar painéis, alarmes e notificações com base nessas métricas. Por exemplo, você pode aprender a configurar alarmes com as métricas do Network Flow Monitor ao analisar as informações em Criar alarmes com o Network Flow Monitor.