Surveillez un adaptateur Elastic Fabric sur Amazon EC2 - Amazon Elastic Compute Cloud

Surveillez un adaptateur Elastic Fabric sur Amazon EC2

Vous pouvez utiliser les fonctions suivantes pour surveiller les performances de vos Elastic Fabric Adapters.

Métriques du pilote EFA pour une instance Amazon EC2

Le pilote Elastic Fabric Adapter (EFA) publie en temps réel plusieurs métriques provenant des instances auxquelles sont rattachées des interfaces EFA. Vous pouvez utiliser ces métriques pour résoudre les problèmes de performance et de mise en réseau des applications, choisir la bonne taille de cluster pour une charge de travail, planifier les activités de mise à l’échelle de manière proactive, et comparer les applications pour déterminer si elles maximisent la performance de l’EFA disponible sur une instance.

Indicateurs EFA disponibles pour les conducteurs

Le pilote de EFA publie en temps réel les métriques suivantes sur l’instance. Ils indiquent le nombre cumulé d’erreurs, d’événements de connexion et de paquets ou d’octets envoyés, reçus, retransmis ou abandonnés par les appareils EFA connectés depuis le lancement de l’instance ou la dernière réinitialisation du pilote.

Métrique Description Types d’instance pris en charge
tx_bytes

Nombre d’octets transmis.

Unité : octets

Tous les types d’instances compatibles avec EFA
rx_bytes

Nombre d’octets reçus.

Unité : octets

Tous les types d’instances compatibles avec EFA
tx_pkts

Nombre de paquets transmis.

Unité : nombre

Tous les types d’instances compatibles avec EFA
rx_pkts

Nombre de paquets reçus.

Unité : nombre

Tous les types d’instances compatibles avec EFA
rx_drops

Nombre de paquets reçus puis supprimés.

Unité : nombre

Tous les types d’instances compatibles avec EFA
send_bytes

Nombre d’octets envoyés à l’aide d’opérations d’envoi.

Unité : octets

Tous les types d’instances compatibles avec EFA
recv_bytes

Nombre d’octets reçus par les opérations d’envoi.

Unité : octets

Tous les types d’instances compatibles avec EFA
send_wrs

Nombre de paquets envoyés à l’aide d’opérations d’envoi.

Unité : nombre

Tous les types d’instances compatibles avec EFA
recv_wrs

Nombre de paquets reçus par les opérations d’envoi.

Unité : nombre

Tous les types d’instances compatibles avec EFA
rdma_write_wrs

Nombre d’opérations d’écriture rdma terminées.

Unité : nombre

Tous les types d’instances compatibles avec EFA
rdma_read_wrs

Nombre d’opérations de lecture rdma terminées.

Unité : nombre

Tous les types d’instances compatibles avec EFA
rdma_write_bytes

Nombre d’octets écrits dessus par d’autres instances à l’aide d’opérations d’écriture rdma.

Unité : octets

Tous les types d’instances compatibles avec EFA
rdma_read_bytes

Nombre d’octets reçus à l’aide d’opérations de lecture RDMA.

Unité : octets

Tous les types d’instances compatibles avec EFA
rdma_write_wr_err

Nombre d’opérations d’écriture RDMA présentant des erreurs locales ou distantes.

Unité : nombre

Tous les types d’instances compatibles avec EFA
rdma_read_wr_err

Nombre d’opérations de lecture RDMA présentant des erreurs locales ou distantes.

Unité : nombre

Tous les types d’instances compatibles avec EFA
rdma_read_resp_bytes

Nombre d’octets envoyés en réponse aux opérations de lecture RDMA.

Unité : octets

Tous les types d’instances compatibles avec EFA
rdma_write_recv_bytes

Nombre d’octets reçus par les opérations d’écriture RDMA.

Unité : octets

Tous les types d’instances compatibles avec EFA
retrans_bytes

Le nombre d’octets EFA SRD retransmis.

Unité : nombre

Types d’instances Nitro v4 et ultérieures prenant en charge EFA
retrans_pkts

Le nombre de paquets EFA SRD retransmis.

Unité : octets

Types d’instances Nitro v4 et ultérieures prenant en charge EFA
retrans_timeout_events

Le nombre de fois où le trafic EFA SRD a expiré et a entraîné un changement de chemin réseau.

Unité : nombre

Types d’instances Nitro v4 et ultérieures prenant en charge EFA
impaired_remote_conn_events

Nombre de fois où les connexions EFA SRD sont entrées dans un état dégradé, entraînant une réduction de la limite de débit.

Unité : nombre

Types d’instances Nitro v4 et ultérieures prenant en charge EFA
unresponsive_remote_events

Le nombre de fois où une connexion à distance EFA SRD ne répondait pas.

Unité : nombre

Types d’instances Nitro v4 et ultérieures prenant en charge EFA

Pour plus d’informations sur les types d’instance pris en charge, consultez la section Types d’instance pris en charge.

Récupérez les métriques du pilote EFA pour votre instance

Vous pouvez utiliser l’outil de ligne de commande rdma-tool pour récupérer les métriques de toutes les interfaces EFA associées à une instance comme suit :

$ rdma -p statistic show link rdmap0s31/1 tx_bytes 0 tx_pkts 0 rx_bytes 0 rx_pkts 0 rx_drops 0 send_bytes 0 send_wrs 0 recv_bytes 0 recv_wrs 0 rdma_read_wrs 0 rdma_read_bytes 0 rdma_read_wr_err 0 rdma_read_resp_bytes 0 rdma_write_wrs 0 rdma_write_bytes 0 rdma_write_wr_err 0 retrans_bytes 0 retrans_pkts 0 retrans_timeout_events 0 unresponsive_remote_events 0 impaired_remote_conn_events 0

Vous pouvez également récupérer les métriques pour chaque interface EFA attachée à une instance à partir des fichiers sys à l’aide de la commande suivante.

$ more /sys/class/infiniband/device_number/ports/port_number/hw_counters/* | cat

Par exemple

$ more /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/* | cat :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/lifespan :::::::::::::: 12 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_resp_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_drops :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_bytes :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_pkts :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_timeout_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/unresponsive_remote_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/impaired_remote_conn_events :::::::::::::: 0

Journaux de flux Amazon VPC

Vous pouvez créer un journal de flux Amazon VPC pour capturer des informations sur le trafic entrant ou sortant de votre EFA. Les données des journaux de flux peuvent être publiées dans Amazon CloudWatch Logs et Amazon S3. Une fois que vous avez créé un journal de flux, vous pouvez extraire et afficher ses données dans la destination choisie. Pour plus d’informations, consultez Journaux de flux VPC dans le Amazon VPC Guide de l’utilisateur.

Vous créez un journal de flux pour un EFA comme vous le feriez pour une interface réseau Elastic. Pour plus d’informations, consultez Créer un journal de flux dans le Guide de l’utilisateur Amazon VPC.

Dans les entrées de journal de flux, le trafic EFA est identifié par des adresses srcAddress et destAddress, qui sont formatées comme des adresses MAC, comme dans l’exemple suivant.

version accountId eniId srcAddress destAddress sourcePort destPort protocol packets bytes start end action log-status 2 3794735123 eni-10000001 01:23:45:67:89:ab 05:23:45:67:89:ab - - - 9 5689 1521232534 1524512343 ACCEPT OK

Amazon CloudWatch

Si vous utilisez EFA dans un cluster Amazon EKS, vous pouvez surveiller vos EFA à l’aide de CloudWatch Container Insights. Amazon CloudWatch Container Insights prend en charge toutes les métriques du pilote EFA, à l’exception de : retrans_bytes, retrans_pkts, retrans_timeout_events, unresponsive_remote_events et impaired_remote_conn_events.

Pour plus d’informations, consultez Métriques Amazon EKS et Kubernetes Container dans le Guide de l’utilisateur Amazon CloudWatch.