Surveillez un adaptateur Elastic Fabric sur Amazon EC2
Vous pouvez utiliser les fonctions suivantes pour surveiller les performances de vos Elastic Fabric Adapters.
Rubriques
Métriques du pilote EFA pour une instance Amazon EC2
Le pilote Elastic Fabric Adapter (EFA) publie en temps réel plusieurs métriques provenant des instances auxquelles sont rattachées des interfaces EFA. Vous pouvez utiliser ces métriques pour résoudre les problèmes de performance et de mise en réseau des applications, choisir la bonne taille de cluster pour une charge de travail, planifier les activités de mise à l’échelle de manière proactive, et comparer les applications pour déterminer si elles maximisent la performance de l’EFA disponible sur une instance.
Rubriques
Indicateurs EFA disponibles pour les conducteurs
Le pilote de EFA publie en temps réel les métriques suivantes sur l’instance. Ils indiquent le nombre cumulé d’erreurs, d’événements de connexion et de paquets ou d’octets envoyés, reçus, retransmis ou abandonnés par les appareils EFA connectés depuis le lancement de l’instance ou la dernière réinitialisation du pilote.
| Métrique | Description | Types d’instance pris en charge |
|---|---|---|
tx_bytes |
Nombre d’octets transmis. Unité : octets |
Tous les types d’instances compatibles avec EFA |
rx_bytes |
Nombre d’octets reçus. Unité : octets |
Tous les types d’instances compatibles avec EFA |
tx_pkts |
Nombre de paquets transmis. Unité : nombre |
Tous les types d’instances compatibles avec EFA |
rx_pkts |
Nombre de paquets reçus. Unité : nombre |
Tous les types d’instances compatibles avec EFA |
rx_drops |
Nombre de paquets reçus puis supprimés. Unité : nombre |
Tous les types d’instances compatibles avec EFA |
send_bytes |
Nombre d’octets envoyés à l’aide d’opérations d’envoi. Unité : octets |
Tous les types d’instances compatibles avec EFA |
recv_bytes |
Nombre d’octets reçus par les opérations d’envoi. Unité : octets |
Tous les types d’instances compatibles avec EFA |
send_wrs |
Nombre de paquets envoyés à l’aide d’opérations d’envoi. Unité : nombre |
Tous les types d’instances compatibles avec EFA |
recv_wrs |
Nombre de paquets reçus par les opérations d’envoi. Unité : nombre |
Tous les types d’instances compatibles avec EFA |
rdma_write_wrs |
Nombre d’opérations d’écriture rdma terminées. Unité : nombre |
Tous les types d’instances compatibles avec EFA |
rdma_read_wrs |
Nombre d’opérations de lecture rdma terminées. Unité : nombre |
Tous les types d’instances compatibles avec EFA |
rdma_write_bytes |
Nombre d’octets écrits dessus par d’autres instances à l’aide d’opérations d’écriture rdma. Unité : octets |
Tous les types d’instances compatibles avec EFA |
rdma_read_bytes |
Nombre d’octets reçus à l’aide d’opérations de lecture RDMA. Unité : octets |
Tous les types d’instances compatibles avec EFA |
rdma_write_wr_err |
Nombre d’opérations d’écriture RDMA présentant des erreurs locales ou distantes. Unité : nombre |
Tous les types d’instances compatibles avec EFA |
rdma_read_wr_err |
Nombre d’opérations de lecture RDMA présentant des erreurs locales ou distantes. Unité : nombre |
Tous les types d’instances compatibles avec EFA |
rdma_read_resp_bytes |
Nombre d’octets envoyés en réponse aux opérations de lecture RDMA. Unité : octets |
Tous les types d’instances compatibles avec EFA |
rdma_write_recv_bytes |
Nombre d’octets reçus par les opérations d’écriture RDMA. Unité : octets |
Tous les types d’instances compatibles avec EFA |
retrans_bytes |
Le nombre d’octets EFA SRD retransmis. Unité : nombre |
Types d’instances Nitro v4 et ultérieures prenant en charge EFA |
retrans_pkts |
Le nombre de paquets EFA SRD retransmis. Unité : octets |
Types d’instances Nitro v4 et ultérieures prenant en charge EFA |
retrans_timeout_events |
Le nombre de fois où le trafic EFA SRD a expiré et a entraîné un changement de chemin réseau. Unité : nombre |
Types d’instances Nitro v4 et ultérieures prenant en charge EFA |
impaired_remote_conn_events |
Nombre de fois où les connexions EFA SRD sont entrées dans un état dégradé, entraînant une réduction de la limite de débit. Unité : nombre |
Types d’instances Nitro v4 et ultérieures prenant en charge EFA |
unresponsive_remote_events |
Le nombre de fois où une connexion à distance EFA SRD ne répondait pas. Unité : nombre |
Types d’instances Nitro v4 et ultérieures prenant en charge EFA |
Pour plus d’informations sur les types d’instance pris en charge, consultez la section Types d’instance pris en charge.
Récupérez les métriques du pilote EFA pour votre instance
Vous pouvez utiliser l’outil de ligne de commande rdma-tool
$rdma -p statistic showlink rdmap0s31/1 tx_bytes 0 tx_pkts 0 rx_bytes 0 rx_pkts 0 rx_drops 0 send_bytes 0 send_wrs 0 recv_bytes 0 recv_wrs 0 rdma_read_wrs 0 rdma_read_bytes 0 rdma_read_wr_err 0 rdma_read_resp_bytes 0 rdma_write_wrs 0 rdma_write_bytes 0 rdma_write_wr_err 0 retrans_bytes 0 retrans_pkts 0 retrans_timeout_events 0 unresponsive_remote_events 0 impaired_remote_conn_events 0
Vous pouvez également récupérer les métriques pour chaque interface EFA attachée à une instance à partir des fichiers sys à l’aide de la commande suivante.
$more /sys/class/infiniband/device_number/ports/port_number/hw_counters/* | cat
Par exemple
$more /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/* | cat:::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/lifespan :::::::::::::: 12 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_resp_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_drops :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_bytes :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_pkts :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_timeout_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/unresponsive_remote_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/impaired_remote_conn_events :::::::::::::: 0
Journaux de flux Amazon VPC
Vous pouvez créer un journal de flux Amazon VPC pour capturer des informations sur le trafic entrant ou sortant de votre EFA. Les données des journaux de flux peuvent être publiées dans Amazon CloudWatch Logs et Amazon S3. Une fois que vous avez créé un journal de flux, vous pouvez extraire et afficher ses données dans la destination choisie. Pour plus d’informations, consultez Journaux de flux VPC dans le Amazon VPC Guide de l’utilisateur.
Vous créez un journal de flux pour un EFA comme vous le feriez pour une interface réseau Elastic. Pour plus d’informations, consultez Créer un journal de flux dans le Guide de l’utilisateur Amazon VPC.
Dans les entrées de journal de flux, le trafic EFA est identifié par des adresses srcAddress et destAddress, qui sont formatées comme des adresses MAC, comme dans l’exemple suivant.
version accountId eniId srcAddress destAddress sourcePort destPort protocol packets bytes start end action log-status
2 3794735123 eni-10000001 01:23:45:67:89:ab 05:23:45:67:89:ab - - - 9 5689 1521232534 1524512343 ACCEPT OK
Amazon CloudWatch
Si vous utilisez EFA dans un cluster Amazon EKS, vous pouvez surveiller vos EFA à l’aide de CloudWatch Container Insights. Amazon CloudWatch Container Insights prend en charge toutes les métriques du pilote EFA, à l’exception de : retrans_bytes, retrans_pkts, retrans_timeout_events, unresponsive_remote_events et impaired_remote_conn_events.
Pour plus d’informations, consultez Métriques Amazon EKS et Kubernetes Container dans le Guide de l’utilisateur Amazon CloudWatch.