Monitoreo de un Elastic Fabric Adapter en Amazon EC2 - Amazon Elastic Compute Cloud

Monitoreo de un Elastic Fabric Adapter en Amazon EC2

Puede utilizar las siguientes características para monitorizar el rendimiento de sus Elastic Fabric Adapters.

Métricas de controladores de EFA para una instancia de Amazon EC2

El controlador de Elastic Fabric Adapter (EFA) publica varias métricas de las instancias que tienen interfaces de EFA conectadas, en tiempo real. Puede utilizar estas métricas para solucionar problemas de rendimiento y redes de las aplicaciones, seleccionar el tamaño adecuado de clúster para una carga de trabajo, planificar actividades de escalado de manera proactiva y realizar pruebas de rendimiento en aplicaciones para determinar si aprovechan al máximo el rendimiento de EFA disponible en una instancia.

Métricas del controlador de EFA disponibles

El controlador de EFA publica las siguientes métricas a la instancia en tiempo real. Estas métricas proporcionan el número acumulado de errores, eventos de conexión y paquetes o bytes enviados, recibidos, retransmitidos o descartados por los dispositivos de EFA conectados desde el lanzamiento de la instancia o el último reinicio del controlador.

Métrica Descripción Tipos de instancias admitidas
tx_bytes

El número de bytes que se transmiten.

Unidades: bytes

Todos los tipos de instancias compatibles con EFA
rx_bytes

El número de bytes recibidos.

Unidades: bytes

Todos los tipos de instancias compatibles con EFA
tx_pkts

El número de paquetes que se transmiten.

Unidad: recuento

Todos los tipos de instancias compatibles con EFA
rx_pkts

El número de paquetes recibidos.

Unidad: recuento

Todos los tipos de instancias compatibles con EFA
rx_drops

El número de paquetes que fueron recibidos y luego descartados.

Unidad: recuento

Todos los tipos de instancias compatibles con EFA
send_bytes

El número de bytes enviados mediante operaciones de envío.

Unidades: bytes

Todos los tipos de instancias compatibles con EFA
recv_bytes

El número de bytes recibidos mediante operaciones de envío.

Unidades: bytes

Todos los tipos de instancias compatibles con EFA
send_wrs

El número de paquetes enviados mediante operaciones de envío.

Unidad: recuento

Todos los tipos de instancias compatibles con EFA
recv_wrs

El número de paquetes recibidos mediante operaciones de envío.

Unidad: recuento

Todos los tipos de instancias compatibles con EFA
rdma_write_wrs

El número de operaciones de escritura rdma completadas.

Unidad: recuento

Todos los tipos de instancias compatibles con EFA
rdma_read_wrs

El número de operaciones de lectura rdma completadas.

Unidad: recuento

Todos los tipos de instancias compatibles con EFA
rdma_write_bytes

El número de bytes escritos en él por otras instancias mediante operaciones de escritura rdma.

Unidades: bytes

Todos los tipos de instancias compatibles con EFA
rdma_read_bytes

El número de bytes recibidos mediante operaciones de lectura rdma.

Unidades: bytes

Todos los tipos de instancias compatibles con EFA
rdma_write_wr_err

El número de operaciones de escritura rdma que tuvieron errores locales o remotos.

Unidad: recuento

Todos los tipos de instancias compatibles con EFA
rdma_read_wr_err

El número de operaciones de lectura rdma que tuvieron errores locales o remotos.

Unidad: recuento

Todos los tipos de instancias compatibles con EFA
rdma_read_resp_bytes

El número de bytes enviados en respuesta a operaciones de lectura de rdma.

Unidades: bytes

Todos los tipos de instancias compatibles con EFA
rdma_write_recv_bytes

El número de bytes recibidos mediante operaciones de escritura rdma.

Unidades: bytes

Todos los tipos de instancias compatibles con EFA
retrans_bytes

El número de bytes SRD de EFA retransmitidos.

Unidad: recuento

Tipos de instancia Nitro v4 y posteriores compatibles con EFA
retrans_pkts

El número de paquetes SRD de EFA retransmitidos.

Unidades: bytes

Tipos de instancia Nitro v4 y posteriores compatibles con EFA
retrans_timeout_events

El número de veces que se agotó el tiempo de espera del tráfico SRD de EFA y se produjo un cambio en la ruta de la red.

Unidad: recuento

Tipos de instancia Nitro v4 y posteriores compatibles con EFA
impaired_remote_conn_events

El número de veces que las conexiones SRD de EFA estuvieron dañadas, lo que produjo un límite de tasa de rendimiento reducido.

Unidad: recuento

Tipos de instancia Nitro v4 y posteriores compatibles con EFA
unresponsive_remote_events

El número de veces que una conexión remota SRD de EFA no respondió.

Unidad: recuento

Tipos de instancia Nitro v4 y posteriores compatibles con EFA

Para obtener más información sobre los tipos de instancia compatibles con EFA, consulte Tipos de instancias admitidas.

Recuperación de las métricas del controlador de EFA para su instancia

Puede usar la herramienta de línea de comandos rdma-tool para recuperar las métricas de todas las interfaces de EFA conectadas a una instancia de la siguiente manera:

$ rdma -p statistic show link rdmap0s31/1 tx_bytes 0 tx_pkts 0 rx_bytes 0 rx_pkts 0 rx_drops 0 send_bytes 0 send_wrs 0 recv_bytes 0 recv_wrs 0 rdma_read_wrs 0 rdma_read_bytes 0 rdma_read_wr_err 0 rdma_read_resp_bytes 0 rdma_write_wrs 0 rdma_write_bytes 0 rdma_write_wr_err 0 retrans_bytes 0 retrans_pkts 0 retrans_timeout_events 0 unresponsive_remote_events 0 impaired_remote_conn_events 0

Como alternativa, puede recuperar las métricas de cada interfaz de EFA adjunta a una instancia desde los archivos sys mediante el siguiente comando.

$ more /sys/class/infiniband/device_number/ports/port_number/hw_counters/* | cat

Por ejemplo

$ more /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/* | cat :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/lifespan :::::::::::::: 12 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_resp_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_drops :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_bytes :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_pkts :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_timeout_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/unresponsive_remote_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/impaired_remote_conn_events :::::::::::::: 0

Registros de flujo de Amazon VPC

Puede crear un registro de flujo de Amazon VPC para capturar información acerca el tráfico entrante y saliente de un EFA. Los datos del registro de flujo se pueden publicar en Amazon CloudWatch Logs y Amazon S3. Una vez creado un registro de flujo, puede recuperarlo y ver sus datos en el destino elegido. Para obtener más información, consulte Registros de flujo de VPC en la Guía del usuario de Amazon VPC.

Un registro de flujo para un EFA se crea de la misma manera que se crea un registro de flujo para una interfaz de red elástica. Para obtener más información, consulte Creación de un registro de flujo en la Guía del usuario de Amazon VPC.

En las entradas de registro de flujo, el tráfico de EFA se identifica mediante srcAddress y destAddress que tienen formato de direcciones MAC, tal como se muestra en el ejemplo siguiente.

version accountId eniId srcAddress destAddress sourcePort destPort protocol packets bytes start end action log-status 2 3794735123 eni-10000001 01:23:45:67:89:ab 05:23:45:67:89:ab - - - 9 5689 1521232534 1524512343 ACCEPT OK

Amazon CloudWatch

Si utiliza EFA en un clúster de Amazon EKS, puede supervisar los EFA a través de la información de contenedores de CloudWatch. Información de contenedores de Amazon CloudWatch admite todas las métricas del controlador de EFA, excepto: retrans_bytes, retrans_pkts, retrans_timeout_events, unresponsive_remote_events y impaired_remote_conn_events.

Para obtener más información, consulte Métricas de información de contenedores de Kubernetes y de Amazon EKS en la Guía del usuario de Amazon CloudWatch.