Amazon EC2에서 Elastic Fabric Adapter 모니터링
다음 기능을 사용해 Elastic Fabric Adapter(EFA)의 성능을 모니터링할 수 있습니다.
Amazon EC2 인스턴스의 EFA 드라이버 메트릭
Elastic Fabric Adapter(EFA) 드라이버는 EFA 인터페이스가 연결된 인스턴스의 여러 지표를 실시간으로 게시합니다. 이러한 메트릭을 사용하여 애플리케이션 성능 및 네트워킹 문제를 해결하고, 워크로드에 적합한 클러스터 크기를 선택하며, 크기 조정을 사전에 계획하고, 애플리케이션 벤치마킹을 통해 인스턴스에서 제공되는 EFA 성능을 최대한 활용하는지 판단할 수 있습니다.
사용 가능한 EFA 드라이버 메트릭
EFA 드라이버는 인스턴스에 다음과 같은 지표를 실시간으로 게시합니다. 해당 EFA 디바이스는 인스턴스 시작 시점 또는 마지막 드라이버 재설정 이후 누적된 오류 수, 연결 이벤트 수, 그리고 전송/수신/재전송/손실된 패킷 또는 바이트 수를 제공합니다.
| 지표 | 설명 | 지원되는 인스턴스 유형 |
|---|---|---|
tx_bytes |
전송된 바이트 수입니다. 단위: 바이트 |
EFA를 지원하는 모든 인스턴스 유형 |
rx_bytes |
수신한 바이트 수입니다. 단위: 바이트 |
EFA를 지원하는 모든 인스턴스 유형 |
tx_pkts |
전송된 패킷 수입니다. 단위: 수 |
EFA를 지원하는 모든 인스턴스 유형 |
rx_pkts |
수신된 패킷 수입니다. 단위: 수 |
EFA를 지원하는 모든 인스턴스 유형 |
rx_drops |
수신 후 삭제된 패킷 수입니다. 단위: 수 |
EFA를 지원하는 모든 인스턴스 유형 |
send_bytes |
전송 작업을 사용하여 전송된 바이트 수입니다. 단위: 바이트 |
EFA를 지원하는 모든 인스턴스 유형 |
recv_bytes |
전송 작업을 사용하여 수신된 바이트 수입니다. 단위: 바이트 |
EFA를 지원하는 모든 인스턴스 유형 |
send_wrs |
전송 작업을 사용하여 전송된 패킷 수입니다. 단위: 수 |
EFA를 지원하는 모든 인스턴스 유형 |
recv_wrs |
전송 작업을 사용하여 수신된 패킷 수입니다. 단위: 수 |
EFA를 지원하는 모든 인스턴스 유형 |
rdma_write_wrs |
완료된 rdma 쓰기 작업 수입니다. 단위: 수 |
EFA를 지원하는 모든 인스턴스 유형 |
rdma_read_wrs |
완료된 rdma 읽기 작업 수입니다. 단위: 수 |
EFA를 지원하는 모든 인스턴스 유형 |
rdma_write_bytes |
rdma 쓰기 작업 수를 사용하여 다른 인스턴스에 의해 기록된 바이트 수입니다. 단위: 바이트 |
EFA를 지원하는 모든 인스턴스 유형 |
rdma_read_bytes |
rdma 읽기 작업 수를 사용하여 수신된 바이트 수입니다. 단위: 바이트 |
EFA를 지원하는 모든 인스턴스 유형 |
rdma_write_wr_err |
로컬 또는 원격 오류가 발생한 rdma 쓰기 작업 수입니다. 단위: 수 |
EFA를 지원하는 모든 인스턴스 유형 |
rdma_read_wr_err |
로컬 또는 원격 오류가 발생한 rdma 읽기 작업 수입니다. 단위: 수 |
EFA를 지원하는 모든 인스턴스 유형 |
rdma_read_resp_bytes |
rdma 읽기 작업 수에 대한 응답으로 전송된 바이트 수입니다. 단위: 바이트 |
EFA를 지원하는 모든 인스턴스 유형 |
rdma_write_recv_bytes |
rdma 쓰기 작업을 사용하여 수신된 바이트 수입니다. 단위: 바이트 |
EFA를 지원하는 모든 인스턴스 유형 |
retrans_bytes |
재전송된 EFA SRD 바이트 수입니다. 단위: 수 |
EFA를 지원하는 Nitro v4 이상 인스턴스 유형 |
retrans_pkts |
재전송된 EFA SRD 패킷 수입니다. 단위: 바이트 |
EFA를 지원하는 Nitro v4 이상 인스턴스 유형 |
retrans_timeout_events |
EFA SRD 트래픽이 시간 초과되어 네트워크 경로가 변경된 횟수입니다. 단위: 수 |
EFA를 지원하는 Nitro v4 이상 인스턴스 유형 |
impaired_remote_conn_events |
EFA SRD 연결이 손상된 상태로 전환되어 처리량 속도 제한이 감소한 횟수입니다. 단위: 수 |
EFA를 지원하는 Nitro v4 이상 인스턴스 유형 |
unresponsive_remote_events |
EFA SRD 원격 연결이 응답하지 않은 횟수입니다. 단위: 수 |
EFA를 지원하는 Nitro v4 이상 인스턴스 유형 |
EFA를 지원하는 인스턴스 유형에 대한 자세한 내용은 지원되는 인스턴스 유형 섹션을 참조하세요.
인스턴스의 EFA 드라이버 메트릭을 검색합니다.
rdma-tool
$rdma -p statistic showlink rdmap0s31/1 tx_bytes 0 tx_pkts 0 rx_bytes 0 rx_pkts 0 rx_drops 0 send_bytes 0 send_wrs 0 recv_bytes 0 recv_wrs 0 rdma_read_wrs 0 rdma_read_bytes 0 rdma_read_wr_err 0 rdma_read_resp_bytes 0 rdma_write_wrs 0 rdma_write_bytes 0 rdma_write_wr_err 0 retrans_bytes 0 retrans_pkts 0 retrans_timeout_events 0 unresponsive_remote_events 0 impaired_remote_conn_events 0
또는 다음 명령을 사용하여 sys 파일에서 인스턴스에 연결된 각 EFA 인터페이스의 메트릭을 검색할 수 있습니다.
$more /sys/class/infiniband/device_number/ports/port_number/hw_counters/* | cat
예
$more /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/* | cat:::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/lifespan :::::::::::::: 12 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_resp_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_drops :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_bytes :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_pkts :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_timeout_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/unresponsive_remote_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/impaired_remote_conn_events :::::::::::::: 0
Amazon VPC 흐름 로그
Amazon VPC 플로우 로그를 생성하여 EFA로 들어오고 나가는 트래픽에 대한 세부 정보를 캡처할 수 있습니다. 플로우 로그 데이터를 Amazon CloudWatch Logs 및 Amazon S3로 게시할 수 있습니다. 플로우 로그를 생성한 다음 선택된 대상의 데이터를 가져와 확인할 수 있습니다. 자세한 내용은 Amazon VPC 사용 설명서의 VPC 흐름 로그를 참조하세요.
탄력적 네트워크 인터페이스에 플로우 로그를 생성한 것과 동일한 방법으로 EFA에 플로우 로그를 생성할 수 있습니다. 자세한 내용은 Amazon VPC 사용 설명서의 플로우 로그 생성을 참조하세요.
다음 예제에서와 같이 플로우 로그 항목에서 EFA 트래픽은 MAC 주소 유형인 srcAddress와 destAddress으로 식별됩니다.
version accountId eniId srcAddress destAddress sourcePort destPort protocol packets bytes start end action log-status
2 3794735123 eni-10000001 01:23:45:67:89:ab 05:23:45:67:89:ab - - - 9 5689 1521232534 1524512343 ACCEPT OK
Amazon CloudWatch
Amazon EKS 클러스터에서 EFA를 사용하는 경우 CloudWatch 컨테이너 인사이트를 사용하여 EFA를 모니터링할 수 있습니다. Amazon CloudWatch Container Insights는 retrans_bytes, retrans_pkts, retrans_timeout_events, unresponsive_remote_events 및 impaired_remote_conn_events를 제외한 모든 EFA 드라이버 지표를 지원합니다.
자세한 정보는 Amazon CloudWatch 사용 설명서의 Amazon EKS 및 Kubernetes Container Insights 지표를 참조하세요.