Überwachen Sie einen Elastic Fabric-Adapter bei Amazon EC2 - Amazon Elastic Compute Cloud

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachen Sie einen Elastic Fabric-Adapter bei Amazon EC2

Sie können die folgenden Features zum Überwachen der Leistung Ihrer Elastic Fabric Adapter verwenden.

EFA-Treibermetriken für eine Amazon-Instance EC2

Der Elastic Fabric Adapter (EFA) -Treiber veröffentlicht mehrere Metriken von den Instances, an die EFA-Schnittstellen angeschlossen sind, in Echtzeit. Sie können diese Metriken verwenden, um Probleme mit der Anwendungsleistung und Netzwerkproblemen zu beheben, die richtige Clustergröße für einen Workload auszuwählen, Skalierungsaktivitäten proaktiv zu planen und Anwendungen zu vergleichen, um festzustellen, ob sie die auf einer Instance verfügbare EFA-Leistung maximieren.

Verfügbare EFA-Treibermetriken

Die ENA-Treiber publizieren die folgenden Metriken in Echtzeit an die Instance. Sie geben die Gesamtzahl der Fehler, Verbindungsereignisse und Pakete oder Bytes an, die seit dem Start der Instance oder dem letzten Treiberreset von den angeschlossenen EFA-Geräten gesendet, empfangen, erneut übertragen oder gelöscht wurden.

Metrik Beschreibung Unterstützte Instance-Typen
tx_bytes

Die Anzahl der übertragenen Bytes.

Einheit: Bytes

Alle Instance-Typen, die EFA unterstützen
rx_bytes

Die Anzahl der empfangenen Bytes.

Einheit: Bytes

Alle Instance-Typen, die EFA unterstützen
tx_pkts

Die Anzahl der übertragenen Pakete.

Einheit: Anzahl

Alle Instance-Typen, die EFA unterstützen
rx_pkts

Die Anzahl der empfangenen Pakete.

Einheit: Anzahl

Alle Instance-Typen, die EFA unterstützen
rx_drops

Die Anzahl der empfangenen und dann verworfenen Pakete.

Einheit: Anzahl

Alle Instance-Typen, die EFA unterstützen
send_bytes

Die Anzahl der über Sendevorgänge gesendeten Bytes.

Einheit: Bytes

Alle Instance-Typen, die EFA unterstützen
recv_bytes

Die Anzahl der von Sendevorgängen empfangenen Bytes.

Einheit: Bytes

Alle Instance-Typen, die EFA unterstützen
send_wrs

Die Anzahl der über Sendevorgängen gesendeten Pakete.

Einheit: Anzahl

Alle Instance-Typen, die EFA unterstützen
recv_wrs

Die Anzahl der von Sendevorgängen empfangenen Pakete.

Einheit: Anzahl

Alle Instance-Typen, die EFA unterstützen
rdma_write_wrs

Die Anzahl der abgeschlossenen RDMA-Schreibvorgänge.

Einheit: Anzahl

Alle Instance-Typen, die EFA unterstützen
rdma_read_wrs

Die Anzahl der abgeschlossenen RDMA-Schreibvorgänge.

Einheit: Anzahl

Alle Instance-Typen, die EFA unterstützen
rdma_write_bytes

Die Anzahl der von anderen Instances mithilfe von RDMA-Schreibvorgängen darauf geschriebenen Bytes.

Einheit: Bytes

Alle Instance-Typen, die EFA unterstützen
rdma_read_bytes

Die Anzahl der über RDMA-Lesevorgänge empfangenen Bytes.

Einheit: Bytes

Alle Instance-Typen, die EFA unterstützen
rdma_write_wr_err

Die Anzahl der RDMA-Schreibvorgänge, bei denen lokale oder externe Fehler aufgetreten sind.

Einheit: Anzahl

Alle Instance-Typen, die EFA unterstützen
rdma_read_wr_err

Die Anzahl der RDMA-Schreibvorgänge, bei denen lokale oder externe Fehler aufgetreten sind.

Einheit: Anzahl

Alle Instance-Typen, die EFA unterstützen
rdma_read_resp_bytes

Die Anzahl der als Antwort auf RDMA-Lesevorgänge gesendeten Bytes.

Einheit: Bytes

Alle Instance-Typen, die EFA unterstützen
rdma_write_recv_bytes

Die Anzahl der von Sendevorgängen empfangenen Bytes.

Einheit: Bytes

Alle Instance-Typen, die EFA unterstützen
retrans_bytes

Die Anzahl der erneut übertragenen EFA-SRD-Bytes.

Einheit: Anzahl

Nitro v4 und neuere Instance-Typen, die EFA unterstützen
retrans_pkts

Die Anzahl der erneut übertragenen EFA-SRD-Pakete.

Einheit: Bytes

Nitro v4 und neuere Instance-Typen, die EFA unterstützen
retrans_timeout_events

Die Häufigkeit, mit der EFA-SRD-Verkehr das Zeitlimit überschritten hat und zu einer Änderung des Netzwerkpfads geführt hat.

Einheit: Anzahl

Nitro v4 und neuere Instance-Typen, die EFA unterstützen
impaired_remote_conn_events

Die Häufigkeit, mit der EFA-SRD-Verbindungen in einen beeinträchtigten Zustand übergegangen sind, was zu einer verringerten Durchsatzrate geführt hat.

Einheit: Anzahl

Nitro v4 und neuere Instance-Typen, die EFA unterstützen
unresponsive_remote_events

Die Häufigkeit, mit der eine EFA-SRD-Remoteverbindung nicht reagiert hat.

Einheit: Anzahl

Nitro v4 und neuere Instance-Typen, die EFA unterstützen

Weitere Informationen zu den Instance-Typen, die EFA unterstützen, finden Sie unter. Unterstützte Instance-Typen

EFA-Treibermetriken für Ihre Instance abrufen

Sie können das Befehlszeilentool rdma-tool verwenden, um die Metriken für alle mit einer Instance verbundenen EFA-Schnittstellen wie folgt abzurufen:

$ rdma -p statistic show link rdmap0s31/1 tx_bytes 0 tx_pkts 0 rx_bytes 0 rx_pkts 0 rx_drops 0 send_bytes 0 send_wrs 0 recv_bytes 0 recv_wrs 0 rdma_read_wrs 0 rdma_read_bytes 0 rdma_read_wr_err 0 rdma_read_resp_bytes 0 rdma_write_wrs 0 rdma_write_bytes 0 rdma_write_wr_err 0 retrans_bytes 0 retrans_pkts 0 retrans_timeout_events 0 unresponsive_remote_events 0 impaired_remote_conn_events 0

Alternativ können Sie die Metriken für jede EFA-Schnittstelle, die an eine Instance angefügt ist, mit dem folgenden Befehl aus den SYS-Dateien abrufen.

$ more /sys/class/infiniband/device_number/ports/port_number/hw_counters/* | cat

Beispiel

$ more /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/* | cat :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/lifespan :::::::::::::: 12 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_resp_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_drops :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_bytes :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_pkts :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_timeout_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/unresponsive_remote_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/impaired_remote_conn_events :::::::::::::: 0

Amazon VPC-Flussprotokolle

Sie können ein Amazon VPC-Flow-Protokoll erstellen, um Informationen über den Datenverkehr zu und von Ihrem EFA zu erfassen. Flow-Protokolldaten können in Amazon CloudWatch Logs und Amazon S3 veröffentlicht werden. Nachdem Sie ein Flow-Protokoll erstellt haben, können Sie die darin enthaltenen Daten abrufen und an dem gewählten Ziel anzeigen. Weitere Informationen finden Sie unter VPC-Flow-Protokolle im Amazon VPC Benutzerhandbuch.

Sie erstellen ein Flow-Protokoll für einen EFA auf gleiche Weise, wie Sie ein Flow-Protokoll für eine Elastic Network Interface erstellen. Weitere Informationen finden Sie unter Erstellen eines Flow-Protokolls im Amazon-VPC-Benutzerhandbuch.

In den Flow-Protokolleinträgen wird EFA-Datenverkehr von srcAddress und destAddress identifiziert, die beide als MAC-Adressen formatiert sind, wie im folgenden Beispiel veranschaulicht.

version accountId eniId srcAddress destAddress sourcePort destPort protocol packets bytes start end action log-status 2 3794735123 eni-10000001 01:23:45:67:89:ab 05:23:45:67:89:ab - - - 9 5689 1521232534 1524512343 ACCEPT OK

Amazon CloudWatch

Wenn Sie EFA in einem Amazon EKS-Cluster verwenden, können Sie Ihre EFAs Nutzung von CloudWatch Container Insights überwachen. Amazon CloudWatch Container Insights unterstützt alle EFA-Treibermetriken mit Ausnahme von: retrans_bytesretrans_pkts,retrans_timeout_events,unresponsive_remote_events, undimpaired_remote_conn_events.

Weitere Informationen finden Sie unter Amazon EKS- und Kubernetes Container Insights-Metriken im CloudWatch Amazon-Benutzerhandbuch.