Vom Amazon-CloudWatch-Agenten erfasste Metriken
Sie können Metriken von Servern erfassen, indem Sie den CloudWatch-Agenten auf dem Server. Sie können den Agenten auf Amazon-EC2-Instances oder On-Premises-Servern starten. Sie können den Agenten auch auf Computern installieren, die Linux, Windows Server oder macOS ausführen. Wenn Sie den Agenten auf einer Amazon-EC2-Instance installieren, werden die von ihm erfassten Metriken zusätzlich zu den Metriken erfasst, die auf Amazon-EC2-Instances standardmäßig aktiviert sind. Weitere Informationen zum Installieren des CloudWatch-Agenten auf einer Instance finden Sie unter Erfassen von Metriken, Protokollen und Ablaufverfolgungen mit dem CloudWatch-Agenten. In diesem Abschnitt können Sie sich über Metriken informieren, die der CloudWatch-Agent erfasst.
Vom CloudWatch-Agenten erfasste Metriken auf Windows Server-Instances
Auf Servern mit Windows Server ermöglicht die Installation des CloudWatch-Agenten die Erfassung der Metriken im Zusammenhang mit den Leistungsindikatoren in der Windows-Leistungsüberwachung. Die CloudWatch-Metriknamen für diese Leistungsindikatoren werden erstellt, indem ein Leerzeichen zwischen den Objektnamen und dem Namen des Leistungsindikators eingefügt wird. Beispielsweise erhält der % Interrupt Time-Zähler des Objekts Processor in CloudWatch den Metriknamen Processor % Interrupt Time. Weitere Informationen zu Leistungsindikatoren der Windows-Leistungsüberwachung finden Sie in der Dokumentation von Microsoft Windows Server.
Der Standard-Namespace für Metriken, die vom CloudWatch-Agent erfasst werden, ist CWAgent. Allerdings haben Sie die Möglichkeit, einen anderen Namespace zu konfigurieren, wenn Sie den Agent konfigurieren.
Vom CloudWatch-Agenten erfasste Metriken auf Linux-Instances und macOS-Instances
In der folgenden Tabelle sind die Metriken aufgeführt, die Sie mit dem CloudWatch-Agenten auf Linux-Servern und macOS-Computern erfassen können.
| Metrik | Beschreibung |
|---|---|
|
|
Die Zeit, für die die CPU auf beliebige Art und Weise aktiv ist. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeit, für die die CPU eine virtuelle CPU für ein Gastbetriebssystem zur Verfügung stellt. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeitspanne, in der die CPU eine virtuelle CPU für ein Gastbetriebssystem betreibt, die niedrige Priorität hat und durch andere Prozesse unterbrochen werden kann. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeit, für die sich die CPU im Leerlauf befindet. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeit, für die die CPU auf I/O-Vorgänge wartet. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeit, für die die CPU Unterbrechungen bedient. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeitspanne, in der sich die CPU im Benutzermodus mit Prozessen mit niedriger Priorität befindet, die leicht durch Prozesse mit höherer Priorität unterbrochen werden können. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeit, für die die CPU Softwareunterbrechungen bedient. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeit, für die sich die CPU in gestohlener Zeit befindet. Dies ist die Zeit, die in anderen Betriebssystemen in einer virtualisierten Umgebung verbracht wird. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeit, die die CPU im Systemmodus verbringt. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Die Zeit, die die CPU im Benutzermodus verbringt. Diese Metrik wird in Hundertstelsekunden gemessen. Einheit: keine |
|
|
Der Prozentsatz der Zeit, für die die CPU auf beliebige Art und Weise aktiv ist. Einheit: Prozent |
|
|
Der Prozentanteil der Zeit, für die die CPU eine virtuelle CPU für ein Gastbetriebssystem zur Verfügung stellt. Einheit: Prozent |
|
|
Der Prozentsatz der Zeit, in der die CPU eine virtuelle CPU für ein Gastbetriebssystem betreibt, der niedrige Priorität hat und durch andere Prozesse unterbrochen werden kann. Einheit: Prozent |
|
|
Der Prozentsatz der Zeit, die sich die CPU im Leerlauf befindet. Einheit: Prozent |
|
|
Der Prozentanteil der Zeit, für die die CPU auf I/O-Vorgänge wartet. Einheit: Prozent |
|
|
Der Prozentanteil der Zeit, für die die CPU Unterbrechungen bedient. Einheit: Prozent |
|
|
Der Anteil der Zeit, in der sich die CPU im Benutzermodus mit Prozessen mit niedriger Priorität befindet, die leicht durch Prozesse mit höherer Priorität unterbrochen werden können. Einheit: Prozent |
|
|
Der Prozentanteil der Zeit, für die die CPU Softwareunterbrechungen bedient. Einheit: Prozent |
|
|
Der Anteil der Zeit, für den sich die CPU in gestohlener Zeit oder Zeit, die in anderen Betriebssystemen in einer virtualisierten Umgebung verbracht wird, befindet. Einheit: Prozent |
|
|
Der Prozentanteil der Zeit, die die CPU im Systemmodus verbringt. Einheit: Prozent |
|
|
Der Prozentanteil der Zeit, die die CPU im Benutzermodus verbringt. Einheit: Prozent |
|
|
Freier Speicherplatz auf den Festplatten. Einheit: Byte |
|
|
Die Anzahl der verfügbaren Index-Knoten auf der Festplatte. Einheit: Anzahl |
|
|
Die Gesamtanzahl der reservierten Index-Knoten auf der Festplatte. Einheit: Anzahl |
|
|
Die Anzahl der verwendeten Index-Knoten auf der Festplatte. Einheit: Anzahl |
|
|
Der Gesamtspeicherplatz auf den Festplatten, sowohl verwendet als auch frei. Einheit: Byte |
|
|
Verwendeter Speicherplatz auf den Festplatten. Einheit: Byte |
|
|
Der Prozentanteil des verwendeten Gesamtspeicherplatzes. Einheit: Prozent |
|
|
Die Anzahl von I/O-Anforderungen, die an den Gerätetreiber gestellt wurden, das Gerät jedoch noch nicht abgeschlossen hat. Einheit: Anzahl |
|
|
Die Zeit, für die sich I/O-Anforderungen in der Warteschlange des Datenträgers befinden. Einheit: Millisekunden Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der Festplattenlesevorgänge. Einheit: Anzahl Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der von den Festplatten gelesenen Bytes. Einheit: Byte Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Zeit, für die Leseanforderungen auf den Festplatten gewartet haben. Mehrere gleichzeitig wartende Leseanforderungen erhöhen die Anzahl. Wenn beispielsweise 5 Anfragen im Mittel 100 Millisekunden lang warten, wird 500 gemeldet. Einheit: Millisekunden Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der Festplattenschreibvorgänge. Einheit: Anzahl Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Anzahl der auf die Festplatten geschriebenen Bytes. Einheit: Byte Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Zeit, für die Schreibanforderungen auf den Festplatten gewartet haben. Mehrere gleichzeitig wartende Schreibanforderungen erhöhen die Anzahl. Wenn beispielsweise 8 Anfragen im Mittel 1000 Millisekunden lang warten, wird 8000 gemeldet. Einheit: Millisekunden Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der Pakete, die in die Warteschlange gestellt und/oder verworfen wurden, da die eingehende aggregierte Bandbreite das Maximum für die Instance überschritten hat. Diese Metrik wird nur erfasst, wenn Sie sie im Einheit: keine |
|
|
Die Anzahl der Pakete, die in die Warteschlange gestellt und/oder verworfen wurden, weil die ausgehende aggregierte Bandbreite das Maximum für die Instance überschritten hat. Diese Metrik wird nur erfasst, wenn Sie sie im Einheit: keine |
|
|
Die Anzahl der verworfenen Pakete, weil die Verbindungsverfolgung das Maximum für die Instance überschritten hat und keine neuen Verbindungen hergestellt werden konnten. Dies kann zu einem Paketverlust für den Datenverkehr zur oder von der Instance führen. Diese Metrik wird nur erfasst, wenn Sie sie im Einheit: keine |
|
|
Die Anzahl der verworfenen Pakete, weil das PPS des Datenverkehrs zu lokalen Proxy-Diensten das Maximum für die Netzwerkschnittstelle überschritten hat. Dies wirkt sich auf den Datenverkehr zum DNS-Dienst, zum Instance Metadata Service und zum Amazon Time Sync Service aus. Diese Metrik wird nur erfasst, wenn Sie sie im Einheit: keine |
|
|
Die Anzahl der Pakete, die in die Warteschlange gestellt und/oder verworfen wurden, weil die bidirektionale PPS das Maximum für die Instance überschritten hat. Diese Metrik wird nur erfasst, wenn Sie sie im Einheit: keine |
|
|
Die Speichermenge, die während des letzten Stichprobenzeitraums auf beliebige Art und Weise verwendet wurde. Einheit: Byte |
|
|
Die Speichermenge, die verfügbar ist und sofort Prozessen zugewiesen werden kann. Einheit: Byte |
|
|
Der Prozentanteil des Speichers, der verfügbar ist und sofort Prozessen zugewiesen werden kann. Einheit: Prozent |
|
|
Die Speichermenge, die für Puffer verwendet wird. Einheit: Byte |
|
|
Die Speichermenge, die für Datei-Caches verwendet wird. Einheit: Byte |
|
|
Die Speichermenge, die nicht verwendet wird. Einheit: Byte |
|
|
Die Speichermenge, die während des letzten Stichprobenzeitraums nicht verwendet wurde. Einheit: Byte |
|
|
Die Gesamtgröße des Speichers. Einheit: Byte |
|
|
Die derzeit verwendete Speichermenge. Einheit: Byte |
|
|
Der derzeit verwendete Anteil des Speicherplatzes in Prozent. Einheit: Prozent |
|
|
Die Anzahl der von der Netzwerkschnittstelle empfangenen Bytes. Einheit: Byte Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der von der Netzwerkschnittstelle gesendeten Bytes. Einheit: Byte Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der von dieser Netzwerkschnittstelle empfangenen Pakete, die gelöscht wurden. Einheit: Anzahl Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der von dieser Netzwerkschnittstelle übertragenen Pakete, die gelöscht wurden. Einheit: Anzahl Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der Empfangsfehler, die diese Netzwerkschnittstelle erkannt hat. Einheit: Anzahl Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der Übertragungsfehler, die diese Netzwerkschnittstelle erkannt hat. Einheit: Anzahl Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der von dieser Netzwerkschnittstelle gesendeten Pakete. Einheit: Anzahl Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der von dieser Netzwerkschnittstelle empfangenen Pakete. Einheit: Anzahl Die einzige Statistik, die für diese Metrik verwendet werden sollte, ist |
|
|
Die Anzahl der TCP-Verbindungen ohne Status. Einheit: Anzahl |
|
|
Die Anzahl der TCP-Verbindungen, die auf eine Beendigungsanforderung vom Client warten. Einheit: Anzahl |
|
|
Die Anzahl der TCP-Verbindungen, die auf eine Beendigungsanforderung mit Bestätigung vom Client warten. Einheit: Anzahl |
|
|
Die Anzahl der eingerichteten TCP-Verbindungen. Einheit: Anzahl |
|
|
Die Anzahl der TCP-Verbindungen mit Status Einheit: Anzahl |
|
|
Die Anzahl der TCP-Verbindungen mit Status Einheit: Anzahl |
|
|
Die Anzahl der TCP-Verbindungen, die darauf warten, dass der Client die Nachricht über die Beendigung der Verbindung bestätigt. Dies ist der letzte Status, bevor die Verbindung geschlossen wird. Einheit: Anzahl |
|
|
Die Anzahl der TCP-Ports, die derzeit auf eine Verbindung warten. Einheit: Anzahl |
|
|
Die Anzahl der TCP-Verbindungen mit inaktiven Clients. Einheit: Anzahl |
|
|
Die Anzahl der TCP-Verbindungen, die nach dem Senden einer Verbindungsanforderung auf eine übereinstimmende Verbindungsanforderung warten. Einheit: Anzahl |
|
|
Die Anzahl der TCP-Verbindungen, die nach dem Senden und Empfangen einer Verbindungsanforderung auf eine Anforderungsbestätigung warten. Einheit: Anzahl |
|
|
Die Anzahl der TCP-Verbindungen, die derzeit darauf warten, dass der Client die Bestätigung seiner Verbindungsabbauanforderung erhält. Einheit: Anzahl |
|
|
Die Anzahl der aktuellen UDP-Verbindungen. Einheit: Anzahl |
|
|
Die Anzahl von blockierten Prozessen. Einheit: Anzahl |
|
|
Die Anzahl der „toten“ Prozesse, die unter Linux den Statuscode Diese Metrik wird auf macOS-Computern nicht erfasst. Einheit: Anzahl |
|
|
Anzahl der Prozesse, die sich im Leerlauf befinden, für die also länger als 20 Sekunden keine Aktivitäten stattgefunden hat. Nur auf FreeBSD-Instances verfügbar. Einheit: Anzahl |
|
|
Die Anzahl der ausgelagerten Prozesse, die unter Linux den Statuscode Diese Metrik wird auf macOS-Computern nicht erfasst. Einheit: Anzahl |
|
|
Die Anzahl der laufenden Prozesse, angezeigt durch den Statuscode Einheit: Anzahl |
|
|
Die Anzahl der Prozesse im Standby-Modus, angezeigt durch den Statuscode Einheit: Anzahl |
|
|
Die Anzahl der angehaltenen Prozesse, angezeigt durch den Statuscode Einheit: Anzahl |
|
|
Die Gesamtanzahl der Prozesse auf der Instance. Einheit: Anzahl |
|
|
Die Gesamtanzahl der Threads der Prozesse. Diese Metrik ist nur für Linux-Instances verfügbar. Diese Metrik wird auf macOS-Computern nicht erfasst. Einheit: Anzahl |
|
|
Die Anzahl der ausgelagerten Prozesse, die in FreeBSD-Instances den Statuscode Einheit: Anzahl |
|
|
Die Anzahl der Zombieprozesse, angezeigt durch Statuscode Einheit: Anzahl |
|
|
Der Speicherplatz des Auslagerungsbereichs, der nicht verwendet wird. Einheit: Byte |
|
|
Der Speicherplatz des Auslagerungsbereichs, der derzeit verwendet wird. Einheit: Byte |
|
|
Der Prozentanteil des Auslagerungsbereichs, der derzeit verwendet wird. Einheit: Prozent |
Definitionen der vom CloudWatch-Agenten erfassten Speichermetriken
Wenn der CloudWatch-Agent Speichermetriken erfasst, ist die Quelle das Speicherverwaltungssubsystem des Hosts. Zum Beispiel legt der Linux-Kernel die vom Betriebssystem verwalteten Daten in /proc offen. Was den Arbeitsspeicher betrifft, so befinden sich die Daten in /proc/meminfo.
Für jedes Betriebssystem und jede Architektur werden die Ressourcen, die von Prozessen verwendet werden, unterschiedlich berechnet. Weitere Informationen finden Sie in den folgenden Abschnitten.
Während jedes Erfassungsintervalls sammelt der CloudWatch-Agent auf jeder Instance die Instance-Ressourcen und berechnet die Ressourcen, die von allen Prozessen genutzt werden, die in dieser Instance laufen. Diese Informationen werden an CloudWatch-Metriken zurückgemeldet. Sie können die Länge des Erfassungsintervalls in der Konfigurationsdatei des CloudWatch-Agenten konfigurieren. Weitere Informationen finden Sie unter CloudWatch-Agent-Konfigurationsdatei: Agent-Abschnitt.
In der folgenden Liste wird erklärt, wie die Speichermetriken definiert sind, die der CloudWatch-Agent erfasst.
-
Aktiver Speicher – Speicher, der von einem Prozess verwendet wird. Mit anderen Worten, der Speicher, der von aktuell laufenden Anwendungen verwendet wird.
-
Verfügbarer Speicher – Der Speicher, der den Prozessen sofort zur Verfügung gestellt werden kann, ohne dass das System in den Swap wechselt (auch als virtueller Speicher bezeichnet).
-
Pufferspeicher – Der Datenbereich, der von Hardwaregeräten oder Programmprozessen gemeinsam genutzt wird, die mit unterschiedlichen Geschwindigkeiten und Prioritäten arbeiten.
-
Zwischenspeicher – Speichert Programmanweisungen und Daten, die wiederholt bei der Ausführung von Programmen verwendet werden, die die CPU wahrscheinlich als Nächstes benötigt.
-
Freier Speicher – Speicher, der überhaupt nicht verwendet wird und sofort verfügbar ist. Es ist völlig kostenlos, dass das System bei Bedarf verwendet werden kann.
-
Inaktiver Speicher – Seiten, auf die „kürzlich“ nicht zugegriffen wurde.
-
Gesamtspeicher – Die Größe des tatsächlichen physischen RAM-Speichers.
-
Verwendeter Speicher – Speicher, der derzeit von Programmen und Prozessen verwendet wird.
Themen
Linux: Gesammelte Metriken und verwendete Berechnungen
Gesammelte Metriken und Einheiten:
-
Aktiv (Byte)
-
Verfügbar (Byte)
-
Verfügbarer Prozentsatz (Prozent)
-
Gepuffert (Byte)
-
Zwischengespeichert (Byte)
-
Kostenlos (Byte)
-
Inaktiv (Byte)
-
Gesamt (Byte)
-
Benutzt (Byte)
-
Verwendeter Prozentsatz (Prozent)
Verwendeter Speicher = Gesamtspeicher - Freier Speicher - Zwischenspeicher - Pufferspeicher
Gesamtspeicher = Verwendeter Speicher + Freier Speicher + Zwischenspeicher + Pufferspeicher
macOS: Gesammelte Metriken und verwendete Berechnungen
Gesammelte Metriken und Einheiten:
-
Aktiv (Byte)
-
Verfügbar (Byte)
-
Verfügbarer Prozentsatz (Prozent)
-
Kostenlos (Byte)
-
Inaktiv (Byte)
-
Gesamt (Byte)
-
Benutzt (Byte)
-
Verwendeter Prozentsatz (Prozent)
Verfügbarer Speicher = Freier Speicher + Inaktiver Speicher
Verwendeter Speicher = Gesamtspeicher - Verfügbarer Speicher
Gesamtspeicher = Verfügbarer Speicher + Verwendeter Speicher
Windows: Gesammelte Metriken
Die auf Windows-Hosts erfassten Metriken sind unten aufgeführt. Alle diese Metriken haben None für Unit.
-
Verfügbare Byte
-
Cache-Fehler/Sekunde
-
Seitenfehler/Sekunde
-
Seiten/Sekunde
Für die Windows-Metriken werden keine Berechnungen durchgeführt, da der CloudWatch-Agent die Ereignisse aus den Leistungszählern analysiert.
Beispiel: Berechnung von Speichermetriken auf Linux
Nehmen wir als Beispiel an, dass die Eingabe des cat /proc/meminfo-Befehls auf einem Linux-Host zu folgenden Ergebnissen führt:
MemTotal: 3824388 kB MemFree: 462704 kB MemAvailable: 2157328 kB Buffers: 126268 kB Cached: 1560520 kB SReclaimable: 289080 kB>
In diesem Beispiel erfasst der CloudWatch-Agent die folgenden Werte. Alle Werte, die der CloudWatch-Agent erfasst und meldet, sind in Byte angegeben.
-
mem_total: 3916173312 Byte -
mem_available: 2209103872 Byte (MemFree + zwischengespeichert) -
mem_free: 473808896 Byte -
mem_cached: 1893990400 Byte (cached+SReclaimable -
mem_used: 1419075584 Byte (MemTotal– (MemFree+Buffers+ (Cached+SReclaimable))) -
mem_buffered: 129667072 Byte -
mem_available_percent: 56,41 % -
mem_used_percent: 36,24 % (mem_used/mem_total) * 100