Metriche raccolte dall'agente CloudWatch - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Metriche raccolte dall'agente CloudWatch

È possibile raccogliere metriche dai server installando l' CloudWatch agente sul server. Puoi installare l'agente sia su EC2 istanze Amazon che su server locali. Puoi anche installare l'agente su computer che eseguono Linux, Windows Server o macOS. Se installi l'agente su un' EC2 istanza Amazon, i parametri raccolti dall'agente si aggiungono ai parametri abilitati per impostazione predefinita sulle istanze Amazon. EC2 Per informazioni sull'installazione dell' CloudWatch agente su un'istanza, consulta. Raccogli metriche, log e tracce con l'agente CloudWatch Puoi utilizzare questa sezione per conoscere le metriche raccolte dall' CloudWatch agente.

Metriche raccolte dall' CloudWatch agente sulle istanze di Windows Server

Su un server che esegue Windows Server, l'installazione dell' CloudWatch agente consente di raccogliere le metriche associate ai contatori in Windows Performance Monitor. I nomi delle CloudWatch metriche per questi contatori vengono creati inserendo uno spazio tra il nome dell'oggetto e il nome del contatore. Ad esempio, al contatore % Interrupt Time dell'oggetto Processor viene assegnato il nome parametro Processor % Interrupt Time in CloudWatch. Per ulteriori informazioni sui contatori di Windows Performance Monitor, consulta la documentazione di Microsoft Windows Server.

Lo spazio dei nomi predefinito per le metriche raccolte dall' CloudWatch agente èCWAgent, sebbene sia possibile specificare uno spazio dei nomi diverso quando si configura l'agente.

Metriche raccolte dall' CloudWatchagente sulle istanze Linux e macOS

La tabella seguente elenca le metriche che è possibile raccogliere con l' CloudWatch agente su server Linux e computer macOS.

Parametro Descrizione

cpu_time_active

Il periodo di tempo durante il quale la CPU è attiva su qualsiasi capacità. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_guest

Il periodo di tempo durante il quale la CPU è in esecuzione su una CPU virtuale per un sistema operativo guest. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_guest_nice

Il periodo di tempo durante il quale la CPU è in esecuzione su una CPU virtuale per un sistema operativo guest di bassa priorità e in cui può essere interrotta da altri processi. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_idle

Il periodo di tempo durante il quale la CPU è inattiva. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_iowait

Il periodo di attesa della CPU per il completamento I/O delle operazioni. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_irq

Il periodo di tempo durante il quale la CPU lavora sulle interruzioni. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_nice

Il periodo di tempo durante il quale la CPU è in modalità utente con processi di bassa priorità che possono semplicemente essere interrotti da processi di priorità superiore. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_softirq

Il periodo di tempo durante il quale la CPU lavora sulle interruzioni del software. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_steal

Il periodo di tempo durante il quale la CPU si trova nello stato di stolen time (tempo rubato), ovvero il tempo impiegato su altri sistemi operativi in un ambiente virtualizzato. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_system

Il periodo di tempo durante il quale la CPU si trova in modalità di sistema. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_user

Il periodo di tempo durante il quale la CPU si trova in modalità utente. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_usage_active

La percentuale di tempo durante il quale la CPU è attiva su qualsiasi capacità.

Unità: percentuale

cpu_usage_guest

La percentuale di tempo durante la quale la CPU è in esecuzione su una CPU virtuale per un sistema operativo guest.

Unità: percentuale

cpu_usage_guest_nice

La percentuale di tempo durante la quale la CPU è in esecuzione su una CPU virtuale per un sistema operativo guest di bassa priorità e che può essere interrotta da altri processi.

Unità: percentuale

cpu_usage_idle

La percentuale di tempo in cui la CPU è inattiva.

Unità: percentuale

cpu_usage_iowait

La percentuale di tempo in cui la CPU attende il completamento I/O delle operazioni.

Unità: percentuale

cpu_usage_irq

La percentuale di tempo durante la quale la CPU lavora sulle interruzioni.

Unità: percentuale

cpu_usage_nice

La percentuale di tempo durante il quale la CPU è in modalità utente con processi di bassa priorità che possono essere interrotti con facilità da processi di priorità superiore.

Unità: percentuale

cpu_usage_softirq

La percentuale di tempo durante la quale la CPU lavora sulle interruzioni del software.

Unità: percentuale

cpu_usage_steal

La percentuale di tempo durante il quale la CPU si trova nello stato di stolen time, ovvero il tempo impiegato su altri sistemi operativi in un ambiente virtualizzato.

Unità: percentuale

cpu_usage_system

La percentuale di tempo durante la quale la CPU si trova in modalità di sistema.

Unità: percentuale

cpu_usage_user

La percentuale di tempo durante la quale la CPU si trova in modalità utente.

Unità: percentuale

disk_free

Spazio libero sui dischi.

Unità: byte

disk_inodes_free

Il numero di nodi dell'indice disponibili sul disco.

Unità: numero

disk_inodes_total

Il numero totale di nodi dell'indice prenotati sul disco.

Unità: numero

disk_inodes_used

Il numero di nodi dell'indice usati sul disco.

Unità: numero

disk_total

Spazio totale dei dischi, inclusi quelli usati e quelli gratuiti.

Unità: byte

disk_used

Spazio usato sui dischi.

Unità: byte

disk_used_percent

La percentuale di spazio totale del disco usata.

Unità: percentuale

diskio_iops_in_progress

Il numero di I/O richieste che sono state inviate al driver del dispositivo ma non sono ancora state completate.

Unità: numero

diskio_io_time

Il periodo di tempo in cui le I/O richieste sono rimaste in coda sul disco.

Unità: millisecondi

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_reads

Il numero di operazioni di lettura del disco.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_read_bytes

Il numero di byte letti dai dischi.

Unità: byte

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_read_time

Il periodo di tempo che le richieste di lettura hanno aspettato su dischi. Varie richieste di lettura in attesa contemporaneamente aumentano il numero. Ad esempio, se tutte e 5 le richieste sono in attesa per una media di 100 millisecondi, ne vengono segnalati 500.

Unità: millisecondi

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_writes

Il numero di operazioni di scrittura del disco.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_write_bytes

Il numero di byte scritti sui dischi.

Unità: byte

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_write_time

Il periodo di tempo che le richieste di scrittura hanno aspettato sui dischi. Varie richieste di scrittura in attesa contemporaneamente aumentano il numero. Ad esempio, se tutte e 8 le richieste sono in attesa per una media di 1000 millisecondi, ne vengono segnalati 8000.

Unità: millisecondi

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

ethtool_bw_in_allowance_exceeded

Il numero di pacchetti in coda è and/or diminuito perché la larghezza di banda aggregata in entrata ha superato il massimo consentito per l'istanza.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della sezione del file di configurazione dell'agente. metrics_collected CloudWatch Per ulteriori informazioni, consulta Raccolta di parametri sulle prestazioni di rete

Unità: nessuna

ethtool_bw_out_allowance_exceeded

Il numero di pacchetti in coda è and/or diminuito perché la larghezza di banda aggregata in uscita ha superato il massimo per l'istanza.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della sezione del file di configurazione dell'agente. metrics_collected CloudWatch Per ulteriori informazioni, consulta Raccolta di parametri sulle prestazioni di rete

Unità: nessuna

ethtool_conntrack_allowance_exceeded

Il numero di pacchetti accodati o rilasciati perché il rilevamento delle connessioni ha superato il valore massimo per l'istanza e non è stato possibile stabilire nuove connessioni. Ciò può comportare la perdita di pacchetti per il traffico da o verso l'istanza.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della sezione del file di configurazione metrics_collected dell' CloudWatch agente. Per ulteriori informazioni, consulta Raccolta di parametri sulle prestazioni di rete

Unità: nessuna

ethtool_linklocal_allowance_exceeded

Il numero di pacchetti accodati o rilasciati perché il PPS del traffico verso i servizi proxy locali ha superato il valore massimo per l'interfaccia di rete. Ciò influisce sul traffico verso il servizio DNS, il servizio di metadati dell'istanza e il servizio Amazon Time Sync.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della sezione del file di configurazione metrics_collected dell' CloudWatch agente. Per ulteriori informazioni, consulta Raccolta di parametri sulle prestazioni di rete

Unità: nessuna

ethtool_pps_allowance_exceeded

Il numero di pacchetti in coda è and/or diminuito perché il PPS bidirezionale ha superato il massimo consentito per l'istanza.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della sezione del file di configurazione dell'agente. metrics_collected CloudWatch Per ulteriori informazioni, consulta Raccolta di parametri sulle prestazioni di rete.

Unità: nessuna

mem_active

La quantità di memoria utilizzata in un modo qualsiasi durante l'ultimo periodo di campionamento.

Unità: byte

mem_available

La quantità di memoria che è disponibile e che può essere immediatamente determinata durante i processi.

Unità: byte

mem_available_percent

La percentuale di memoria che è disponibile e che può essere immediatamente determinata durante i processi.

Unità: percentuale

mem_buffered

La quantità di memoria che viene utilizzata per i buffer.

Unità: byte

mem_cached

La quantità di memoria che viene utilizzata per le cache dei file.

Unità: byte

mem_free

La quantità di memoria che non viene utilizzata.

Unità: byte

mem_inactive

La quantità di memoria non utilizzata in alcun modo durante l'ultimo periodo di campionamento.

Unità: byte

mem_total

La quantità totale di memoria.

Unità: byte

mem_used

La quantità di memoria attualmente in uso.

Unità: byte

mem_used_percent

La percentuale di memoria attualmente in uso.

Unità: percentuale

net_bytes_recv

Il numero di byte ricevuti dall'interfaccia di rete.

Unità: byte

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_bytes_sent

Il numero di byte inviati dall'interfaccia di rete.

Unità: byte

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_drop_in

Il numero di pacchetti ricevuti da questa interfaccia di rete che sono stati interrotti.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_drop_out

Il numero di pacchetti trasmessi da questa interfaccia di rete che sono stati interrotti.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_err_in

Il numero di errori ricevuti rilevati da questa interfaccia di rete.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_err_out

Il numero di errori trasmessi rilevati da questa interfaccia di rete.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_packets_sent

Il numero di pacchetti inviati da questa interfaccia di rete.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_packets_recv

Il numero di pacchetti ricevuti da questa interfaccia di rete.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

netstat_tcp_close

Il numero di connessioni TCP senza stato.

Unità: numero

netstat_tcp_close_wait

Il numero di connessioni TCP in attesa di una richiesta di terminazione dal cliente.

Unità: numero

netstat_tcp_closing

Il numero di connessioni TCP in attesa di una richiesta di terminazione con conferma da parte del client.

Unità: numero

netstat_tcp_established

Il numero di connessioni TCP stabilite.

Unità: numero

netstat_tcp_fin_wait1

Il numero di connessioni TCP nello stato FIN_WAIT1 durante la chiusura di una connessione.

Unità: numero

netstat_tcp_fin_wait2

Il numero di connessioni TCP nello stato FIN_WAIT2 durante la chiusura di una connessione.

Unità: numero

netstat_tcp_last_ack

Il numero di connessioni TCP in attesa che il client invii la conferma del messaggio di interruzione della connessione. Questo è l'ultimo stato prima della chiusura della connessione.

Unità: numero

netstat_tcp_listen

Il numero di porte TCP attualmente in ascolto di una richiesta di connessione.

Unità: numero

netstat_tcp_none

Il numero di connessioni TCP con clienti inattivi.

Unità: numero

netstat_tcp_syn_sent

Il numero di connessioni TCP in attesa di una richiesta di connessione corrispondente dopo aver inviato una richiesta di connessione.

Unità: numero

netstat_tcp_syn_recv

Il numero di connessioni TCP in attesa di conferma della richiesta di connessione dopo aver inviato e ricevuto una richiesta di connessione.

Unità: numero

netstat_tcp_time_wait

Il numero di connessioni TCP attualmente in attesa di garantire che il client riceva la conferma della richiesta di interruzione della connessione.

Unità: numero

netstat_udp_socket

Il numero delle attuali connessioni UDP.

Unità: numero

processes_blocked

Il numero di processi che sono bloccati.

Unità: numero

processes_dead

Il numero di processi "dead", indicati dal codice di stato X su Linux.

Questo parametro non viene raccolto sui computer macOS.

Unità: numero

processes_idle

Il numero di processi che sono inattivi (che sono in stato di sospensione per più di 20 secondi). Disponibile solo sulle istanze di FreeBSD.

Unità: numero

processes_paging

Il numero di processi in fase di paging, indicati dal codice di stato W su Linux.

Questo parametro non viene raccolto sui computer macOS.

Unità: numero

processes_running

Il numero di processi in elaborazione, indicati dal codice di stato R.

Unità: numero

processes_sleeping

Il numero di processi in fase di sospensione, indicati dal codice di stato S.

Unità: numero

processes_stopped

Il numero di processi arrestati, indicati dal codice di stato T.

Unità: numero

processes_total

Il numero totale di processi sull'istanza.

Unità: numero

processes_total_threads

Il numero totale di thread che costituiscono i processi. Questo parametro è disponibile solo per le istanze su Linux.

Questo parametro non viene raccolto sui computer macOS.

Unità: numero

processes_wait

Il numero di processi in fase di paging, indicati dal codice di stato W nelle istanze FreeBSD. Questo parametro è disponibile solo sulle istanze di FreeBSD e non è disponibile su Linux, Windows Server o macOS.

Unità: numero

processes_zombies

Il numero di processi zombie, indicati dal codice di stato Z.

Unità: numero

swap_free

La quantità di spazio di swapping che non viene usata.

Unità: byte

swap_used

La quantità di spazio di swapping attualmente in uso.

Unità: byte

swap_used_percent

La percentuale di spazio di swapping attualmente in uso.

Unità: percentuale

Definizioni delle metriche di memoria raccolte dall'agente CloudWatch

Quando l' CloudWatch agente raccoglie i parametri di memoria, la fonte è il sottosistema di gestione della memoria dell'host. Ad esempio, il kernel Linux espone i dati gestiti dal sistema operativo in /proc. Per quanto riguarda la memoria, i dati si trovano in /proc/meminfo.

Ogni sistema operativo e architettura diversi prevede calcoli diversi delle risorse utilizzate dai processi. Per ulteriori informazioni, consultare le sezioni indicate di seguito.

Durante ogni intervallo di raccolta, l' CloudWatch agente di ogni istanza raccoglie le risorse dell'istanza e calcola le risorse utilizzate da tutti i processi in esecuzione in quell'istanza. Queste informazioni vengono riportate alle metriche. CloudWatch È possibile configurare la lunghezza dell'intervallo di raccolta nel file di configurazione dell' CloudWatch agente. Per ulteriori informazioni, consulta CloudWatch file di configurazione dell'agente: sezione Agente.

L'elenco seguente spiega come vengono definite le metriche di memoria raccolte dall' CloudWatch agente.

  • Memoria attiva: la memoria utilizzata da un processo. In altre parole, la memoria utilizzata dalle app attualmente in esecuzione.

  • Memoria disponibile: la memoria che può essere assegnata istantaneamente ai processi senza che il sistema vada in swap (nota anche come memoria virtuale).

  • Memoria buffer: l'area dati condivisa da dispositivi hardware o processi di programma che operano a velocità e priorità diverse.

  • Memoria cache: archivia le istruzioni e i dati del programma che vengono utilizzati ripetutamente nel funzionamento dei programmi di cui probabilmente la CPU avrà bisogno successivamente.

  • Memoria libera: memoria che non viene utilizzata affatto ed è prontamente disponibile. Il sistema può essere utilizzato in modo completamente gratuito quando necessario.

  • Memoria inattiva: pagine a cui non è stato effettuato l'accesso "di recente".

  • Memoria totale: la dimensione della RAM di memoria fisica effettiva.

  • Memoria usata: la memoria attualmente utilizzata da programmi e processi.

Linux: parametri raccolti e calcoli utilizzati

Parametri raccolti e unità:

  • Attivo (byte)

  • Disponibile (byte)

  • Percentuale disponibile (percentuale)

  • Memorizzato nel buffer (byte)

  • Memorizzato nella cache (byte)

  • Gratuito (byte)

  • Attivo (byte)

  • Totale (byte)

  • Utilizzato (byte)

  • Percentuale utilizzata (percentuale)

Memoria utilizzata = Memoria totale - Memoria libera - Memoria cache - Memoria buffer

Memoria totale = Memoria utilizzata + Memoria libera + Memoria cache + Memoria buffer

macOS: parametri raccolti e calcoli utilizzati

Parametri raccolti e unità:

  • Attivo (byte)

  • Disponibile (byte)

  • Percentuale disponibile (percentuale)

  • Gratuito (byte)

  • Attivo (byte)

  • Totale (byte)

  • Utilizzato (byte)

  • Percentuale utilizzata (percentuale)

Memoria disponibile = Memoria libera + Memoria inattiva

Memoria utilizzata = Memoria totale - Memoria disponibile

Memoria totale = Memoria disponibile + Memoria utilizzata

Windows: parametri raccolti

I parametri raccolti sugli host Windows sono riportati di seguito. Tutti questi parametri hanno None per Unit.

  • Byte disponibili

  • Errori di cache/sec

  • Errori di pagina/sec

  • Pagine/sec

Non vengono utilizzati calcoli per le metriche di Windows perché l' CloudWatch agente analizza gli eventi dai contatori delle prestazioni.

Esempio: calcolo dei parametri di memoria su Linux

Ad esempio, supponiamo che l'immissione del comando cat /proc/meminfo su un host Linux mostri i seguenti risultati:

MemTotal: 3824388 kB MemFree: 462704 kB MemAvailable: 2157328 kB Buffers: 126268 kB Cached: 1560520 kB SReclaimable: 289080 kB>

In questo esempio, l' CloudWatch agente raccoglierà i seguenti valori. Tutti i valori che l' CloudWatch agente raccoglie e riporta sono espressi in byte.

  • mem_total: 3916173312 byte

  • mem_available: 2209103872 byte (+ cache) MemFree

  • mem_free: 473808896 byte

  • mem_cached: 1893990400 byte (cached + SReclaimable)

  • mem_used: 1419075584 byte (MemTotal – (MemFree + Buffers + (Cached + SReclaimable)))

  • mem_buffered: 129667072 byte

  • mem_available_percent: 56,41%

  • mem_used_percent: 36,24% (mem_used / mem_total) * 100