Raccolta dei parametri della GPU NVIDIA
Puoi utilizzare l'agente CloudWatch per raccogliere i parametri della GPU NVIDIA dai server Linux. Per configurarlo, aggiungi una sezione nvidia_gpu in quella metrics_collected del file di configurazione dell'agente CloudWatch. Per ulteriori informazioni, consulta Sezione Linux.
Inoltre, sull'istanza deve essere installato un driver NVIDIA. I driver NVIDIA sono preinstallati su alcune Amazon Machine Image (AMI). In caso contrario, il driver può essere installato manualmente. Per ulteriori informazioni, consulta Installazione dei driver NVIDIA sulle istanze Linux.
È possibile raccogliere i seguenti parametri. Tutti questi parametri vengono raccolti senza Unit CloudWatch, ma puoi definire un'unità per ogni parametro aggiungendone uno al file di configurazione dell'agente CloudWatch. Per ulteriori informazioni, consulta la pagina Sezione Linux.
| Parametro | Nome del parametro in CloudWatch | Descrizione |
|---|---|---|
|
|
|
La percentuale di tempo nell'ultimo periodo di campionamento in cui erano in esecuzione uno o più kernel sulla GPU. |
|
|
|
La temperatura del core della GPU in gradi Celsius. |
|
|
|
L'ultimo assorbimento di potenza misurato per l'intera scheda, in watt. |
|
|
|
La percentuale di tempo nell'ultimo periodo di campionamento in cui la memoria globale (dispositivo) veniva letta o scritta. |
|
|
|
La percentuale di velocità massima attualmente prevista per il funzionamento della ventola del dispositivo. |
|
|
|
Memoria totale riportata, in MB. |
|
|
|
Memoria utilizzata, in MB. |
|
|
|
Memoria libera, in MB. |
|
|
|
L'attuale generazione del collegamento. |
|
|
|
L'attuale larghezza del collegamento. |
|
|
|
Il numero attuale di sessioni dell'encoder. |
|
|
|
La media mobile dei fotogrammi di codifica al secondo. |
|
|
|
La media mobile della latenza di codifica in microsecondi. |
|
|
|
L'attuale frequenza di clock della scheda video (shader). |
|
|
|
L'attuale frequenza di clock dello Streaming Multiprocessor (SM). |
|
|
|
L'attuale frequenza di clock della memoria. |
|
|
|
L'attuale frequenza di clock del video (encoder più decoder). |
Tutti questi parametri vengono raccolti con le seguenti dimensioni:
| Dimensione | Descrizione |
|---|---|
|
|
Un identificatore univoco per la GPU su questo server. Rappresenta l'indice NVIDIA Management Library (NVML) del dispositivo. |
|
|
Il tipo di GPU. Ad esempio, |
|
|
L'architettura del server. |