Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Monitoraggio della produzione
Devi stabilire una baseline per le prestazioni normali di DAX nell'ambiente, misurando le prestazioni in diversi momenti e con condizioni di carico differenti. Quando esegui il monitoraggio di DAX, dovresti considerare di archiviare i dati storici sul monitoraggio. Questi dati archiviati forniscono una baseline rispetto cui confrontare i dati sulle prestazioni correnti e identificare i normali modelli o le anomalie di prestazioni e ideare metodi per risolvere i problemi.
Per stabilire una baseline, devi monitorare almeno gli elementi seguenti durante il test di carico e in produzione.
-
Utilizzo della CPU e richieste limitate, in modo da poter determinare se è necessario usare un tipo di nodo più grande nel cluster. L'utilizzo della CPU del cluster è disponibile tramite la
CPUUtilizationCloudWatch metrica. La statistica media di questa metrica fornisce una visualizzazione dell’utilizzo medio della CPU su tutti i nodi del cluster. Per le decisioni sulla scalabilità del cluster, si consiglia di utilizzare la statistica massima, che rappresenta l’utilizzo massimo su tutti i nodi.Nota
AWS ha migliorato la granularità della
CPUUtilizationmetrica. Si potrebbero osservare le modifiche alla metrica a partire dal 17/05/2024 al 22/06/2024. -
La latenza delle operazioni (come misura sul lato client) deve rimanere coerente entro i requisiti di latenza dell'applicazione.
-
I tassi di errore dovrebbero rimanere bassi, come si evince dalle metriche
ErrorRequestCountFaultRequestCount, and.FailedRequestCountCloudWatch -
Utilizzo di byte di rete, in modo da poter determinare se utilizzare più nodi o un tipo di nodo più grande nel cluster. Per monitorare il consumo, puoi impostare gli avvisi
BaselineNetworkBytesInUtilizatione leBaselineNetworkBytesOutUtilizationmetriche disponibili in CloudWatch, che indicano il consumo percentuale della larghezza di banda di rete disponibile per il tipo di istanza, rispettivamente per il traffico in ingresso e in uscita. -
Utilizzo della memoria cache e dimensione eliminata, in modo da poter determinare se il tipo di nodo del cluster ha memoria sufficiente per contenere il set di lavoro e, nel caso passare a un tipo di nodo più grande.
Nota
In caso di un numero elevato di errori e scritture della cache, l'utilizzo della memoria cache può aumentare fino al 100% e causare interruzioni della disponibilità.
-
Connessioni client, in modo da poter monitorare eventuali picchi imprevedibili nelle connessioni al cluster.