本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
生產監控
您應在各個時間點和不同的負載條件下測量效能,以在您的環境中確立 DAX 正常效能的基準。當您監控 DAX 時,應該考慮存放歷史監控資料。這個存放的資料會提供基準,讓您與目前的效能資料比較,識別出正常的效能模式和效能異常狀況,再規劃方式來處理問題。
若要確立基準,您至少應在負載測試和生產階段監控下列項目。
-
CPU 使用率和限流請求,可讓您判斷是否需要在叢集中使用大型節點類型。您可透過
CPUUtilizationCloudWatch 指標了解叢集的 CPU 使用率。此指標的平均統計資料可協助您掌握叢集中所有節點的平均 CPU 使用率。對於叢集擴展決策,我們建議您使用最高統計資料,也就是所有節點的最高使用率。注意
AWS 已改善
CPUUtilization指標的精細程度。您可能會觀察到指標從 2024 年 5 月 17 日到 2024 年 6 月 22 日所發生的變化。 -
操作延遲 (在用戶端測量) 應該保持在應用程式的延遲需求之內。
-
應保持低錯誤率,如
ErrorRequestCount、FaultRequestCount和FailedRequestCountCloudWatch 指標中所見。 -
網路位元組耗用可協助您判斷是否應在叢集中使用更多節點或更大的節點類型。若要監控耗用量,您可以針對 CloudWatch 中可用的
BaselineNetworkBytesInUtilization和BaselineNetworkBytesOutUtilization指標設定提醒,分別指出傳入和傳出流量的執行個體類型可用網路頻寬的耗用百分比。 -
快取記憶體使用率和移出的大小,如此就能判斷叢集的節點類型是否有足夠的記憶體可保留您的工作集,若是不足,則切換至較大的節點類型。
注意
在大量快取遺漏和寫入的情況下,快取記憶體使用率可能增加達 100%,且可能造成可用性停擺。
-
用戶端連接,可讓您監控叢集連接中任何無法解釋的峰值。