本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
故障診斷指南
常見問題和解決步驟
指標遺失或不完整
徵狀
-
儀表板中不會顯示任何指標。
-
部分指標集合。
-
指標更新延遲。
解決步驟
A. 驗證收集器狀態
檢查系統化服務:
sudo systemctl status gamelift-telemetry-collector
檢閱收集器日誌:
sudo journalctl -u gamelift-telemetry-collector
-
確認收集器組態。
B. IAM 許可驗證
-
檢查執行個體角色許可。
-
驗證必要的政策:
-
aps:RemoteWrite -
cloudwatch:PutMetricData
-
-
驗證角色信任關係。
C. 網路連線
-
驗證端點存取。
-
檢查安全群組規則。
-
檢閱網路 ACLs。
身分驗證錯誤
徵狀
-
SigV4 身分驗證失敗。
-
存取遭拒的訊息。
-
登入資料重新整理問題。
解決步驟
A. SigV4 身分驗證
-
驗證暫時登入資料。
-
檢查登入資料輪換。
-
驗證執行個體描述檔。
B. AMP 存取
-
檢閱工作區組態。
-
驗證遠端寫入 URL。
-
檢查 IAM 角色繫結。
儀表板問題
徵狀
-
空白儀表板。
-
遺失資料點。
-
身分驗證失敗。
解決步驟
A. 資料來源組態
-
驗證 Prometheus 連線。
-
檢查 Amazon CloudWatch 整合。
-
測試資料來源許可。
B. Grafana 存取
-
確認 SSO 組態。
-
視需要驗證 2FA 設定。
-
檢查使用者許可。
Windows 特定問題
徵狀
-
服務啟動失敗。
-
指標集合差距。
-
許可錯誤。
解決步驟
-
驗證 Windows 服務狀態。
-
檢查 Windows 事件日誌。
-
檢閱收集器組態。
-
驗證 Windows 特定的路徑。