View a markdown version of this page

故障診斷指南 - Amazon GameLift Servers

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

故障診斷指南

常見問題和解決步驟

指標遺失或不完整

徵狀

  • 儀表板中不會顯示任何指標。

  • 部分指標集合。

  • 指標更新延遲。

解決步驟

A. 驗證收集器狀態

檢查系統化服務:

sudo systemctl status gamelift-telemetry-collector

檢閱收集器日誌:

sudo journalctl -u gamelift-telemetry-collector
  • 確認收集器組態。

B. IAM 許可驗證
  • 檢查執行個體角色許可。

  • 驗證必要的政策:

    • aps:RemoteWrite

    • cloudwatch:PutMetricData

  • 驗證角色信任關係。

C. 網路連線
  • 驗證端點存取。

  • 檢查安全群組規則。

  • 檢閱網路 ACLs。

身分驗證錯誤

徵狀

  • SigV4 身分驗證失敗。

  • 存取遭拒的訊息。

  • 登入資料重新整理問題。

解決步驟

A. SigV4 身分驗證
  • 驗證暫時登入資料。

  • 檢查登入資料輪換。

  • 驗證執行個體描述檔。

B. AMP 存取
  • 檢閱工作區組態。

  • 驗證遠端寫入 URL。

  • 檢查 IAM 角色繫結。

儀表板問題

徵狀

  • 空白儀表板。

  • 遺失資料點。

  • 身分驗證失敗。

解決步驟

A. 資料來源組態
  • 驗證 Prometheus 連線。

  • 檢查 Amazon CloudWatch 整合。

  • 測試資料來源許可。

B. Grafana 存取
  • 確認 SSO 組態。

  • 視需要驗證 2FA 設定。

  • 檢查使用者許可。

Windows 特定問題

徵狀

  • 服務啟動失敗。

  • 指標集合差距。

  • 許可錯誤。

解決步驟

  • 驗證 Windows 服務狀態。

  • 檢查 Windows 事件日誌。

  • 檢閱收集器組態。

  • 驗證 Windows 特定的路徑。