控制面板组织结构和使用方式
在 Amazon Managed Grafana 的综合性控制面板上查看您的指标。可用的控制面板取决于您的实例集类型:
按实例集类型划分的控制面板可用性
下表显示了每种实例集类型可用的控制面板:
| 控制面板 | 实例集类型 | 描述 |
|---|---|---|
| EC2 实例集概述 | EC2 实例集 | 显示有关并发玩家(CCU)、实例和玩家容量的信息 |
| 实例概述 | EC2 实例集 | 显示实例集中所有实例的平均 CPU、内存和网络利用率 |
| 实例性能 | EC2 实例集 | 显示单个实例的详细指标(CPU、内存、磁盘、网络) |
| 容器实例集概述 | 容器实例集 | 显示托管式容器实例集中所有容器的平均资源利用率 |
| 容器性能 | 容器实例集 | 显示特定 ECS 任务中各个容器的详细指标 |
| 服务器性能 | 二者 | 显示指定游戏服务器进程的网络、内存和运行时性能(EC2 实例集和容器实例集有各自的不同版本) |
托管式 EC2 实例集:
“EC2 实例集概述”提供关于实例集容量和扩缩的概要洞察。
使用“实例概述”和“实例性能”控制面板进行主机级监控。
提供通过 hostmetrics 接收器收集的指标,用于实现系统级可见性。
重点关注 EC2 实例的资源利用率和性能。
“服务器性能”(EC2)可独立于底层基础架构监控游戏服务器应用程序指标。
托管式容器实例集:
使用“容器实例集概述”和“容器性能”控制面板进行 ECS 任务和容器级监控。
提供通过 ECS Container Receiver 收集的指标,用于实现容器化工作负载可见性。
重点关注任务级聚合和容器资源隔离。
“服务器性能”(容器)可独立于底层基础架构监控游戏服务器应用程序指标。
“EC2 实例集概述”控制面板
此控制面板简要概述了您的实例集在全球以及各个位置的利用率和容量。它包含图表,显示了游戏服务器停止、启动和崩溃的次数,以及运行状况良好的游戏服务器的百分比。您可以按实例集 ID 和位置进行筛选。
“实例集概述”各指标
下表显示了“实例集概述”控制面板提供的指标:
| 控制面板 | 指标名称 | 定义 |
|---|---|---|
| 全球 CCU 和容量 | CCU | 显示所有位置所有实例上所有游戏服务器中的并发用户数量 |
| 全球 CCU | 显示全球所有实例上所有游戏服务器中的并发用户数量 | |
| 活动实例 | 显示实例集中处于活动状态的实例总数 | |
| 活动进程 | 显示已准备好托管游戏会话的活动游戏服务器进程数量 | |
| 游戏服务器启动 | 显示实例集中已开始的游戏会话数量 | |
| 全球 CCU 和容量 | 运行状况良好的游戏服务器 | 显示实例集中向 Amazon GameLift Servers 报告运行状况良好的游戏服务器的平均百分比 |
| 崩溃的游戏会话 | 显示崩溃的游戏会话的游戏会话 ID。点击游戏会话 ARN 的链接可导航到“服务器性能”控制面板 | |
| 位置 CCU | 位置玩家 | 显示某个位置的并发玩家数量,包括该位置所有实例上所有游戏服务器中的并发玩家 |
| 位置容量 | 显示某个位置的容量利用率(%),以及该位置正在使用的游戏服务器的百分比 |
注意
CCU 指标需要在游戏服务器代码中实现。这些指标不会自动收集,必须由您的应用程序实现并报告。
“实例概述”控制面板
此控制面板提供实例集中所有实例的主机级汇总指标。当前平均值显示了实例的总体运行状况。当性能下降时,请检查 CPU 使用率、内存消耗、网络和磁盘消耗是否存在瓶颈。您可以按实例集 ID 和位置进行筛选。
“实例概述”各指标
下表显示了“实例概述”控制面板提供的指标:
| 控制面板 | 指标名称 | 定义 |
|---|---|---|
| 实例摘要 | 平均 CPU 使用率 | “实例摘要”跟踪实例的平均资源使用情况。该指标显示了实例集中所有实例正在使用的 CPU 资源的平均百分比。若出现高利用率模式,需要检查各个实例指标和资源分配情况 |
| CPU 使用率峰值 | 实例集中任意实例在某个时间段内记录的最高 CPU 利用率 | |
| 按实例列的 CPU 使用率 | 实例集中每个实例的单独 CPU 利用率,有助于识别资源热点 | |
| 实例摘要 | 平均内存使用率 | 实例集中所有实例正在使用的平均 RAM 百分比。若出现高利用率模式,需要检查各个实例指标和资源分配情况,例如内存消耗 |
| 内存使用率峰值 | 实例集中任意实例在某个时间段内记录的最高内存利用率 | |
| 按实例列的内存使用率 | 实例集中每个实例的单独内存利用率,有助于识别内存密集型工作负载 | |
| 网络摘要 | 网络 I/O(字节) | “网络摘要”反映了平均实例连接情况。该指标显示了实例集中所有实例的平均网络流量(发送和接收)。对于延迟或连接问题,请检查各个实例指标,例如网络 I/O 和数据包速率 |
| 网络 I/O(数据包) | 实例集中所有实例的平均网络数据包速率(发送和接收) | |
| 按实例列的网络使用率 | 每个实例的单独网络利用率,有助于识别网络瓶颈 | |
| 磁盘摘要 | 磁盘 I/O 操作 | “磁盘摘要”显示实例的平均磁盘性能。该指标显示了实例集中所有实例的平均磁盘读/写操作。若响应时间慢,建议在单个实例级别检查磁盘操作、I/O 等待时间和待处理操作 |
| 磁盘 I/O 吞吐量 | 实例集中所有实例的平均磁盘读/写吞吐量 | |
| 按实例列的磁盘使用率 | 每个实例的单独磁盘利用率,有助于识别存储性能问题 |
注意
实例级指标通过 hostmetrics 接收器收集,提供对实例集基础架构性能的系统级可见性。可使用此控制面板来识别实例集的整体运行状况趋势,并在检测到性能问题时深入查看单个实例的情况。
“实例性能”控制面板
此控制面板提供各个实例的详细性能指标。当前平均值显示了实例的整体运行状况。当性能下降时,请检查 CPU 使用率、内存消耗和文件系统消耗是否存在瓶颈。它包含“内存消耗最大的前 N 个游戏会话”和“CPU 消耗最大的前 N 个游戏会话”表,可帮助确定哪些进程消耗的实例资源最多。点击“游戏会话”链接可以更深入地调查详细指标。您可以按具体实例 ID 进行筛选。
“实例性能”各指标
下表显示了“实例性能”控制面板提供的指标:
| 控制面板 | 指标名称 | 定义 |
|---|---|---|
| 加载摘要 | 内存消耗最大的前 N 个游戏会话 | “负载摘要”跟踪游戏服务器的资源使用情况。该指标显示了此实例上消耗最多内存资源的游戏会话排名列表。若出现高利用率模式,需要检查各个会话指标和资源分配情况。点击“游戏会话”链接可以更深入地调查详细指标 |
| CPU 消耗最大的前 N 个游戏会话 | 此实例上消耗最多 CPU 资源的游戏会话排名列表。若出现高利用率模式,需要检查各个会话指标和资源分配情况,例如 CPU 和内存。点击“游戏会话”链接可以更深入地调查详细指标 | |
| 每个游戏会话的 CPU 使用率 | 显示每个活跃游戏会话资源消耗情况的各个 CPU 利用率明细 | |
| 每个游戏会话的内存使用率 | 显示每个活跃游戏会话资源消耗情况的各个内存利用率明细 | |
| 当前平均值 | 实例 CPU 使用率 | 所选实例在一段时间内的总体 CPU 利用率 |
| 实例内存使用率 | 所选实例在一段时间内的总体内存利用率 | |
| 实例文件系统使用率 | 所选实例的文件系统消耗情况,有助于识别存储容量问题 | |
| 网络 | 实例网络 I/O | “网络”反映了实例连接情况。该指标显示了所选实例的网络流量和数据包速率。对于延迟或连接问题,请调查网络 I/O、数据包速率和错误计数 |
| 网络连接 | 所选实例上的活动网络连接数量 | |
| 网络错误计数 | 用于确定连接问题的网络错误统计信息 | |
| 磁盘 | 磁盘 I/O 操作 | “磁盘”显示了磁盘性能。该指标显示了所选实例的磁盘读/写活动和利用率。若响应时间慢,建议检查磁盘操作、I/O 等待时间和待处理操作 |
| 磁盘 I/O 等待时间 | 等待磁盘操作完成所花费的时间 | |
| 待处理磁盘操作 | 等待处理的磁盘操作数量 |
注意
“内存消耗最大的前 N 个游戏会话”和“CPU 消耗最大的前 N 个游戏会话”表,对于识别可能影响整体实例性能的性能瓶颈和资源密集型进程至关重要。这些排名可让您快速确定有问题的游戏会话,以便进一步调查。
“容器实例集概述”控制面板
此控制面板简要概述了您的容器实例集的资源利用率和容量。它显示托管式容器实例集中所有容器的平均资源利用率,包括 CPU 预留、内存利用率和容器组状态。您可以按实例集 ID 和位置进行筛选。
“容器实例集概述”各指标
下表显示了“容器实例集概述”控制面板提供的指标:
| 控制面板 | 指标名称 | 定义 |
|---|---|---|
| 容器组状态 | 活动游戏服务器容器组 | 当前处于活动状态并已准备好托管游戏会话的容器组 |
| 空闲游戏服务器容器组 | 处于活动状态但当前未托管游戏会话的容器组 | |
| 待处理游戏服务器容器组 | 正处于启动过程中的容器组 | |
| 正在终止游戏服务器容器组 | 正处于关闭过程中的容器组 | |
| 资源利用率 | 容器 CPU 利用率 | 实例集中所有容器的平均 CPU 利用率 |
| 容器内存利用率 | 实例集中所有容器的平均内存利用率 | |
| 容器 CPU 预留 | 实例集中容器预留的 CPU 资源的百分比 | |
| 网络活动 | 容器网络输入 | 实例集中容器接收的平均网络字节数 |
| 容器网络输出 | 实例集中容器发送的平均网络字节数 |
注意
容器实例集指标通过 ECS Container Receiver 收集,提供重点关注任务级聚合和容器资源隔离的容器化工作负载可见性。
“容器性能”控制面板
此控制面板提供特定 ECS 任务中各个容器的详细性能指标。它显示各个容器的详细指标,包括 CPU 利用率、内存使用率、网络 I/O 和存储性能。您可以按具体的容器 ID 或 ECS 任务进行筛选。
“容器性能”各指标
下表显示了“容器性能”控制面板提供的指标:
| 控制面板 | 指标名称 | 定义 |
|---|---|---|
| 资源性能 | 容器 CPU 利用率 | 所选容器在一段时间内的 CPU 利用率 |
| 容器内存利用率 | 所选容器在一段时间内的内存利用率 | |
| 容器内存预留 | 所选容器预留的内存资源的百分比 | |
| 网络性能 | 容器网络 I/O | 所选容器的网络流量(输入/输出字节) |
| 网络连接 | 所选容器的活动网络连接数量 | |
| 存储性能 | 容器存储读/写 | 所选容器的存储读取和写入活动 |
| 容器存储 I/O 操作 | 所选容器执行的存储 I/O 操作数量 |
注意
容器性能指标提供了关于 ECS 任务中各个容器的资源消耗和性能特征的详细信息。
“服务器性能”控制面板
“服务器性能”控制面板显示与各个游戏会话的服务器计时、网络活动、内存和 CPU 使用率相关的指标。您可以按游戏会话 ID 进行筛选,并将指标直接导出到 Amazon CloudWatch 或 Amazon Managed Grafana。
“服务器性能”各指标
下表显示了“服务器性能”控制面板提供的指标:
| 控制面板 | 指标名称 | 定义 |
|---|---|---|
| 服务器计时 | 服务器增量时间 | 当前服务器节拍和上一个服务器节拍之间的时间差。该指标用于衡量服务器节拍率的一致性 |
| 服务器节拍率 | 显示服务器每秒处理更新的次数 | |
| 服务器节拍时间 | 服务器处理单个节拍或更新所用的时间 | |
| 服务器世界节拍时间 | 服务器每个节拍更新游戏世界所用的时间 | |
| 网络 | 连接 | 服务器已建立的网络连接总数 |
| 网络 I/O(字节) | 服务器通过网络发送和接收的字节总数 | |
| 网络 I/O(数据包) | 服务器发送和接收的网络数据表总数 | |
| 数据包丢失 | 传输过程中丢失的网络数据包的百分比 | |
| 内存 | 内存使用量(单位) | 服务器进程使用的内存总量 |
| 物理内存使用率(%) | 当前正在使用的服务器总物理内存的百分比 | |
| CPU 使用率 | CPU 使用率(%) | 游戏服务器进程使用的 CPU 资源的百分比 |