

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 监控 Amazon GameLift Servers
<a name="monitoring-overview"></a>

监控是维护和其他 AWS 解决方案的可靠性、可用性和性能的重要组成部分。Amazon GameLift ServersAmazon GameLift Servers 指标有三个主要用途：监控系统运行状况和设置警报；跟踪游戏服务器的性能和使用情况；以及使用手动或自动扩展功能管理容量。

AWS 提供以下监控工具Amazon GameLift Servers，供您监视、报告问题并在适当时自动采取措施：
+ **Amazon GameLift Servers 控制台** – 使用图形界面管理您的 Amazon GameLift Servers 资源并跟踪游戏托管活动。
+ **服务器遥测指标** – Amazon GameLift Servers 支持您通过 SDK 和插件集成，直接从游戏服务器发送自定义指标。您可以定义并跟踪自己的游戏特定指标以及内置的性能、网络、内存和计时数据。所有指标都可以发布到 [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html)，并使用完全可自定义的控制面板在 Amazon Grafana 中进行监控。您也可以发布到 Amazon CloudWatch 以与其他 AWS 服务集成。遥测系统是完全可定制的——除了内置指标外，您还可以创建自定义 Prometheus 查询，以获取其他指标。有关特定技术栈的实施指南，请参阅[使用服务器遥测指标进行监控](monitoring-gamelift-servers-metrics.md)。
+ **Amazon CloudWatch** — 您可以实时监控Amazon GameLift Servers指标，以及您在 AWS 服务上运行的其他 AWS 资源和应用程序的指标。Amazon CloudWatch 提供了一套监控功能，包括用于创建自定义控制面板的工具，以及设置警报以在指标达到指定阈值时发出通知或采取行动的功能。
+ **AWS CloudTrail**— 捕获由您的账户或代表您的 AWS 账户为和其他 AWS 服务进行的所有 API 调用Amazon GameLift Servers和相关事件。数据将作为日志文件传送到您指定的 Amazon S3 存储桶。您可以识别哪些用户和帐户拨打了电话 AWS、发出呼叫的源 IP 地址以及呼叫发生的时间。
+ **游戏会话日志** – 您可以将游戏会话的自定义服务器消息输出到存储在 Amazon S3 中的日志文件中。

## 跨监控源的指标比较
<a name="monitoring-metrics-comparison"></a>

Amazon GameLift Servers通过三个主要来源提供指标：Amazon GameLift Servers控制台舰队活动指标、服务器遥测指标和 Amazon CloudWatch Amazon GameLift Servers 指标。了解每个来源的重叠情况和独特功能，可以帮助您根据需要选择合适的监控方法。

### 按来源划分的指标可用性
<a name="metrics-overlap-analysis"></a>

下表按指标类别显示了不同监控来源可用的指标。

#### 实例指标
<a name="instance-metrics-table"></a>

实例集容量和运行状况监控的实例级指标：


**实例指标可用性**  

| 指标 | 控制台 | CloudWatch | 遥测 | 
| --- | --- | --- | --- | 
| 活动实例 | ✓ | ✓ | ✓ | 
| 空闲实例 | ✓ | ✓ | ✓\* | 
| 空闲实例所占百分比 | ✓ | ✓ | ✓\* | 
| 预期实例数 | ✓ | ✓ |  | 
| 最大实例数 | ✓ | ✓ |  | 
| 最小实例数 | ✓ | ✓ |  | 
| CPU 使用率 |  | ✓ | ✓ | 
| 网络输入/输出量 |  | ✓ | ✓ | 
| Disk/Storage read/write |  | ✓ | ✓ | 
| 实例中断次数 | ✓ | ✓ |  | 
| 实例回收次数 | ✓ | ✓ |  | 
| 运行不正常的实例替换次数 |  | ✓ |  | 

**\***可通过使用遥测数据的自定义 Prometheus 查询获取。

#### 游戏服务器指标
<a name="game-server-metrics-table"></a>

服务器进程和游戏会话指标：


**游戏服务器指标可用性**  

| 指标 | 控制台 | CloudWatch | 遥测 | 
| --- | --- | --- | --- | 
| 有效游戏会话 | ✓ | ✓ | ✓\* | 
| 激活游戏会话 | ✓ | ✓ |  | 
| 可用的游戏会话 | ✓ | ✓ |  | 
| 可用游戏会话所占百分比 | ✓ | ✓ |  | 
| 并发可激活游戏会话数 | ✓ | ✓ |  | 
| 游戏会话中断次数 | ✓ | ✓ |  | 
| 活动服务器进程数 |  |  | ✓ | 
| 运行状况良好的游戏服务器数 |  |  | ✓ | 
| 崩溃的游戏会话数 |  |  | ✓ | 

**\***可通过使用遥测数据的自定义 Prometheus 查询获取。

#### 玩家使用情况指标
<a name="player-metrics-table"></a>

玩家会话和并发用户指标：


**玩家使用情况指标可用性**  

| 指标 | 控制台 | CloudWatch | 遥测 | 
| --- | --- | --- | --- | 
| 当前玩家会话 | ✓ |  |  | 
| 玩家会话激活次数 | ✓ |  |  | 
| 全局并发用户数（CCU） |  |  | ✓ | 
| 位置并发用户数（CCU） |  |  | ✓ | 
| 位置容量 |  |  | ✓ | 

#### 容器实例集指标
<a name="container-metrics-table"></a>

特定于容器的指标（仅 CloudWatch 适用于集装箱舰队）：


**容器实例集指标可用性**  

| 指标 | 控制台 | CloudWatch | 遥测 | 
| --- | --- | --- | --- | 
| 活动容器组数 |  | ✓ | ✓ | 
| 空闲容器组数 |  | ✓ | ✓ | 
| 容器 CPU/Memory 利用率 |  | ✓ | ✓ | 
| 容器网络流量 |  | ✓ | ✓ | 
| 容器存储操作次数 |  | ✓ | ✓ | 

#### 选择合适的监控源
<a name="monitoring-source-selection"></a>

根据具体需求选择监控方法：
+ **使用服务器遥测指标**来监控来自游戏服务器的全面性能数据，并发出特定于游戏的自定义指标。这些指标可以详细了解所有游戏引擎和服务器的服务器性能、网络活动、内存使用情况和计时数据 SDKs。您可针对游戏事件、业务逻辑性能和特定于应用程序的数据点定义自定义指标。所有控制面板均可完全自定义，您可以创建自定义 Prometheus 查询，从收集的数据中获取更多指标。有关更多信息，请参阅 [使用服务器遥测指标进行监控](monitoring-gamelift-servers-metrics.md)。
+ **使用 Amazon GameLift Servers 控制台**实现实例集管理、容量规划和一般运营监督。该控制台提供实例集运行状况与玩家活动的集成视图。有关更多信息，请参阅 [使用 Amazon GameLift Servers 管理游戏托管资源](gamelift-console-intro.md)。
+ **使用 Amazon CloudWatch** 进行自动监控、警报以及与其他 AWS 服务的集成。 CloudWatch 启用自定义仪表板和基于警报的自动化。有关更多信息，请参阅 [Amazon GameLift Servers使用 Amazon 进行监控 CloudWatch](monitoring-cloudwatch.md)。
+ **使用 [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html)** 实现高性能指标收集与存储，并支持 PromQL 查询功能。Prometheus 为服务器遥测指标提供可扩展的时间序列数据存储。
+ **使用 [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html)** 实现高级可视化和完全可自定义的控制面板管理。Grafana 提供您可以自定义和扩展的 GameLift 预建仪表板，还支持创建包含多个数据源的完全自定义的仪表板。您可以构建自定义查询和可视化工具，以追踪游戏中任何重要的指标。
+ **使用多个来源**实现全面监控。将控制台监督、服务器遥测指标和自动化警报结合起来，全面了解游戏托管基础设施。

要获得其他监控功能，还可使用以下方法：
+ [使用记录 Amazon GameLift Servers API 调用 AWS CloudTrail](logging-using-cloudtrail.md) – 跟踪 API 调用和相关事件，满足审计与合规性要求。
+ [在 Amazon GameLift Servers 中记录服务器消息](logging-server-messages.md) – 捕获自定义服务器消息和游戏会话日志。

### 主题
<a name="monitoring-topics"></a>
+ [使用 Amazon GameLift Servers 管理游戏托管资源](gamelift-console-intro.md)
+ [Amazon GameLift Servers使用 Amazon 进行监控 CloudWatch](monitoring-cloudwatch.md)
+ [使用服务器遥测指标进行监控](monitoring-gamelift-servers-metrics.md)
+ [使用记录 Amazon GameLift Servers API 调用 AWS CloudTrail](logging-using-cloudtrail.md)
+ [在 Amazon GameLift Servers 中记录服务器消息](logging-server-messages.md)