

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 问题排查
<a name="troubleshooting"></a>

本章详细介绍了在创建或管理 Amazon EVS 环境时遇到的一些常见问题。

## Broadcom and Suppor AWS t 指南
<a name="broadcom-aws-support-guidance"></a>

 AWS 为 Amazon EVS 及其相关基础设施服务（包括 VMware 云基础 (VCF)）提供支持。如需获取 VCF 特定的配置指导或与 Aria Suite、HCX 或 NSX 等其他 VMware 产品相关的问题，您也可以使用 Broadcom 支持授权直接与 Broadcom 联系。有关更多信息，请参阅 [Broadcom Support 门户](https://support.broadcom.com/)。

## 对失败的环境状态检查进行故障排除
<a name="troubleshoot-env-status"></a>

Amazon EVS 会自动检查您的环境以发现问题。您可以查看环境的状态，以确定具体和可检测的问题。

### 查看环境状态检查信息
<a name="view-env-status"></a>

 **使用 Amazon EVS 控制台调查受损环境** 

1. 打开 Amazon EVS 控制台。

1. 在导航窗格中，选择**环境**，然后选择您的环境。

1. 选择 “**详细信息**” 选项卡可查看环境概览。

1. 检查**环境状态**。将鼠标悬停在该字段上可展开弹出窗口，其中包含每个环境状态检查的单独结果。

### 可接通性检查失败
<a name="troubleshoot-reachability"></a>

可访问性检查可验证 Amazon EVS 与 SDDC Manager 的持续连接。如果 Amazon EVS 无法访问环境，则此项检查将失败。

如果此项检查失败，Amazon EVS 将无法再访问 SDDC 管理器来验证环境状态，也无法再将主机添加到环境中。可访问性故障还将导致许可证密钥重复使用和密钥覆盖检查失败，而主机计数检查返回**未知**响应。

为确保可接通，请检查以下内容：
+ 确保您的证书有效且未过期。可以使用 SDDC 管理器用户界面或 vSphere 客户端来管理 VCF 环境中的证书。部署后，建议您替换 VMware Cloud Foundation 管理域的所有证书。有关更多信息，请参阅 [ VMware Cloud Foundation 文档中的管理 VMware 云基础中的证书](https://techdocs.broadcom.com/us/en/vmware-cis/vcf/vcf-5-2-and-earlier/5-2/map-for-administering-vcf-5-2/certificate-management-admin.html)。
+ 确保您的 DNS 服务器可以从服务访问子网访问，DNS 记录有效，并且不存在重复的主机名或 IP 地址。
+ 如果您想创建自己的防火墙规则，请遵循以下准则：
  + 允许 TCP/UDP 访问 DNS 服务器。
  + 允许 HTTPS/SSH 访问主机管理 VLAN 子网。
  + 允许 HTTPS/SSH 访问管理虚拟机 VLAN 子网。

如果您在遵循本指南后仍无法解决问题，我们建议您联系 Su AWS pport 寻求进一步帮助。

### 主机计数检查失败
<a name="troubleshoot-host-count"></a>

此检查可验证您的环境是否至少有四台主机，这是 VCF 5.2.x 的要求。

如果此项检查失败，则需要添加主机，以使您的环境满足此最低要求。Amazon EVS 仅支持具有 4 到 16 个主机的环境。

### 密钥重复使用检查失败
<a name="troubleshoot-key-reuse"></a>

此检查可验证其他 Amazon EVS 环境是否未使用 VCF 许可密钥。VCF 许可证只能用于一个 Amazon EVS 环境。如果您在环境创建请求中提供的 VCF 许可证密钥已被其他环境使用，则此检查将失败。

如果此项检查失败，您将收到错误响应，提示无法创建 Amazon EVS 环境。要解决此问题，请在 SDDC 管理器中审核许可证设置，并将所有以前使用的许可证替换为未使用的许可证。

**重要**  
使用 SDDC 管理器用户界面管理 VCF 解决方案和 vSAN 许可密钥。Amazon EVS 要求您在 SDDC 管理器中保留有效的 VCF 解决方案和 vSAN 许可密钥，服务才能正常运行。虽然必须使用 vSphere Client 将密钥分配给您的主机和 vSAN 集群，但您必须确保这些密钥也显示在 SDDC Manager 用户界面的许可屏幕上。

### 密钥覆盖率检查失败
<a name="troubleshoot-key-coverage"></a>

此项检查可验证分配给 vCenter 服务器的 VCF 许可证密钥是否为所有已部署的主机分配了足够的 vCPU 内核和 vSAN 存储容量（TiB）。

如果此项检查失败，您将收到错误响应，提示无法创建 Amazon EVS 环境。密钥覆盖失败可能表示存在以下问题之一：
+ VCF 许可证未正确地分配给 vCenter 服务器。必须在 vCenter 服务器的评估期到期或当前分配的许可证到期之前，将许可证分配给该服务器。如果这是问题所在，请在 SDDC 管理器中审核许可证分配情况。
+ 当前的 VCF 许可证不涵盖 vCPU 核心和 vSAN 存储容量需求。VCF 解决方案密钥（包括最低核心数量）和 vSAN 许可密钥（包括最低 vSAN 容量）的要求因实例类型而异。有关您的配置的具体阈值，请参阅[VCF 订阅](vcf-license-mgmt.md)。如果这是问题所在，请在 SDDC 管理器中添加 vSAN 许可证，直到满足使用需求为止。

如果上述操作无法解决问题，请联系 Su AWS pport 寻求进一步帮助。

**重要**  
使用 SDDC 管理器用户界面管理 VCF 解决方案和 vSAN 许可密钥。Amazon EVS 要求您在 SDDC 管理器中保留有效的 VCF 解决方案和 vSAN 许可密钥，服务才能正常运行。虽然必须使用 vSphere Client 将密钥分配给您的主机和 vSAN 集群，但您必须确保这些密钥也显示在 SDDC Manager 用户界面的许可屏幕上。

## 此主机上的 vSphere HA 代理无法访问隔离地址
<a name="troubleshoot-vsphere-ha-agent-ipv6"></a>

在 vCenter 用户界面中，选择 ESX 主机后，您会看到消息 “此主机上的 vSphere HA 代理无法访问隔离地址 < 地址>”。IPv6 

此错误消息表示主机上的 vSphere HA 代理无法到达 vSphere HA 用于心跳检查的默认 IPv6 隔离地址。该错误消息并不表示存在问题，只是因为 Amazon EVS IPv6 目前不支持。不 IPV6 支持 Amazon EVS 不会影响 vSphere HA 的核心功能。

## ESX 主机群集的 vSAN 升级预检查失败
<a name="troubleshoot-vsan-precheck-fail"></a>

尝试使用 SDDC Manager 升级 ESX 主机群集时，与 vSAN 磁盘相关的预检查可能会失败。这是因为 Amazon EVS 使用 vSAN Express 存储架构 (ESA)，升级预检查不适用于 vSAN ESA。有关更多信息，请参阅 [Broadcom 知识库中关于此主题的文章](https://knowledge.broadcom.com/external/article/369423/upgrade-prechecks-fails-with-esxi-cluste.html)。

## 添加由于集群映像不兼容而导致的主机故障
<a name="troubleshoot-cluster-image"></a>

 **问题** 

向环境中添加主机时，该主机将安装最新版本的 EVS 自定义供应商插件。如果您的环境使用带有较旧附加版本的主机，则添加新主机会失败，并显示新主机与您的集群映像不兼容的错误。要修复此问题，必须使用 vSphere Lifecyle Manager 从新添加的主机中提取最新的可用插件版本。

 **解决方案** 

执行以下步骤。

1. 转到 vCenter VMware Server 中的主机和群集清单。

1. 通过创建一个临时的空集群，从新添加的主机中提取插件。

1. 在 “**基础知识**” 下，在 vCenter 清单中选择**从 vCenter 清单中的现有主机导入映像**并创建集群。将所有其他设置保留为默认设置。

1. 使用提取的映像创建此临时集群后，您可以删除该临时集群。现在，该插件将在您的 vSphere 生命周期管理器库中提供。

1. 转到您的环境集群并选择**更新**选项卡。

1. 编辑您的集群映像并将插件版本更改为新提取的版本。

1. 选择**保存**。

1. 在 SDDC 管理器中，重试失败的添加主机任务。这将修复您的集群主机，将所有主机更新到最新的插件版本。集群映像修复需要重新启动主机。

## SDDC 管理器在主机调试期间无法验证 VCF 主机
<a name="troubleshoot-sddc-failure-host-commission"></a>

 **问题** 

如果您在部署 Amazon EVS 环境后更新了 ESX 版本，则在 “委托主机” 步骤中验证 VCF 主机期间，SDDC 管理器可能会失败。要修复此问题，必须使用 vSphere Lifecyle Manager 在新添加的主机上升级 ESX。

 **解决方案** 

执行以下步骤。

**重要**  
这些步骤需要在 SDDC Manager 之外临时将主机添加到 vCenter。使用 vSphere Lifecyle Manager 执行除了 ESX 升级以外的任何操作都可能导致您的主机无法使用，并且需要您删除并创建新的 Amazon EVS 主机。

1. 转到 vCenter VMware Server 中的主机和群集清单。

1. 将主机临时添加到您的虚拟数据中心，确保选择**使用映像管理主机**。ESX 升级完成后，将在稍后的步骤中移除该主机。有关更多信息，请参阅《vSphere》文档中的[如何将主机添加到 vSphere 数据中心或文件夹](https://techdocs.broadcom.com/us/en/vmware-cis/vsphere/vsphere/8-0/vcenter-and-host-management-8-0/organizing-your-inventory-host-management/add-a-host-to-a-folder-or-a-data-center-host-management.html)。

1. 将主机添加到 vSphere 后，升级主机上的 ESX 版本。这可以在房东的 “**更新**” 选项卡中完成。编辑主机映像，使其与集群的 ESX 版本相匹配。

1. 升级完成后，从 vCenter 清单中移除该主机。有关更多信息，请参阅《vSp [here》文档中的如何从 vCenter 服务器实例中移除 ESX 主机](https://techdocs.broadcom.com/us/en/vmware-cis/vsphere/vsphere/8-0/vcenter-and-host-management-8-0/managing-hosts-in-vcenter-server-host-management/remove-a-host-from-vcenter-server-host-management.html)。

1. 在 SDDC 管理器中调试您的主机。有关更多信息，请参阅 VMware Cloud Foundation 文档中的[佣金主持人](https://techdocs.broadcom.com/us/en/vmware-cis/vcf/vcf-5-2-and-earlier/5-2/map-for-administering-vcf-5-2/host-management-admin/commission-hosts-admin.html)。

1. 主机调试完成后，使用 SDDC 管理器将主机添加到您的集群。

## 由于设备可访问性故障，Windows 服务器授权状态处于危险之中
<a name="troubleshoot-entitlement-at-risk"></a>

当关联的 Amazon EVS 连接器未通过 VCF 管理设备的可访问性检查时，授权进入风险状态。对于 Windows Server 授权，从权利达到风险状态之时起，您有 8 小时的时间来恢复连接。如果在这段时间内没有恢复连接，则会自动删除授权并停止 Windows Server 使用情况跟踪。

要解决此问题，请检查以下操作：
+ 验证连接器状态是否为 “活动”，且其可接通性检查状态为 “失败”。
+ 验证存储在 S AWS ecrets Manager 中的设备凭据是否最新且正确。如果证书已在设备中轮换，请更新现有 Secrets Manager 密钥中的值。如果您需要指向其他密钥， UpdateEnvironmentConnector 请使用更新密钥标识符。
+ 确保可从服务访问子网访问您的 DNS 服务器，设备 FQDN 的 DNS 记录有效，并且不存在重复的主机名或 IP 地址。
+ 确认防火墙规则允许 HTTPS/SSH 访问管理虚拟机 VLAN 子网和 TCP/UDP 访问 DNS 服务器。
+ 确保设备正在运行且可访问。

连接恢复后，授权将自动恢复到正常的 “已创建” 状态。如果授权已被删除并处于 “授权已删除” 状态，则在连接器通过可访问性检查后返回活动状态后，您必须创建新的授权。

如果您在遵循本指南后仍无法解决问题，我们建议您联系 Su AWS pport 寻求进一步帮助。

## 由于不支持访客操作系统，授权失败
<a name="troubleshoot-entitlement-unsupported-os"></a>

当 Amazon EVS 检测到虚拟机运行的客户机操作系统不支持 Amazon EVS Windows 服务器许可时，授权创建失败或现有授权被删除。

在以下情况下可能会发生这种情况：
+ 具有现有 Windows 服务器权限的虚拟机将重新配置为使用不支持的操作系统版本或非 Windows 操作系统。
+ 由于虚拟机已经在运行不受支持的客户机操作系统，因此授权创建失败。

要解决此问题，请执行以下操作：
+ 验证连接器状态是否为 “活动”，且其可接通性检查状态为 “通过”。
+ 验证虚拟机上配置的客户机操作系统。亚马逊 EVS Windows 服务器许可支持 Windows Server 2016 或更高版本。
+ 重新配置虚拟机以使用支持的 Windows 服务器版本。
+ 更新客户机操作系统后，为虚拟机创建新的授权。
+ （**可选**）删除处于 “权利已删除” 状态的权利。

如果您在遵循本指南后仍无法解决问题，我们建议您联系 Su AWS pport 寻求进一步帮助。

## 权利状态为权利已删除
<a name="troubleshoot-entitlement-removed"></a>

处于 “授权已删除” 状态的授权表明 Amazon EVS 已删除该虚拟机的权限。删除授权后，对受影响虚拟机的 Windows 服务器使用情况跟踪将停止。

这种状态可能由多种原因导致：
+ 超过 8 小时宽限期的设备可接通性故障。请参阅[由于设备可访问性故障，Windows 服务器授权状态处于危险之中](#troubleshoot-entitlement-at-risk)。
+ 虚拟机不再出现在设备清单中。请参阅[由于虚拟机断开连接、已隔离或清单中缺失而导致权利被移除](#troubleshoot-entitlement-vm-disconnect)。
+ VM 已与其主机断开连接或隔离。请参阅[由于虚拟机断开连接、已隔离或清单中缺失而导致权利被移除](#troubleshoot-entitlement-vm-disconnect)。
+ 虚拟机客户机操作系统已更改为不支持的版本。请参阅[由于不支持访客操作系统，授权失败](#troubleshoot-entitlement-unsupported-os)。

要恢复权利，请执行以下操作：
+ 查看权利的错误详细信息以确定删除的具体原因。
+ 解决潜在问题。
+ 在连接器处于 “活动” 状态、可访问性检查处于 “通过” 状态后，为虚拟机创建新的授权。
+ （**可选**）删除处于 “权利已删除” 状态的权利。

如果您在遵循本指南后仍无法解决问题，我们建议您联系 Su AWS pport 寻求进一步帮助。

## 由于虚拟机断开连接、已隔离或清单中缺失而导致权利被移除
<a name="troubleshoot-entitlement-vm-disconnect"></a>

当 Amazon EVS 检测到虚拟机已断开连接、被隔离或不再存在于设备清单中时，该授权将被删除。该授权将立即删除，并停止使用情况跟踪。

要解决此问题，请执行以下操作：
+ 验证连接器状态是否为 “活动”，且其可接通性检查状态为 “通过”。
+ 在设备中检查虚拟机的连接状态。已断开连接或隔离的虚拟机可能表示存在主机或网络问题。
+ 解决导致虚拟机断开连接或隔离的底层主机或网络问题。
+ 在虚拟机重新连接并正常运行后，创建新的权限以恢复 Windows 服务器的使用。

如果您在遵循本指南后仍无法解决问题，我们建议您联系 Su AWS pport 寻求进一步帮助。