故障排查 - 亚马逊弹性 VMware 服务

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

故障排查

本章详细介绍了在创建或管理 Amazon EVS 环境时遇到的一些常见问题。

对失败的环境状态检查进行故障排除

Amazon EVS 会自动检查您的环境以发现问题。您可以查看环境的状态以确定具体且可检测到的问题。

查看环境状态检查信息

使用 Amazon EVS 控制台调查受损环境

  1. 打开 Amazon EVS 控制台。

  2. 在导航窗格中,选择环境,然后选择您的环境。

  3. 选择 “详细信息” 选项卡以查看环境概述。

  4. 检查环境状态。将鼠标悬停在该字段上可展开弹出窗口,其中包含每个环境状态检查的单独结果。

可接通性检查失败

可访问性检查可验证 Amazon EVS 与 SDDC Manager 的持续连接。如果 Amazon EVS 无法访问环境,则此检查将失败。

如果此检查失败,Amazon EVS 将无法再访问 SDDC Manager 来验证环境状态,也无法再将主机添加到环境中。可访问性失败还会导致许可证密钥重复使用和密钥覆盖率检查失败,并且主机计数检查返回未知响应。

为确保可接通,请检查以下内容:

  • 确保您的证书有效且未过期。您可以使用 SDDC 管理器用户界面或 vSphere 客户端在 VCF 环境中管理证书。部署后,建议您替换 VMware Cloud Foundation 管理域的所有证书。有关更多信息,请参阅 VMware Cloud Foundation 文档中的管理 VMware 云基础中的证书

  • 确保您的 DNS 服务器可以从服务访问子网访问,DNS 记录有效,并且不存在重复的主机名或 IP 地址。

  • 如果您想创建自己的防火墙规则,请遵循以下准则:

    • 允许 TCP/UDP 访问 DNS 服务器。

    • 允许 HTTPS/SSH 访问主机管理 VLAN 子网。

    • 允许 HTTPS/SSH 访问管理虚拟机 VLAN 子网。

如果您在遵循本指南后仍无法解决问题,我们建议您联系 Su AWS pport 寻求进一步帮助。

主机计数检查失败

此检查可验证您的环境是否至少有四台主机,这是 VCF 5.2.1 的要求。

如果此检查失败,则需要添加主机,以使您的环境满足此最低要求。Amazon EVS 仅支持 4 到 16 台主机的环境。

密钥重复使用检查失败

此检查可验证其他 Amazon EVS 环境是否未使用 VCF 许可密钥。VCF 许可证只能用于一个 Amazon EVS 环境。如果您在环境创建请求中提供的 VCF 许可证密钥已被其他环境使用,则此检查将失败。

如果此检查失败,您将收到错误响应,提示无法创建 Amazon EVS 环境。要解决此问题,请在 SDDC Manager 中查看您的许可证设置,并将所有以前使用的许可证替换为未使用的许可证。

重要

使用 SDDC 管理器用户界面管理 VCF 解决方案和 vSAN 许可密钥。Amazon EVS 要求您在 SDDC 管理器中保留有效的 VCF 解决方案和 vSAN 许可密钥,服务才能正常运行。虽然必须使用 vSphere Client 将密钥分配给您的主机和 vSAN 集群,但您必须确保这些密钥也显示在 SDDC Manager 用户界面的许可屏幕上。

密钥覆盖率检查失败

此检查可验证分配给 vCenter Server 的 VCF 许可密钥是否为所有已部署的主机分配了足够的 vCPU 核心和 vSAN 存储容量 (TiB)。

如果此检查失败,您将收到错误响应,提示无法创建 Amazon EVS 环境。密钥覆盖失败可能表示存在以下问题之一:

  • VCF 许可证未正确分配给 vCenter 服务器。在 vCenter Server 的评估期到期或当前分配的许可证到期之前,您必须为其分配许可证。如果是这个问题,请在 SDDC 管理器中查看许可证分配。

  • 当前的 VCF 许可证不涵盖 vCPU 核心和 vSAN 存储容量需求。VCF 解决方案密钥必须至少有 256 个内核。vSAN 许可密钥必须至少有 110 TiB 的 vSAN 容量。如果是这个问题,请在 SDDC Manager 中添加 vSAN 许可,直到您的使用需求得到满足。

如果上述操作无法解决问题,请联系 Su AWS pport 寻求进一步帮助。

重要

使用 SDDC 管理器用户界面管理 VCF 解决方案和 vSAN 许可密钥。Amazon EVS 要求您在 SDDC 管理器中保留有效的 VCF 解决方案和 vSAN 许可密钥,服务才能正常运行。虽然必须使用 vSphere Client 将密钥分配给您的主机和 vSAN 集群,但您必须确保这些密钥也显示在 SDDC Manager 用户界面的许可屏幕上。

此主机上的 vSphere HA 代理无法访问隔离地址

在 vCenter 用户界面中,选择 ESXi 主机后,您会看到消息 “此主机上的 vSphere HA 代理无法访问隔离地址 < 地址>”。IPv6

此错误消息表示主机上的 vSphere HA 代理无法到达 vSphere HA 用于心跳检查的默认 IPv6 隔离地址。该错误消息并不表示存在问题,只是因为 Amazon EVS IPv6 目前不支持。不 IPV6 支持 Amazon EVS 不会影响 vSphere HA 的核心功能。

主机群集的 vSAN 升级预检查失败 ESXi

尝试使用 SDDC 管理器升级 ESXi 主机集群时,与 vSAN 磁盘相关的预检查可能会失败。这是因为 Amazon EVS 使用 vSAN Express 存储架构 (ESA),升级预检查不适用于 vSAN ESA。有关更多信息,请参阅 Broadcom 知识库中关于此主题的文章

添加由于集群映像不兼容而导致的主机故障

问题

向环境中添加主机时,该主机将安装最新版本的 EVS 自定义供应商插件。如果您的环境使用带有较旧附加版本的主机,则添加新主机会失败,并显示新主机与您的集群映像不兼容的错误。要修复此问题,必须使用 vSphere Lifecyle Manager 从新添加的主机中提取最新的可用附加版本。

解决方案

执行以下步骤。

  1. 转到 vCenter VMware Server 中的主机和群集清单。

  2. 通过创建一个临时的空集群,从新添加的主机中提取插件。

  3. 在 “基础知识” 下,在 vCenter 清单中选择从 vCenter 清单中的现有主机导入映像并创建集群。将所有其他设置保留为默认设置。

  4. 使用提取的映像创建此临时集群后,您可以删除该临时集群。现在,该插件将在您的 vSphere 生命周期管理器库中提供。

  5. 转到您的环境集群并选择更新选项卡。

  6. 编辑您的集群映像并将插件版本更改为新提取的版本。

  7. 选择保存

  8. 在 SDDC 管理器中,重试失败的添加主机任务。这将修复您的集群主机,将所有主机更新到最新的插件版本。集群映像修复需要重新启动主机。

SDDC 管理器在主机调试期间无法验证 VCF 主机

问题

如果您在 Amazon EVS 环境部署后更新了 ESXi 版本,则在 “委托主机” 步骤中验证 VCF 主机期间,SDDC 管理器可能会失败。要修复此问题,必须使用 vSphere Lifecyle Manager 在新添加的主机 ESXi 上进行升级。

解决方案

执行以下步骤。

重要

这些步骤需要在 SDDC Manager 之外临时将主机添加到 vCenter。使用 vSphere Lifecyle Manager 执行除 ESXi 升级之外的任何操作都可能导致您的主机无法使用,并且需要您删除并创建新的 Amazon EVS 主机。

  1. 转到 vCenter VMware Server 中的主机和群集清单。

  2. 将主机临时添加到您的虚拟数据中心,确保选择使用映像管理主机。 ESXi 升级完成后,将在后续步骤中移除该主机。有关更多信息,请参阅《vSphere》文档中的如何将主机添加到 vSphere 数据中心或文件夹

  3. 将主机添加到 vSphere 后,升级主机上的 ESX 版本。这可以在房东的 “更新” 选项卡中完成。编辑主机映像,使其与集群的 ESX 版本相匹配。

  4. 升级完成后,从 vCenter 清单中移除该主机。有关更多信息,请参阅《vSphere》文档中的如何从 vCenter 服务器实例中移除 ESXi 主机

  5. 在 SDDC 管理器中调试您的主机。有关更多信息,请参阅 VMware Cloud Foundation 文档中的佣金主持人

  6. 主机调试完成后,使用 SDDC 管理器将主机添加到您的集群。