View a markdown version of this page

Wickr 嵌入式集群安装故障排除 - Wickr Enterprise

本指南提供了 Wickr Enterprise 的文档。如果您使用的是 AWS Wickr,请参阅 AWS Wickr 管理指南或 AW S Wickr 用户指南。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Wickr 嵌入式集群安装故障排除

这些故障排除步骤的所有实例都假设您对运行 Wickr Embedded Cluster 安装的实例拥有 shell 访问权限,并且已运行./wickr-enterprise-ha shell命令以便能够直接与 Kubernetes 安装进行交互。

一般性问题

集群管理屏幕中缺少 “添加节点” 按钮

Airgapped 安装

如果您正在安装 airgap,请联系 Wickr Support 寻求帮助,以纠正此行为。

标准安装

如果您的许可证包括嵌入式集群多节点授权,请执行许可证同步以获取最新版本。如果您不确定或没有此权利,请联系 Wickr Support。

要执行许可证同步,请完成以下步骤。

  1. 导航到 KOTS 控制面板。

  2. 在 “控制面板” 页面上,找到页面右上角区域的许可证部分。

  3. 在本部分的右上角,您应该会看到同步许可证超链接。选择超链接。

  4. 许可证同步后,会显示用户界面更新和几秒钟前的最后一次同步

  5. 从 KOTS 控制面板页面的 “版本” 部分选择 “重新部署”。

  6. 重新部署完成后,导航回集群管理,即可添加节点。

升级问题

升级集群时升级停滞不前

如果你的升级在升级集群时停滞不前,这可能意味着某些 pod 没有被适当地终止。登录实例并使用./wickr-enteprise-ha shell命令进入用于管理 kubernetes 安装的 shell 环境。

  1. 识别仍在运行的 pod:

    kubectl -n kotsadm get pods | grep Running

  2. kubectl -n kotsadm delete pod name-of-running-pod

    注意

    如果其中一个正在运行的 pod 是embedded-cluster-upgrade-XXXXXXXXXXXXXX-xxxxxkotsadm-xxxxxxx或类似的,请不要将其删除,因为这些 Pod 是执行升级所必需的。

  3. 确认没有剩余的正在运行的 pod。

    kubectl -n kotsadm get pods | grep Running

此过程应允许通过 Wickr 升级继续进行集群升级。

集群升级期间应用程序未更新且无法部署新版本

如果应用程序在升级后仍使用旧版本,则新版本可能处于不一致的状态。

查看 Kubernetes 的安装记录:

  1. 从安装程序中打开 Kubernetes 外壳。

    ./wickr-enterprise-ha shell

  2. 运行以下 kubectl 命令:

    kubectl get installations

  3. 输出将如下所示:

    [root@ip-172-31-6-72 ~]# kubectl get installations NAME STATE INSTALLERVERSION CREATEDAT AGE 20251113170603 Obsolete 2.1.3+k8s-1.30 2025-11-13T17:06:05Z 22h 20251113180133 Failed 2.6.0+k8s-1.31 2025-11-13T18:01:37Z 21h
  4. 删除失败的安装。

    kubectl delete installation 20251113180133

  5. 尝试通过 KOTS 管理面板再次运行升级。

RabbitMQ Pod 因日志行而失败 Error while waiting for Mnesia tables: {timeout_waiting_for_tables}

RabbitMQ 密钥和存储空间不同步。当多个 RabbitMQ 实例运行并导致领导者选择或法定人数错误时,通常会发生这种情况。要修复此问题,请删除 RabbitMQ 服务及其存储卷,然后重新部署。

要删除失败的 RabbitMQ,请完成以下步骤。

  1. 删除 RabbitMQ Statefulset。

    kubectl -n kotsadm delete statefulset rabbitmq —cascade=orphan

  2. 删除剩余的 RabbitMQ 吊舱。如果有多个 RabbitMQ-X 容器在运行,请多次发出此命令,更新 RabbitMQ-X 值以使其与其他 pod 名称相对应。

    kubectl -n kotsadm delete pod rabbitmq-0

  3. 删除相应的 PVCs。如果有多个 pod 在运行,请多次发出此命令,更新 data-RabbitMQ-X以对应相应的 pod。

    kubectl -n kotsadm delete pvc data-rabbitmq-0

  4. 检查是否还有剩余的 pod,如果成功则不会输出任何内容。

    kubectl -n kotsadm get pods|grep -i rabbitmq

  5. 检查是否还有剩余内容 PVCs,如果成功则不会输出任何内容。

    kubectl -n kotsadm get pvc|grep -i rabbitmq

  6. 通过 KOTS 管理面板重新部署。

有关故障排除的更多信息,请参阅故障排除