本指南提供了 Wickr Enterprise 的文档。如果您使用的是 AWS Wickr,请参阅 AWS Wickr 管理指南或 AW S Wickr 用户指南。
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Wickr 嵌入式集群安装故障排除
这些故障排除步骤的所有实例都假设您对运行 Wickr Embedded Cluster 安装的实例拥有 shell 访问权限,并且已运行./wickr-enterprise-ha
shell命令以便能够直接与 Kubernetes 安装进行交互。
一般性问题
集群管理屏幕中缺少 “添加节点” 按钮
Airgapped 安装
如果您正在安装 airgap,请联系 Wickr Support 寻求帮助,以纠正此行为。
标准安装
如果您的许可证包括嵌入式集群多节点授权,请执行许可证同步以获取最新版本。如果您不确定或没有此权利,请联系 Wickr Support。
要执行许可证同步,请完成以下步骤。
-
导航到 KOTS 控制面板。
-
在 “控制面板” 页面上,找到页面右上角区域的许可证部分。
-
在本部分的右上角,您应该会看到同步许可证超链接。选择超链接。
-
许可证同步后,会显示用户界面更新和几秒钟前的最后一次同步。
-
从 KOTS 控制面板页面的 “版本” 部分选择 “重新部署”。
-
重新部署完成后,导航回集群管理,即可添加节点。
升级问题
升级集群时升级停滞不前
如果你的升级在升级集群时停滞不前,这可能意味着某些 pod 没有被适当地终止。登录实例并使用./wickr-enteprise-ha shell命令进入用于管理 kubernetes 安装的 shell 环境。
-
识别仍在运行的 pod:
kubectl -n kotsadm get pods | grep Running -
kubectl -n kotsadm delete podname-of-running-pod注意
如果其中一个正在运行的 pod 是
embedded-cluster-upgrade-XXXXXXXXXXXXXX-xxxxxkotsadm-xxxxxxx或类似的,请不要将其删除,因为这些 Pod 是执行升级所必需的。 -
确认没有剩余的正在运行的 pod。
kubectl -n kotsadm get pods | grep Running
此过程应允许通过 Wickr 升级继续进行集群升级。
集群升级期间应用程序未更新且无法部署新版本
如果应用程序在升级后仍使用旧版本,则新版本可能处于不一致的状态。
查看 Kubernetes 的安装记录:
-
从安装程序中打开 Kubernetes 外壳。
./wickr-enterprise-ha shell -
运行以下 kubectl 命令:
kubectl get installations -
输出将如下所示:
[root@ip-172-31-6-72 ~]# kubectl get installations NAME STATE INSTALLERVERSION CREATEDAT AGE 20251113170603 Obsolete 2.1.3+k8s-1.30 2025-11-13T17:06:05Z 22h 20251113180133 Failed 2.6.0+k8s-1.31 2025-11-13T18:01:37Z 21h -
删除失败的安装。
kubectl delete installation 20251113180133 -
尝试通过 KOTS 管理面板再次运行升级。
RabbitMQ Pod 因日志行而失败 Error while waiting for Mnesia tables:
{timeout_waiting_for_tables}
RabbitMQ 密钥和存储空间不同步。当多个 RabbitMQ 实例运行并导致领导者选择或法定人数错误时,通常会发生这种情况。要修复此问题,请删除 RabbitMQ 服务及其存储卷,然后重新部署。
要删除失败的 RabbitMQ,请完成以下步骤。
-
删除 RabbitMQ Statefulset。
kubectl -n kotsadm delete statefulset rabbitmq —cascade=orphan -
删除剩余的 RabbitMQ 吊舱。如果有多个 RabbitMQ-X 容器在运行,请多次发出此命令,更新 RabbitMQ-X 值以使其与其他 pod 名称相对应。
kubectl -n kotsadm delete pod rabbitmq-0 -
删除相应的 PVCs。如果有多个 pod 在运行,请多次发出此命令,更新 data-RabbitMQ-X以对应相应的 pod。
kubectl -n kotsadm delete pvc data-rabbitmq-0 -
检查是否还有剩余的 pod,如果成功则不会输出任何内容。
kubectl -n kotsadm get pods|grep -i rabbitmq -
检查是否还有剩余内容 PVCs,如果成功则不会输出任何内容。
kubectl -n kotsadm get pvc|grep -i rabbitmq -
通过 KOTS 管理面板重新部署。
有关故障排除的更多信息,请参阅故障排除。