View a markdown version of this page

故障診斷 Wickr 內嵌叢集安裝 - Wickr Enterprise

本指南提供 Wickr Enterprise 的文件。如果您使用的是 AWS Wickr,請參閱 AWS Wickr 管理指南AWS Wickr 使用者指南

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

故障診斷 Wickr 內嵌叢集安裝

這些疑難排解步驟的所有執行個體都假設您擁有執行 Wickr Embedded Cluster 安裝的執行個體的 shell 存取權,並已執行 ./wickr-enterprise-ha shell命令,以便能夠直接與 Kubernetes 安裝互動。

一般問題

從叢集管理畫面新增遺失的節點按鈕

封裝的安裝

如果您正在進行空隙安裝,請聯絡 Wickr Support 尋求協助以修正此行為。

標準安裝

如果您的授權包含內嵌叢集多節點權利,請執行授權同步以取得最新版本。如果您不確定或沒有此權利,請聯絡 Wickr Support。

若要執行授權同步,請完成下列步驟。

  1. 導覽至 KOTS 控制面板。

  2. 儀表板頁面上,找到頁面右上角的授權區段。

  3. 在本節的右上角,您應該會看到同步授權超連結。選取超連結。

  4. 授權同步後,UI 更新和幾秒鐘前的上次同步隨即出現。

  5. 從 KOTS 儀表板頁面的版本區段中選擇重新部署

  6. 重新部署完成後,導覽回叢集管理,您就可以新增節點。

升級問題

升級叢集上的升級卡住

如果您的升級卡在升級叢集上,這可能表示某些 Pod 未適當終止。登入執行個體並使用 ./wickr-enteprise-ha shell命令來進入 Shell 環境,以管理 kubernetes 安裝。

  1. 識別仍在執行的 Pod:

    kubectl -n kotsadm get pods | grep Running

  2. kubectl -n kotsadm delete pod name-of-running-pod

    注意

    如果其中一個執行中的 Pod 是 embedded-cluster-upgrade-XXXXXXXXXXXXXX-xxxxx kotsadm-xxxxxxx或類似,請勿將其刪除,因為這些 Pod 是執行升級的必要項目。

  3. 確認沒有剩餘的執行中 Pod。

    kubectl -n kotsadm get pods | grep Running

此程序應允許叢集升級透過 Wickr 升級繼續進行。

應用程式未在叢集升級期間更新,且無法部署新版本

如果應用程式在升級後仍保留在舊版本上,則新版本可能處於不一致的狀態。

檢查 Kubernetes 安裝記錄:

  1. 從安裝程式開啟 Kubernetes shell。

    ./wickr-enterprise-ha shell

  2. 執行下列 kubectl 命令:

    kubectl get installations

  3. 輸出看起來像這樣:

    [root@ip-172-31-6-72 ~]# kubectl get installations NAME STATE INSTALLERVERSION CREATEDAT AGE 20251113170603 Obsolete 2.1.3+k8s-1.30 2025-11-13T17:06:05Z 22h 20251113180133 Failed 2.6.0+k8s-1.31 2025-11-13T18:01:37Z 21h
  4. 刪除失敗的安裝。

    kubectl delete installation 20251113180133

  5. 嘗試透過 KOTS Admin 面板再次執行升級。

RabbitMQ Pod 日誌行失敗 Error while waiting for Mnesia tables: {timeout_waiting_for_tables}

RabbitMQ 秘密和儲存體不同步。這通常發生在多個 RabbitMQ 執行個體執行並導致領導者選擇或規定人數錯誤時。若要修正此問題,請刪除 RabbitMQ 服務及其儲存磁碟區,然後重新部署。

若要刪除失敗的 RabbitMQ,請完成下列步驟。

  1. 刪除 RabbitMQ 狀態集。

    kubectl -n kotsadm delete statefulset rabbitmq —cascade=orphan

  2. 刪除剩餘的 RabbitMQ Pod。如果有多個 RabbitMQ-X Pod 正在執行,請多次發出此命令,更新 RabbitMQ-X 值以對應至其他 Pod 名稱。

    kubectl -n kotsadm delete pod rabbitmq-0

  3. 刪除對應的 PVCs。如果有多個 Pod 正在執行,請多次發出此命令,更新 data-RabbitMQ-X 以對應至適當的 Pod。

    kubectl -n kotsadm delete pvc data-rabbitmq-0

  4. 檢查是否有任何剩餘的 Pod,如果成功,這應該不會輸出任何內容。

    kubectl -n kotsadm get pods|grep -i rabbitmq

  5. 檢查是否有任何剩餘的 PVCs,如果成功,這應該不會輸出任何內容。

    kubectl -n kotsadm get pvc|grep -i rabbitmq

  6. 透過 KOTS 管理面板重新部署。

如需更多故障診斷資訊,請參閱故障診斷