本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
嘗試更新叢集
下一節針對您嘗試更新叢集時可能發生的問題,提供可能的疑難排解解決方案。
pcluster update-cluster 命令無法在本機執行
如需失敗詳細資訊,~/.parallelcluster/pcluster-cli.log請參閱本機檔案系統中的 。
使用 clusterStatusUPDATE_FAILEDpcluster describe-cluster命令查看
如果叢集堆疊更新復原,請檢查 /var/log/chef-client.log 檔案以取得錯誤詳細資訊。
檢查 GitHub 上的 GitHub 已知問題
如果根據日誌 復原失敗/var/log/chef-client.log,則可能clustermgtd已停止,以防止失敗的擴增。在這種情況下,您需要在 Head Node 上執行下列命令來手動重新啟動它:
$/opt/parallelcluster/pyenv/versions/3.12.11/envs/cookbook_virtualenv/bin/supervisorctl start clustermgtd
叢集更新逾時
這可能是與cfn-hup未執行相關的問題。如果cfn-hup魔抗被外部原因終止,則不會自動重新啟動。如果 cfn-hup 未執行,在叢集更新期間,CloudFormation 堆疊會如預期啟動更新程序,但前端節點上不會啟動更新程序,且堆疊部署最終會逾時。如需詳細資訊,請參閱 在 cfn-hup 未執行時對叢集更新逾時進行故障診斷以疑難排解並從問題中復原。