本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 AWS PCS 中取消待定重新啟動
取消待重新開機,以避免問題解決或不再需要重新開機時不必要的停機時間。
先決條件
-
Slurm Admin 權限
-
節點必須具有待重新啟動 (顯示「重新啟動已發出」狀態)
-
存取登入節點以執行命令
程序
-
連線至登入節點。
-
使用 確認節點有待重新開機
scontrol show node。scontrol show nodenodename尋找節點狀態的「已發出重新啟動」。
-
執行取消命令。
scontrol cancel_rebootnodename -
驗證重新啟動取消和節點狀態是否恢復正常。
scontrol show nodenodename