View a markdown version of this page

在 AWS PCS 中取消待定重新啟動 - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 AWS PCS 中取消待定重新啟動

取消待重新開機,以避免問題解決或不再需要重新開機時不必要的停機時間。

先決條件

  • Slurm Admin 權限

  • 節點必須具有待重新啟動 (顯示「重新啟動已發出」狀態)

  • 存取登入節點以執行命令

程序

  1. 連線至登入節點。

  2. 使用 確認節點有待重新開機scontrol show node

    scontrol show node nodename

    尋找節點狀態的「已發出重新啟動」。

  3. 執行取消命令。

    scontrol cancel_reboot nodename
  4. 驗證重新啟動取消和節點狀態是否恢復正常。

    scontrol show node nodename