View a markdown version of this page

取消 AWS PCS 中待重启的操作 - AWS PC

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

取消 AWS PCS 中待重启的操作

取消待定重启,以避免在问题得到解决或不再需要重启时出现不必要的停机。

先决条件

  • Slurm 管理员权限

  • 节点必须处于待重启状态(显示 “重启已发出” 状态)

  • 访问登录节点以执行命令

过程

  1. Connect 连接到登录节点。

  2. 使用验证节点是否处于待重启状态scontrol show node

    scontrol show node nodename

    在节点状态中查找 “已发出重启通知”。

  3. 执行取消命令。

    scontrol cancel_reboot nodename
  4. 验证是否取消重启并且节点状态恢复正常。

    scontrol show node nodename