更新 AWS PCS 集群 - AWS PC

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

更新 AWS PCS 集群

使用这些步骤修改集群上的调度程序设置、记账配置和 Slurm 自定义设置。有关更多信息,请参阅 PCS 集群的自定义 Slurm 设置 AWS

先决条件

  • 集群必须处于ACTIVEUPDATE_FAILED、或SUSPENDED状态

  • 所有关联的资源(队列、计算节点组)都必须处于ACTIVE状态

  • 无法进行其他更新操作

过程

AWS Management Console
  1. 打开 AWS PCS 控制台,网址为https://console.aws.amazon.com/pcs/

  2. 在导航窗格中,选择集群

  3. 选择要更新的集群。

  4. 选择编辑

  5. 在编辑集群页面上,修改所需的设置:

    • 在 S cheduler 配置下,更新 Scale-down 空闲时间,以控制动态实例在自动终止之前保持空闲状态的时间。

    • 根据需要修改 PrologEpilogSelect-Type 参数设置

    • 启用、禁用或配置托管记账的保留时间。

    • 在 “其他调度程序设置” 下,添加、编辑或删除 Slurm 自定义设置。有关支持的参数的更多信息,请参阅PCS 集群的自定义 Slurm 设置 AWS

    注意

    无法编辑的字段显示为只读并显示其当前值。

  6. 选择 “更新” 以提交更改。

  7. 监控集群状态,在此过程中显示为 “正在更新”。更新成功完成后,状态会发生变化。

AWS CLI
  1. 打开终端或命令提示符。

  2. 使用以下命令验证集群状态:

    aws pcs get-cluster --cluster-identifier my-cluster
  3. 使用以下示例之一提交更新请求:

    • 要启用管理记账,请执行以下操作:

      aws pcs update-cluster --cluster-identifier my-cluster \ --slurm-configuration 'accounting={mode=STANDARD}'
    • 要更新 Slurm Prolog 设置,请执行以下操作:

      aws pcs update-cluster --cluster-identifier my-cluster \ --slurm-configuration \ 'SlurmCustomSettings=[{parameterName=Prolog,parameterValue="/path/to/prolog.sh"}]'
    • 要更新缩减空闲时间,请执行以下操作:

      aws pcs update-cluster --cluster-identifier my-cluster \ --slurm-configuration 'scaleDownIdleTimeInSeconds=300'
  4. 通过检查集群状态来监控更新进度:

    aws pcs get-cluster --cluster-identifier my-cluster

更新请求成功后,该命令将返回包含所有更改的 Cluster 对象。完成ACTIVE后,集群状态UPDATING将从变为。