本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
更新 AWS PCS 集群
使用这些步骤修改集群上的调度程序设置、记账配置和 Slurm 自定义设置。有关更多信息,请参阅 PCS 集群的自定义 Slurm 设置 AWS。
先决条件
-
集群必须处于
ACTIVEUPDATE_FAILED、或SUSPENDED状态 -
所有关联的资源(队列、计算节点组)都必须处于
ACTIVE状态 -
无法进行其他更新操作
过程
- AWS Management Console
-
-
打开 AWS PCS 控制台,网址为https://console.aws.amazon.com/pcs/
。 -
在导航窗格中,选择集群。
-
选择要更新的集群。
-
选择编辑。
-
在编辑集群页面上,修改所需的设置:
-
在 S cheduler 配置下,更新 Scale-down 空闲时间,以控制动态实例在自动终止之前保持空闲状态的时间。
-
根据需要修改 Prolog、Epilog 和 Select-Type 参数设置。
-
启用、禁用或配置托管记账的保留时间。
-
在 “其他调度程序设置” 下,添加、编辑或删除 Slurm 自定义设置。有关支持的参数的更多信息,请参阅PCS 集群的自定义 Slurm 设置 AWS。
注意
无法编辑的字段显示为只读并显示其当前值。
-
-
选择 “更新” 以提交更改。
-
监控集群状态,在此过程中显示为 “正在更新”。更新成功完成后,状态会发生变化。
-
- AWS CLI
-
-
打开终端或命令提示符。
-
使用以下命令验证集群状态:
aws pcs get-cluster --cluster-identifiermy-cluster -
使用以下示例之一提交更新请求:
-
要启用管理记账,请执行以下操作:
aws pcs update-cluster --cluster-identifiermy-cluster\ --slurm-configuration 'accounting={mode=STANDARD}' -
要更新 Slurm Prolog 设置,请执行以下操作:
aws pcs update-cluster --cluster-identifiermy-cluster\ --slurm-configuration \ 'SlurmCustomSettings=[{parameterName=Prolog,parameterValue="/path/to/prolog.sh"}]' -
要更新缩减空闲时间,请执行以下操作:
aws pcs update-cluster --cluster-identifiermy-cluster\ --slurm-configuration 'scaleDownIdleTimeInSeconds=300'
-
-
通过检查集群状态来监控更新进度:
aws pcs get-cluster --cluster-identifiermy-cluster
更新请求成功后,该命令将返回包含所有更改的 Cluster 对象。完成
ACTIVE后,集群状态UPDATING将从变为。 -