本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将独立登录节点连接到 AWS PCS 中的多个集群
该pcs-multi-cluster-login-configure.sh脚本提供了一种在单个独立登录节点上配置多个 Slurm sackd 守护程序的自动方法。它使登录节点能够与多个集群通信。该脚本可自动执行以下操作:
-
使用 AWS PCS API 操作来获取集群信息
-
提示输入 base64 编码的 Slurm 身份验证密钥
-
使用集群身份验证密钥创建 Slurm JWKS 文件
-
使用集群终端节点和端口配置
sackd服务 -
为特定于集群
sackd的守护程序创建systemd服务文件 -
为集群环境设置生成激活脚本
-
启用和启动
sackd服务
注意
此脚本需要 Slurm 版本 25.05 或更高版本。
Slurm 必须已经安装在实例上(相当于手动过程中的步骤 3)。该实例必须能够到达目标集群的终端节点。在手动配置过程中,该脚本执行的操作与步骤 4 和步骤 5 的操作相同。它会自动获取集群信息、配置服务、创建必要的sackdsystemd服务文件并创建激活脚本,用户可以使用该脚本配置其 shell 环境以进行集群交互。