将独立登录节点连接到 AWS PCS 中的多个集群 - AWS PC

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将独立登录节点连接到 AWS PCS 中的多个集群

pcs-multi-cluster-login-configure.sh脚本提供了一种在单个独立登录节点上配置多个 Slurm sackd 守护程序的自动方法。它使登录节点能够与多个集群通信。该脚本可自动执行以下操作:

  • 使用 AWS PCS API 操作来获取集群信息

  • 提示输入 base64 编码的 Slurm 身份验证密钥

  • 使用集群身份验证密钥创建 Slurm JWKS 文件

  • 使用集群终端节点和端口配置sackd服务

  • 为特定于集群sackd的守护程序创建systemd服务文件

  • 为集群环境设置生成激活脚本

  • 启用和启动sackd服务

注意

此脚本需要 Slurm 版本 25.05 或更高版本。

Slurm 必须已经安装在实例上(相当于手动过程中的步骤 3)。该实例必须能够到达目标集群的终端节点。在手动配置过程中,该脚本执行的操作与步骤 4 和步骤 5 的操作相同。它会自动获取集群信息、配置服务、创建必要的sackdsystemd服务文件并创建激活脚本,用户可以使用该脚本配置其 shell 环境以进行集群交互。