使用 AWS PCS 多集群登录节点配置脚本 - AWS PC

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 AWS PCS 多集群登录节点配置脚本

运行脚本

运行配置脚本
  1. 脚本内容保存在名为:的文件中

    pcs-multi-cluster-login-configure.sh
  2. 使其可执行:

    chmod +x pcs-multi-cluster-login-configure.sh
  3. 运行 脚本:

    ./pcs-multi-cluster-login-configure.sh --cluster-identifier cluster-name

集群交互环境

成功配置后,该脚本将在当前目录中生成特定于群集的激活脚本。脚本有名字activate-pcs-cluster-name。激活脚本配置必要的环境变量和路径以与目标集群进行交互。

激活群集环境
  • 使用source命令运行激活脚本

    source ./activate-pcs-cluster-name
    # Activate cluster environment for cluster 'my-cluster' source ./activate-pcs-my-cluster # Now you can use Slurm commands sinfo squeue sbatch my-job.sh
激活脚本的作用
  • SLURM_CONF环境变量设置为指向群集的配置。

  • 更新PATH以包含集群的 Slurm 二进制文件。

  • 配置其他必要的 Slurm 环境变量 (MANPATH,)。LD_LIBRARY_PATH

  • 设置 AWS PCS 集群标识变量。

  • 实现与目标 AWS PCS 集群的无缝交互。

停用群集环境
  • 运行停用命令。

    deactivate-pcs-cluster-name
    # After activating a cluster source ./activate-pcs-my-cluster # Work with the cluster sinfo # Deactivate when done deactivate-pcs-my-cluster
停用命令的作用
  • 恢复原始PATH环境变量。

  • 取消设置特定于集群的 Slurm 环境变量。

  • 将 shell 环境恢复到其激活前的状态。

注意

激活是特定于会话的,并且必须源自您要与集群交互的 shell 会话。