使用 AWS PCS 多叢集登入節點組態指令碼 - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 AWS PCS 多叢集登入節點組態指令碼

執行指令碼

執行組態指令碼
  1. 指令碼的內容儲存在名為 的檔案中:

    pcs-multi-cluster-login-configure.sh
  2. 使其可執行:

    chmod +x pcs-multi-cluster-login-configure.sh
  3. 執行 指令碼:

    ./pcs-multi-cluster-login-configure.sh --cluster-identifier cluster-name

叢集互動環境

成功組態後,指令碼會在目前目錄中產生叢集特定的啟用指令碼。指令碼的名稱為 activate-pcs-cluster-name。啟用指令碼會設定必要的環境變數和路徑,以與目標叢集互動。

啟用叢集環境
  • 使用 source命令來執行啟用指令碼

    source ./activate-pcs-cluster-name
    # Activate cluster environment for cluster 'my-cluster' source ./activate-pcs-my-cluster # Now you can use Slurm commands sinfo squeue sbatch my-job.sh
啟用指令碼的功能
  • 設定SLURM_CONF環境變數以指向叢集的組態。

  • 更新 PATH以包含叢集的 Slurm 二進位檔。

  • 設定其他必要的 Slurm 環境變數 (MANPATHLD_LIBRARY_PATH)。

  • 設定 AWS PCS 叢集識別變數。

  • 啟用與目標 AWS PCS 叢集的無縫互動。

停用叢集環境
  • 執行停用命令。

    deactivate-pcs-cluster-name
    # After activating a cluster source ./activate-pcs-my-cluster # Work with the cluster sinfo # Deactivate when done deactivate-pcs-my-cluster
停用命令的功能
  • 還原原始PATH環境變數。

  • 取消設定叢集特定的 Slurm 環境變數。

  • 將 Shell 環境傳回至其啟用前狀態。

注意

啟用是工作階段特定的,且必須在您要與叢集互動的 shell 工作階段中取得。