本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將獨立登入節點連接到 AWS PCS 中的多個叢集
pcs-multi-cluster-login-configure.sh 指令碼提供在單一獨立登入節點上設定多個 Slurm sackd 協助程式的自動化方法。它可讓登入節點與多個叢集通訊。指令碼會自動執行下列操作:
-
使用 AWS PCS API 動作來取得叢集資訊
-
base64 編碼 Slurm 身分驗證金鑰的提示
-
使用叢集身分驗證金鑰建立 Slurm JWKS 檔案
-
使用叢集端點和連接埠設定
sackd服務 -
為叢集特定的
sackd協助程式建立systemd服務檔案 -
產生叢集環境設定的啟用指令碼
-
啟用和啟動
sackd服務
注意
此指令碼需要 Slurm 25.05 版或更新版本。
Slurm 必須已安裝在執行個體上 (等同於手動程序中的步驟 3)。執行個體必須能夠到達目標叢集的端點。指令碼會執行手動組態程序中步驟 4 和步驟 5 的同等操作。它會自動取得叢集資訊、設定sackd服務、建立必要的systemd服務檔案,以及建立啟用指令碼,讓使用者可用來設定其 shell 環境以進行叢集互動。