將獨立登入節點連接到 AWS PCS 中的多個叢集 - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將獨立登入節點連接到 AWS PCS 中的多個叢集

pcs-multi-cluster-login-configure.sh 指令碼提供在單一獨立登入節點上設定多個 Slurm sackd 協助程式的自動化方法。它可讓登入節點與多個叢集通訊。指令碼會自動執行下列操作:

  • 使用 AWS PCS API 動作來取得叢集資訊

  • base64 編碼 Slurm 身分驗證金鑰的提示

  • 使用叢集身分驗證金鑰建立 Slurm JWKS 檔案

  • 使用叢集端點和連接埠設定sackd服務

  • 為叢集特定的sackd協助程式建立systemd服務檔案

  • 產生叢集環境設定的啟用指令碼

  • 啟用和啟動sackd服務

注意

此指令碼需要 Slurm 25.05 版或更新版本。

Slurm 必須已安裝在執行個體上 (等同於手動程序中的步驟 3)。執行個體必須能夠到達目標叢集的端點。指令碼會執行手動組態程序中步驟 4步驟 5 的同等操作。它會自動取得叢集資訊、設定sackd服務、建立必要的systemd服務檔案,以及建立啟用指令碼,讓使用者可用來設定其 shell 環境以進行叢集互動。