本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS PCS 多叢集登入節點組態指令碼的先決條件
系統要求
-
systemd支援 Linux 作業系統 -
系統組態的根權限
必要的命令和套件
-
bash– Shell 解譯器 (4.0 版以上) -
curl– 適用於 AWS IMDS v2 中繼資料擷取 -
jq– 用於剖析 AWS API 回應的 JSON 處理器 -
aws– AWS CLI v2 執行 AWS PCS API 動作和 Secrets Manager 存取 -
systemctl–systemd服務管理 -
find– 檔案系統搜尋公用程式 -
grep– 文字模式比對 -
sed– 用於文字處理的串流編輯器 -
sort– 文字排序公用程式 -
tail– 顯示檔案的最後一行 -
mkdir– 建立目錄 -
chmod– 變更檔案許可 -
chown– 變更檔案擁有權 -
ldconfig– 動態連結器組態
AWS 需求
-
執行 Slurm 25.05 版或更新版本的 AWS PCS 叢集
-
AWS 設定的登入資料 (透過 IAM 角色、登入資料檔案或環境變數)
-
的許可:
-
pcs:GetCluster -
secretsmanager:GetSecretValue(如果您使用替代秘密)
-
系統使用者和群組
-
slurm使用者和群組必須存在於系統上
Slurm 安裝
-
Slurm 必須安裝在與 AWS PCS Slurm 安裝程式套件相同的位置:
/opt/aws/pcs/scheduler/slurm-version