AWS PCS 多叢集登入節點組態指令碼的先決條件 - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS PCS 多叢集登入節點組態指令碼的先決條件

系統要求

  • systemd 支援 Linux 作業系統

  • 系統組態的根權限

必要的命令和套件

  • bash – Shell 解譯器 (4.0 版以上)

  • curl – 適用於 AWS IMDS v2 中繼資料擷取

  • jq – 用於剖析 AWS API 回應的 JSON 處理器

  • aws – AWS CLI v2 執行 AWS PCS API 動作和 Secrets Manager 存取

  • systemctlsystemd服務管理

  • find – 檔案系統搜尋公用程式

  • grep – 文字模式比對

  • sed – 用於文字處理的串流編輯器

  • sort – 文字排序公用程式

  • tail – 顯示檔案的最後一行

  • mkdir – 建立目錄

  • chmod – 變更檔案許可

  • chown – 變更檔案擁有權

  • ldconfig – 動態連結器組態

AWS 需求

  • 執行 Slurm 25.05 版或更新版本的 AWS PCS 叢集

  • AWS 設定的登入資料 (透過 IAM 角色、登入資料檔案或環境變數)

  • 的許可:

    • pcs:GetCluster

    • secretsmanager:GetSecretValue (如果您使用替代秘密)

系統使用者和群組

  • slurm 使用者和群組必須存在於系統上

Slurm 安裝

  • Slurm 必須安裝在與 AWS PCS Slurm 安裝程式套件相同的位置:

    /opt/aws/pcs/scheduler/slurm-version