步驟 5 – 設定 AWS PCS 叢集的連線 - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

步驟 5 – 設定 AWS PCS 叢集的連線

若要建立 AWS PCS 叢集的連線,請依照下列步驟啟動 sackd 做為系統服務。

  1. 使用下列命令設定 sackd服務的環境檔案。執行命令之前,請將 ip-addressport 取代為步驟 1 中從端點擷取的值。

    sudo echo "SACKD_OPTIONS='--conf-server=ip-address:port'" > /etc/sysconfig/sackd
  2. 建立用於管理sackd程序systemd的服務檔案。

    sudo cat << EOF > /etc/systemd/system/sackd.service [Unit] Description=Slurm auth and cred kiosk daemon After=network-online.target remote-fs.target Wants=network-online.target ConditionPathExists=/etc/sysconfig/sackd [Service] Type=notify EnvironmentFile=/etc/sysconfig/sackd User=slurm Group=slurm RuntimeDirectory=slurm RuntimeDirectoryMode=0755 ExecStart=/opt/aws/pcs/scheduler/slurm-24.05/sbin/sackd --systemd \$SACKD_OPTIONS ExecReload=/bin/kill -HUP \$MAINPID KillMode=process LimitNOFILE=131072 LimitMEMLOCK=infinity LimitSTACK=infinity [Install] WantedBy=multi-user.target EOF
  3. 設定sackd服務檔案的擁有權。

    sudo chown root:root /etc/systemd/system/sackd.service && \ sudo chmod 0644 /etc/systemd/system/sackd.service
  4. 啟用 sackd服務。

    sudo systemctl daemon-reload && sudo systemctl enable sackd
  5. 啟動 sackd 服務。

    sudo systemctl start sackd