步骤 5-配置与 AWS PCS 集群的连接 - AWS PC

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 5-配置与 AWS PCS 集群的连接

要建立与 AWS PCS 集群的连接,请按照以下步骤sackd作为系统服务启动。

  1. 使用以下命令为sackd服务设置环境文件。在运行命令之前,请将ip-addressport替换为步骤 1 中从端点检索到的值。

    sudo echo "SACKD_OPTIONS='--conf-server=ip-address:port'" > /etc/sysconfig/sackd
  2. 创建用于管理sackd流程的systemd服务文件。

    sudo cat << EOF > /etc/systemd/system/sackd.service [Unit] Description=Slurm auth and cred kiosk daemon After=network-online.target remote-fs.target Wants=network-online.target ConditionPathExists=/etc/sysconfig/sackd [Service] Type=notify EnvironmentFile=/etc/sysconfig/sackd User=slurm Group=slurm RuntimeDirectory=slurm RuntimeDirectoryMode=0755 ExecStart=/opt/aws/pcs/scheduler/slurm-24.05/sbin/sackd --systemd \$SACKD_OPTIONS ExecReload=/bin/kill -HUP \$MAINPID KillMode=process LimitNOFILE=131072 LimitMEMLOCK=infinity LimitSTACK=infinity [Install] WantedBy=multi-user.target EOF
  3. 设置sackd服务文件的所有权。

    sudo chown root:root /etc/systemd/system/sackd.service && \ sudo chmod 0644 /etc/systemd/system/sackd.service
  4. 启用该sackd服务。

    sudo systemctl daemon-reload && sudo systemctl enable sackd
  5. 启动 sackd 服务。

    sudo systemctl start sackd