在 AWS PCS 中啟用 Slurm REST API - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 AWS PCS 中啟用 Slurm REST API

啟用 Slurm REST API 來存取叢集的 HTTP 介面,以進行程式設計任務管理和監控。您可以在叢集建立期間啟用此功能,或更新符合需求的現有叢集。

先決條件

啟用 Slurm REST API 之前,請確定您已:

  • 叢集版本:Slurm 25.05 版或更新版本。

  • 安全群組:允許連接埠 6820 上來自所需來源的 HTTP 流量的規則。

程序

在新叢集上啟用 Slurm REST API

AWS 管理主控台
  1. 在 https://https://console.aws.amazon.com/pcs/ 開啟 AWS PCS 主控台。

  2. 選擇 Create Cluster (建立叢集)。

  3. 叢集詳細資訊下,選擇 Slurm 25.05 版或更新版本。

  4. 視需要設定其他叢集設定。

  5. 排程器組態區段中,將 REST API 設定為已啟用

  6. 設定叢集安全群組,以允許連接埠 6820 上來自所需來源的 HTTP 流量。

  7. 完成叢集建立程序。

AWS CLI
  1. 在建立叢集時新增 Slurm REST 組態。

    aws pcs create-cluster --region region \ --cluster-name my-cluster \ --scheduler type=SLURM, version=25.05 \ --size SMALL \ --networking subnetIds=subnet-ExampleId1,securityGroupIds=sg-ExampleId1 \ --slurm-configuration slurmRest='{mode=STANDARD}'
  2. 設定叢集安全群組,以允許連接埠 6820 上來自所需來源的 HTTP 流量。

在現有叢集上啟用 Slurm REST API

AWS 管理主控台
  1. 在 https://https://console.aws.amazon.com/pcs/ 開啟 AWS PCS 主控台。

  2. 從清單中選擇您的叢集。

  3. 確認您的叢集在叢集詳細資訊中使用 Slurm 25.05 版或更新版本。

  4. 選擇編輯叢集

  5. 排程器組態區段中,將 REST API 設定為已啟用

  6. 選擇更新叢集以套用變更。

  7. 設定叢集安全群組,以允許連接埠 6820 上來自所需來源的 HTTP 流量。

AWS CLI
  1. 使用 Slurm REST 組態更新您的叢集,如本範例所示。

    aws pcs update-cluster --cluster-identifier my-cluster \ --slurm-configuration 'slurmRest={mode=STANDARD}'
  2. 設定叢集安全群組,以允許連接埠 6820 上來自所需來源的 HTTP 流量。

啟用 後會發生什麼情況

當您啟用 REST API 時, AWS PCS 會自動:

  • 產生 JWT 簽署金鑰並將其存放在 AWS Secrets Manager 中。

  • 在 VPC https://<clusterPrivateIpAddress>:6820中公開 API 端點。

  • 更新您的叢集組態,以顯示 REST API 端點詳細資訊。

您現在可以驗證和使用 REST API 進行任務管理和叢集操作。