AWS PCS 代理程式版本 - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS PCS 代理程式版本

AWS PCS 代理程式軟體會設定 EC2 執行個體 AWS PCS 啟動以與 Slurm 搭配使用。您在為叢集建立運算節點群組時指定的 Amazon Machine Image (AMI) 中包含代理程式。這些運算節點群組中啟動的 EC2 執行個體會使用指定的 AMI 及其隨附的 AWS PCS 代理程式軟體。 AWS PCS 代理程式可讓 EC2 執行個體將自己註冊為叢集的一部分。若要使用最新的 AWS PCS 代理程式軟體,您必須更新自訂 AMIs。如需詳細資訊,請參閱 AWS PCS 的自訂 Amazon Machine Image AMIs) 中的 步驟 2 – 安裝 AWS PCS 代理程式

AWS PCS 代理程式版本 版本日期 版本備註
v1.3.1-1 2025 年 11 月 7 日
  • 改善停用超執行緒的功能,方法是在可用時使用 `smt/control` sysfs 參數。

  • 已修正在 PCS 代理程式嘗試停用超執行緒時,CPU 在開機期間鎖定時的潛在競爭條件。

  • 已修正導致 Slurm 運算節點的 InstanceIdInstanceType 欄位分別填入時間戳記和連字號的問題。

1.3.0-1 版 2025 年 11 月 3 日
  • 新增對新作業系統的支援:Amazon Linux 2023、Ubuntu 24、RHEL 8、Rocky 8。

1.2.2-1 版 2025 年 10 月 16 日
  • 如果 IPv4 端點無法使用,允許對 IPv6 端點的執行個體中繼資料查詢。 IPv4

  • 修正核心傳回同級執行緒做為 CPU ID 範圍時,無法停用超執行緒的問題。

  • 修正在成功停用超執行緒時,日誌中產生錯誤失敗訊息的問題。

1.2.1-1 版 2025 年 6 月 19 日
  • 如果控制器無法使用, AWS PCS 代理程式現在會嘗試啟動 slurmd 長達 30 分鐘。

  • 修正以下問題:如果對 RegisterComputeNodeGroupInstance 的回應包含 SLURMDBD 端點,則會產生不正確的 slurmd 組態。

1.2.0-1 版 2025 年 3 月 7 日
  • 在 中啟用 IPv6 支援slurmd.conf

1.1.1-1 版 2024 年 12 月 13 日
  • 修正呼叫 RegisterComputeNodeGroupInstance 時回報不正確 Slurm 版本的問題。

  • 修正在 中/opt/aws/pcs/etc/bootstrap_hooks/執行自訂指令碼時未正確擷取執行個體中繼資料的問題。

1.1.0-1 版 2024 年 12 月 6 日
  • 啟用 中的自訂指令碼/opt/aws/pcs/etc/bootstrap_hooks/,以在引導步驟之前執行。

1.0.1-1 版 2024 年 10 月 22 日
  • 修正 NVIDIA 裝置在啟用 GPU 的執行個體上slurmd啟動時無法運作的問題。

1.0.0-1 版 2024 年 8 月 28 日
  • 初始版本。