版本備註和文件歷史記錄 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

版本備註和文件歷史記錄

下表說明 AWS ParallelCluster 使用者指南的主要更新和新功能。我們也會經常更新文件,以處理您傳送給我們的意見回饋。

AWS ParallelCluster
變更 描述 日期

AWS ParallelCluster 3.13.2 版已發行

若要升級,請輸入下列項目:sudo pip install --upgrade aws-parallelcluster

錯誤修正:

  • 修正當運算資源參考不再透過 EC2 API 存取的過期容量保留時,可能導致 update-clusterupdate-compute-fleet 失敗的錯誤。 APIs

  • 修正當父映像未運送最新的核心版本時,Rocky 9 上發生的build-image故障。請參閱 https://https://github.com/aws/aws-parallelcluster/issues/6874

2025 年 6 月 24 日

AWS ParallelCluster 3.13.1 版已發行

若要升級,請輸入下列項目:sudo pip install --upgrade aws-parallelcluster

變更:

  • 升級 Slurm 至 24.05.8 版。

  • 將 EFA 安裝程式升級至 1.41.0 (從 1.38.1 版)。

    • Efa-driver:efa-2.15.0-1

    • Efa-config:efa-config-1.18-1

    • Efa-profile:efa-profile-1.7-1

    • Libfabric-aws:libfabric-aws-2.1.0-1

    • Rdma-core:rdma-core-57.0-1

    • 開啟 MPI:openmpi40-aws-4.1.7-2 和 openmpi50-aws-5.0.6

  • 將非 Amazon Linux AMI 的 amazon-efs-utils 升級至 2.3.1 版 (從 v2.1.0)。

  • 在 us-isob-east-1 和 us-iso-east-1 中支援 DCV。

  • 在 us-isob-east-1 和 us-iso-east-1 中支援 FSX for Lustre 和 Ontap。

  • 確保 ParallelCluster 映像建置的核心一致性,方法是在開始時鎖定,並在完成時取消鎖定。

錯誤修正:

  • 修正在 ARM Performance Library 安裝中導致在隔離環境中建置映像失敗的錯誤。

  • 修正阻止指令碼 'update_directory_service_password.sh' 更新 AD 密碼的錯誤。

2025 年 6 月 4 日

AWS ParallelCluster 3.13.0 版已發行

若要升級,請輸入下列項目:sudo pip install --upgrade aws-parallelcluster

棄用:

  • 這是支援 Ubuntu 20.04 的最後一個 ParallelCluster 版本,因為 Ubuntu 20.04 將於 2025 年 5 月進入 End-Of-Standard-Support。

增強功能:

  • 新增對 Ubuntu 24.04 的支援。

  • 新增對 ap-southeast-7 區域的支援。

  • 從官方 ParallelCluster AMIs 停用未使用的服務杯和 wpa_supplicant,以提高安全性。

變更:

  • 升級 Slurm 至 24.05.7 版。

  • 將所有OSs的 NVIDIA 驅動程式升級至版本 570.86.15 (從 550.127.08),AL2 除外。

  • 將 CUDA Toolkit 升級至 AL2 以外所有OSs 1AL2.8.0 版 (自 12.4.1 起)。

  • 將 Python 升級至 3.12.8,適用於所有OSs但 AL2 除外 (自 3.9.20 起)。

  • 在 Ubuntu 22.04 上,使用用於編譯核心的相同編譯器版本安裝 Nvidia 驅動程式。

  • aws-cfn-bootstrap 升級至 2.0-33 版。

  • 升級 EFA 安裝程式到 1.38.0 (從 1.36.0)。

    • Efa-driver:efa-2.13.0-1

    • Efa-config:efa-config-1.17-1

    • Efa-profile:efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • Rdma-core:rdma-core-54.0-1

    • 開啟 MPI: openmpi40-aws-4.1.7-1openmpi50-aws-5.0.5

  • 將 amazon-efs-utils 升級至 2.1.0 版。

  • 移除第三方技術指南:apt-7.5.22 和 pyenv-4.2.3。

  • 升級第三方技術指南相依性:

    • line-4.5.21 (從 line-4.5.13 起)

    • nfs-5.1.5 (來自 nfs-5.1.2)

    • openssh-2.11.14 (從 openssh-2.11.12 開始)

    • yum-7.4.20 (從 yum-7.4.13 起)

    • yum-epel-5.0.8 (來自 yum-epel-5.0.2)

  • 將 Pmix 升級到 5.0.6 (從 5.0.3)。

  • 將 ARM PL 升級到 24.10 版 (從 23.10 版)。

  • 在 Lambda layer 和安裝程式中將 Python 升級到 3.12.8 版 (自 3.9.17 起)。

  • 升級 NodeJS 至 Lambda layer 和安裝程式中的 20.18.3 版 (自 18.20.3 起)。

  • 將登入節點的 DSA 金鑰產生移除為 DSA,這會在 OpenSSH 9.7+ 中變成不受支援。

  • 在運算節點啟動時,在 Slurm 中設定執行個體 ID 和執行個體類型資訊。

  • 安裝 NVIDIA 驅動程式時,沒有選項 'no-cc-version-check',現已在 NVIDIA 安裝程式中棄用。

  • 新增驗證器以強制執行最多 10 個登入節點集區。

  • 將預設根磁碟區大小更新為 45 GB。

錯誤修正:

  • 移除用於運算節點引導的 cfn-init 用量,以減少節點擴展時間。

  • 修正使用代理時導致運算節點引導失敗的問題。

  • 在 Ubuntu 22.04 上,使用與編譯核心相同的編譯器版本來安裝 Nvidia 驅動程式,以防止安裝失敗。- 修正在更新期間僅在前端節點上覆寫 aws-parallelcluster-node 套件的執行。

  • 修正在多使用者環境 (與 Active Directory 整合) 中透過 Pyxis/Enroot 執行的容器化任務會失敗的問題。

  • 修正使用目錄服務時,在 Rocky 9.5+ 上造成節點引導失敗的 authselect 用量。

2025 年 4 月 1 日

AWS ParallelCluster 3.12.0 版已發行

若要升級,請輸入下列項目:sudo pip install --upgrade aws-parallelcluster

增強功能:

  • 新增建置映像組態區段Build/Installation,以開啟/關閉 NVIDIA 軟體和 Lustre 用戶端安裝。根據預設,雖然包含在官方 ParallelCluster AMIs 中,但 不會安裝 NVIDIA 軟體build-image。預設會安裝 Lustre 用戶端。

  • CLI 命令 export-cluster-logsexport-image-logs現在可以根據預設將日誌匯出至預設的 ParallelCluster 儲存貯體,或在組態中指定時匯出至 CustomS3Bucket。

  • 在 ARM 執行個體上將 Amazon DCV 支援擴展至 Ubuntu2204。

變更:

  • 將 NVIDIA 驅動程式升級至 550.127.08 版 (從 550.90.07)。這可解決 NVIDIA 的已知問題。如需詳細資訊,請參閱 NVIDIA 資料中心文件中已知問題

  • 將 Amazon DCV 升級到版本 2024.0-18131

    • 伺服器: 2024.0-18131-1

    • xdcv: 2024.0.631-1

    • gl: 2024.0.1078-1

    • web_viewer: 2024.0-18131-1

  • 將 EFA 安裝程式升級至 1.36.0

    • Efa-driver: efa-2.13.0-1

    • Efa-config: efa-config-1.17-1

    • Efa 設定檔: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • Rdma 核心: rdma-core-54.0-1

    • 開啟 MPI: openmpi40-aws-4.1.7-1openmpi50-aws-5.0.5

  • 失敗時自動重新啟動 slurmctld。

  • 將 mysql-community-client 升級到 8.0.39 版。

  • 移除對 Python 3.7 和 3.8 的支援,這是生命週期結束。

錯誤修正:

  • 修正叢集更新期間未偵測到自訂動作指令碼序列變更的問題。

  • 新增 AWS ParallelCluster API 缺少的許可,為部署登入節點所需的 Elastic Load Balancing 和 Auto Scaling 建立服務連結角色。

  • 修正在管理磁碟區時,我們取得區域的方式問題,讓它可以正確處理本機區域。

  • 修正在更新AccessPointIds期間使用 新增 EFS 檔案系統失敗的問題。

  • 修正使用 PCAPI 時,叢集更新可能會在更新非 類型的參數時失敗的問題 String(例如,MaxCount)。

  • 掛載外部 OpenZFS 時,不再需要設定連接埠 111、2049、20001、20002、20003 的傳出規則。

2024 年 12 月 19 日

AWS ParallelCluster 3.11.1 版已發行

功能:

  • 依預設,Pyxis 現在已停用,因此必須如產品文件中所述手動啟用。

  • 在 ParallelCluster Lambda Layer 中將 Python 執行時間升級至 3.12 版。

  • 將 setuptools 的版本鎖定移除至 70.0.0 之前的版本。

  • 將 libjwt 升級至 1.17.0 版。

  • 完整變更日誌

錯誤修正

  • 修正在 ParallelCluster 中設定 Pyxis Slurm 外掛程式時可能導致任務提交失敗的問題。

  • 透過在 政策的公有範本中新增登入節點所需的缺少許可,修正導致在具有登入節點的組態中部署失敗的問題。https://https://github.com/aws/aws-parallelcluster/issues/6483

2024 年 10 月 21 日

AWS ParallelCluster 3.11.0 版已發行

增強功能

  • 新增對登入節點上自訂動作的支援。

  • 允許 DCV 連線登入節點。

  • 新增對 ap-southeast-3 區域的支援。

  • 將安全群組新增至登入節點網路負載平衡器。

  • 新增登入節點的AllowedIps組態。

  • 新增組態SharedStorage/EfsSettings/AccessPointId以指定掛載的選用 EFS 存取點

  • 允許最多 10 個登入節點集區。

  • 在官方 pcluster AMIs

變更

  • 中斷】 API DescribeCluster和 CLI 命令傳回loginNodes的欄位describe-cluster已從字典變更為陣列,以支援多個登入節點集區。此變更會破壞回溯相容性,使這些操作與使用舊版部署的叢集不相容。

  • 升級 Slurm 至 23.11.10 (從 23.11.7)。

  • 將 Pmix 升級到 5.0.3 (從 5.0.2)。

  • 將 EFA 安裝程式升級至 1.34.0

    • Efa-driver: efa-2.10.0-1

    • Efa-config: efa-config-1.17-1

    • Efa 設定檔: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • Rdma 核心: rdma-core-52.0-1

    • 開啟 MPI: openmpi40-aws-4.1.6-3openmpi50-aws-5.0.3-11

  • 將 NVIDIA 驅動程式升級至版本 550.90.07 (從 535.183.01)。

  • 將 CUDA Toolkit 升級到 12.4.1 版 (從 12.2.2)。

  • 將 Python 升級到 3.9.20 (從 3.9.19)。

  • 將 Intel MPI Library 升級至 2021.13.1.769 (自 2021.12.1.8 起)。

錯誤修正

  • 修正驗證器,EfaPlacementGroupValidator使其不建議在使用容量區塊時設定置放群組。

  • 透過確保 FSx for Lustre 檔案系統是在安全群組規則之後建立,來修正偶爾的叢集建立失敗。

  • 修正啟用置放群組時的叢集刪除失敗。

  • 修正限制 SSH 存取時,登入節點標示為運作狀態不良的問題。

  • 修正 ,retrieve_supported_regions使其可以取得正確的 S3 URL。

  • 修正describe_images以使用分頁。

  • 修正將預設 VPC 子網路指定至 LoginNodes/Networking/SubnetIds 時的No route tables found錯誤。

2024 年 9 月 26 日

AWS ParallelCluster 3.10.1 版已發行

錯誤修正

  • 修正中國區域的映像建置失敗。

2024 年 7 月 8 日

AWS ParallelCluster 3.10.0 版已發行

增強功能:

  • 新增組態區段Scheduling/SlurmSettings/ExternalSlurmdbd,將叢集連線至外部 Slurmdbd。

  • 允許在隔離的網路中執行建置映像。

  • 新增對 Amazon Linux 2023 的支援。

  • 將 的支援price-capacity-optimized新增為 AllocationStrategy

  • 新增驗證器以防止將置放群組與容量區塊搭配使用。

變更:

  • 不再支援 CentOS 7。

  • 從 18.4.12 將 Cinc 用戶端升級至 18.2.7 版。

  • 將 munge 升級到 0.5.16 版 (從 0.5.15 版)。

  • 將 Pmix 升級到 5.0.2 (從 4.2.9)。

  • 升級第三方技術指南相依性:

    • apt-7.5.22 (從 apt-7.5.14)

    • openssh-2.11.12 (從 openssh-2.11.3 起)

  • 移除第三方技術指南:selinux-6.1.12。

  • 將 EFA 安裝程式升級至 1.32.0

    • Efa-driver: efa-2.8.0-1

    • Efa-config: efa-config-1.16-1

    • Efa-profile: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.21.0-1

    • Rdma 核心: rdma-core-50.0-1

    • 開啟 MPI: openmpi40-aws-4.1.6-3openmpi50-aws-5.0.2-12

  • 將 NVIDIA 驅動程式升級至 535.183.01 版 (從 535.154.05)。

  • 將 Python 升級到 3.9.19 (從 3.9.17)。

  • 將 Intel MPI Library 升級至 2021.12.1.8 (從 2021.9.0.43482)。

錯誤修正:

  • 修正要設為 AutoExportPolicyAutoImportPolicy選用的資料儲存庫關聯組態。

  • 修正叢集刪除期間的問題,該問題現在會在執行個體處於關機或終止狀態時完成運算機群清除。這是為了避免具有較長終止週期之執行個體類型的叢集刪除失敗。

  • 允許啟用 cloudwatch 儀表板,並在叢集組態的 Monitoring區段中停用警示。

  • 允許 ParallelCluster 自訂資源使用 抑制驗證程式PclusterCluster/SuppressValidators

  • 移除 ,/etc/profile.d/pcluster.sh使其不會在每次使用者登入時執行cfn_bootstrap_virtualenv,也不會在 PATH 環境變數中新增。

  • 將回應failures中的欄位取代failureReason為 ,以修正 ParallelCluster API 規格DescribeCluster

  • 透過新增缺少的 CloudFormation 堆疊狀態來修正 ParallelCluster API 規格:IMPORT_*REVIEW_IN_PROGRESSUPDATE_FAILED

  • 修正無法讓叢集更新包含傳輸中加密的 EFS 檔案系統的問題。

  • 修正在 EFS 用於共用內部資料時,導致 slurmctld 和 slurmdbd 服務無法在前端節點重新啟動時重新啟動的問題。

  • 在 Ubuntu 系統上,移除與來自 ParallelCluster 的組態衝突之 cloud-init 日誌檔案的預設 logrotate 組態。

  • 使用 RHEL 8.10 或更新版本修正映像建置失敗。

2024 年 6 月 27 日

AWS ParallelCluster 3.9.3 版已發行

若要升級,請輸入 sudo pip install --upgrade aws-parallelcluster

功能:

  • 新增支援 FSx Lustre做為 中的共用儲存類型us-iso-east-1

錯誤修正:

  • cloud_dns 從 Slurm 組態SlurmctldParameters中的 中移除 ,以避免 Slurm 散發問題。

    這並非必要,因為我們會在執行個體啟動時設定 IP 地址。

2024 年 6 月 19 日

AWS ParallelCluster 3.9.2 版已發行

功能:

  • 升級 Slurm 至 23.11.7 (從 23.11.4)。

  • 如需詳細資訊,請參閱 GitHub CHANGELOG3.9.2上的 。

2024 年 5 月 28 日

AWS ParallelCluster 3.9.1 版已發行

若要升級,請輸入下列項目: sudo pip install --upgrade aws-parallelcluster

錯誤修正

  • 在 update-cluster 操作中卸載檔案系統時,移除共用儲存掛載的遞迴刪除。

2024 年 4 月 11 日

AWS ParallelCluster 3.9.0 版已發行

若要升級,請輸入下列項目: sudo pip install --upgrade aws-parallelcluster

增強功能:

  • 新增組態參數DeploymentSettings/DefaultUserHome,以允許使用者將預設使用者的主目錄移至 ,/local/home而不是 /home(預設)。

  • 允許更新 MinCountMaxCountQueueComputeResource組態參數,而不需要停止運算機群。現在可以透過將 Scheduling/SlurmSettings/QueueUpdateStrategy設定為 TERMINATE 來更新它們。 只會 AWS ParallelCluster 終止透過叢集更新執行的叢集容量調整大小期間移除的節點。

  • 允許更新 Efs、FsxLustre、FsxOntap、FsxOpenZfs 和 FileCache 類型的外部共用儲存體,而無需取代運算和登入機群。

  • 新增對 RHEL9 的支援。

  • 新增透過 build-image 程序CustomAmi建立的 Rocky Linux 9 支援。目前不提供公有 official AWS ParallelCluster Rocky9 Linux AMI。

  • CommunicationParameters 從自訂 Slurm Settings 拒絕清單中移除 。

  • 新增 DeploymentSettings/DisableSudoAccessForDefaultUser 參數,以在支援的OSes中停用預設使用者的 sudo 存取。

  • ParallelCluster 建立的 FSx for Lustre 檔案系統變更:將 Lustre 伺服器版本變更為 2.15.

  • 透過['cluster']['nvidia']['kernel_open']技術指南節點屬性,在建置 AMI 時,在開啟和關閉來源 Nvidia 驅動程式之間新增選擇的可能性。

  • * 新增 clustermgtd 組態選項ec2_instance_missing_max_count,以允許最終 Amazon EC2 的可設定重試次數描述執行個體與執行執行個體的一致性。

變更

  • 升級 Slurm 至 23.11.4 (從 23.02.7)。

  • 將 NVIDIA 驅動程式升級至 535.154.05 版。

  • 在 pcluster CLI 和 aws-parallelcluster-batch-cli 中新增對 Python 3.11、3.12 的支援。

  • 使用 Amazon EC2 DescribeInstances 回應NetworkCardIndex清單中的網路卡索引建置網路介面,而不是循環超過MaximumNetworkCards範圍。

  • 使用執行個體類型 P3, G3, P2 和 G2 時,叢集建立失敗,因為其 GPU 架構與 3.8.0 版推出的開放原始碼 Nvidia 驅動程式 (OpenRM) 不相容。

  • 升級第三方技術指南相依性:nfs-5.1.2 (從 nfs-5.0.0)

  • 升級 EFA 安裝程式至 1.30.0.

    • Efa-driver: efa-2.6.0-1

    • Efa-config: efa-config-1.15-1

    • Efa-profile: efa-profile-1.6-1

    • Libfabric-aws: libfabric-aws-1.19.0

    • Rdma 核心: rdma-core-46.0-1

    • 開啟 MPI: openmpi40-aws-4.1.6-2openmpi50-aws-5.0.0-11

  • 將 NICE DCV 升級到 版本 2023.1-16388.

    • 伺服器: 2023.1.16388-1

    • xdcv: 2023.1.565-1

    • gl: 2023.1.1047-1

    • web_viewer: 2023.1.16388-1

錯誤修正

  • 修正從登入節點以 Active Directory 使用者身分提交時任務失敗的問題。此問題是由與前端節點上的外部 Active Directory 整合的不完整組態所造成。

  • 重構 CloudFormation 範本 parallelclutser-policies.yaml 中定義的 IAM 政策,以防止超過 IAM 限制的政策導致 ParallelCluster API 部署失敗。

  • 修正當前端節點寫入金鑰所需的時間超過預期時,導致登入節點無法引導的問題。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelcluster-ui 套件CHANGELOG的檔案。

2024 年 3 月 5 日

AWS ParallelCluster 3.8.0 版已發行

AWS ParallelCluster 3.8.0 版已發行。

增強功能:

  • 新增 ML 的 Amazon EC2 容量區塊支援。

  • 新增透過 build-image 程序CustomAmi建立的 Rocky Linux 8 支援。目前不提供公有 official AWS ParallelCluster Rocky8 Linux AMI。

  • 新增 Scheduling/ScalingStrategy 參數以控制啟動 Slurm 運算節點的 Amazon EC2 執行個體時要使用的叢集擴展策略。可能的值為 all-or-nothinggreedy-all-or-nothingbest-effort,預設值all-or-nothing為 。

  • 新增HeadNode/SharedStorageType參數以使用 EFS 儲存體,而不是從叢集內共用檔案系統資源的前端節點根磁碟區匯出 NFS:ParallelCluster、Intel、Slurm 和/home資料。此增強功能可減少前端節點聯網的負載。

  • 允許 透過 組態檔案的 SharedStorage區段,將 掛/home載為 EFS 或 FSx 外部共用儲存體。

  • 新增參數SlurmSettings/MungeKeySecretArn以允許 從 AWS Secrets Manager 使用外部使用者定義的 MUNGE 金鑰。

  • 新增 Monitoring/Alarms/Enabled 參數以切換叢集的 Amazon CloudWatch 警示。

  • 新增前端節點警示以監控 Amazon EC2 運作狀態檢查、CPU 使用率和前端節點的整體狀態,並將其新增至使用叢集建立的 CloudWatch Dashboard。

  • 使用 DeploymentType PERSISTENT_2做為受管 FSx for Lustre 時,新增對資料儲存庫關聯的支援。

  • 新增 Scheduling/SlurmSettings/Database/DatabaseName 參數,以允許使用者為資料庫伺服器上要用於 Slurm 會計的資料庫指定自訂名稱。

  • 在運算資源CapacityReservationTarget/CapacityReservationId中設定 時InstanceType,請建立選用的組態參數。

  • 新增為 AWS ParallelCluster API 建立的 IAM 角色和政策指定字首的可能性。

  • 新增可能以指定要套用至 AWS ParallelCluster API 建立之 IAM 角色和政策的許可界限。

變更

  • 升級 Slurm 至 23.02.7 (從 23.02.6)。

  • 將 NVIDIA 驅動程式升級至 535.129.03 版。

  • 將 CUDA Toolkit 升級到 12.2.2 版。

  • 使用開放原始碼 NVIDIA GPU 驅動程式 (OpenRM) 做為 Linux 的 NVIDIA 核心模組,而非 NVIDIA 封閉式來源模組。

  • 移除 Slurm 恢復程式中all_or_nothing_batch組態參數的支援,以支持新的Scheduling/ScalingStrategy叢集組態。

  • 將叢集警示命名慣例變更為 '【cluster-name】-【component-name】-【metric】'。

  • 針對根磁碟區和其他磁碟區,將 ADC 區域中的預設 EBS 磁碟區類型從 gp2 變更為 gp3。

  • AWS ParallelCluster API 的選用許可界限現在會套用至 API 基礎設施建立的每個 IAM 角色。

    • 將 EFA 安裝程式升級至 1.29.1

    • Efa-driver: efa-2.6.0-1

    • Efa-config: efa-config-1.15-1

    • Efa-profile: efa-profile-1.5-1

    • Libfabric-aws: libfabric-aws-1.19.0-1

    • Rdma 核心: rdma-core-46.0-1

    • 開啟 MPI: openmpi40-aws-4.1.6-1

  • 在所有支援的OSes中將 GDRCopy 升級至 2.4 版,但使用 2.3.1 版的 Centos 7 除外。

  • aws-cfn-bootstrap 升級至 2.0-28 版。

  • 在 aws-parallelcluster-batch-cli 中新增對 Python 3.10 的支援。

錯誤修正

  • 修正在修改運算資源中宣告的執行個體類型清單時,叢集更新復原之後的不一致擴展組態。

  • 修正透過叢集組態檔案在與外部 LDAP 伺服器整合的叢集中切換使用者時產生 SSH 金鑰的問題。

  • 修正設定 時停用 Slurm 省電模式的問題ScaledownIdletime = -1

  • 修正 Slurm 會計update_slurm_database_password.sh指令碼中 Slurm 安裝 dir 的硬式編碼路徑。

2023 年 12 月 19 日

AWS ParallelCluster 3.7.2 版已發行

AWS ParallelCluster 3.7.2 版已發行。

變更:

  • 升級 Slurm 至 23.02.6。

2023 年 10 月 25 日

AWS ParallelCluster 3.7.1 版已發行

AWS ParallelCluster 3.7.1 版已發行。

變更:

  • 升級 Slurm 至 23.02.5 (從 23.02.4)。

    • 將 Pmix 升級到 4.2.6 (從 3.2.3)。

    • 將 libjwt 升級至 1.15.3 (從 1.12.0)。

  • 將 EFA 安裝程式升級至 1.26.1,修復 P5 中的 RDMA 寫入資料問題。

    • Efa-driver:efa-2.5.0-1

    • Efa-config:efa-config-1.15-1

    • Efa-profile:efa-profile-1.5-1

    • Libfabric-aws:libfabric-aws-1.18.2-1

    • ERdma-core:rdma-core-46.0-1

    • 開啟 MPI:openmpi40-aws-4.1.5-4

2023 年 9 月 22 日

AWS ParallelCluster 3.7.0 版已發行

AWS ParallelCluster 3.7.0 版已發行。

增強功能:

  • 使用組態 YAML 檔案支援運算資源中靜態和動態節點優先順序的 AWS ParallelCluster 組態。

  • 新增對 Ubuntu 22 的支援。預設不支援 RSA 金鑰。

  • 新增佇列組態設定JobExclusiveAllocation,以在任何指定時間將分割區中的節點專門配置給單一任務。

  • 允許在叢集建立和叢集更新時間覆寫aws-parallelcluster-node套件。對於前端節點,這適用於叢集更新。僅適用於開發用途。

  • 避免 NFS 伺服器在運算節點上啟動。

  • 新增對登入節點的支援。

  • 為 Slurm Compute Resource 指定多個執行個體類型時,允許記憶體型排程。

  • 新增支援,將現有的 Amazon File Cache 掛載為共用儲存。

變更:

  • 根據預設,指派 Slurm 動態節點的優先順序 (權重) 為 1000。透過這樣做,Slurm 可以優先考慮閒置靜態節點而非閒置動態節點。

  • aws-parallelcluster-node協助程式只處理 AWS ParallelCluster 受管 Slurm 分割區。

  • EFS-utils監視程式輪詢間隔增加到 10 秒。此變更適用於 EncryptionInTransit 設為 時true,這是導致監視程式執行的唯一條件。

  • 將 EFA 安裝程式升級至 1.25.1

    • Efa-driver: efa-2.5.0-1(來自 efa-2.1.1g)

    • Efa-config: efa-config-1.15-1 (來自 efa-config-1.13-1)

    • Efa-profile:efa-profile-1.5-1(無變更)

    • Libfabric-aws: libfabric-aws-1.18.1-0(來自 libfabric-aws-1.17.1-1)

    • Rdma-core: rdma-core-46.0-1 (來自 rdma-core-43.0-1)

    • 開啟 MPI: openmpi40-aws-4.1.5-4(來自 openmpi40-aws-4.1.5-1)

  • 升級 Slurm 至 23.02.4 版。

  • 將 Imds/ImdsSupport 的預設值從 v1.0 變更為 v2.0。

  • 棄用 Ubuntu 18。

  • 將預設根磁碟區大小更新為 40 GB,以說明 Centos 7 的限制。

  • 限制前端節點內檔案 /tmp/wait_condition_handle.txt 的許可,以便只有根才能讀取。

  • 建立節點套件常駐程式要使用的 Slurm 分割區節點清單映射 JSON 檔案,以辨識 PC 管理的 Slurm 分割區和節點清單。

  • 將 NVIDIA 驅動程式升級至 535.54.03 版。

  • 將 CUDA 程式庫升級至 12.2.0 版。

  • 將 NVIDIA Fabric Manager 升級到 nvidia-fabricmanager-535。

  • 僅將 ARM PL 升級至 Ubuntu 22.04 的 23.04.1 版。

  • 將 NICE DCV 升級到版本 2023.0-15487

    • 伺服器: 2023.0.15487-1

    • xdcv: 2023.0.551-1

    • gl: 2023.0.1039-1

    • web_viewer: 2023.0.15487-1

錯誤修正:

  • 將驗證新增至ScaledownIdletime值,以防止將值設定為低於 -1。

  • 在啟用 DCV 的 GPU 執行個體上,使用 Ubuntu Deep Learning AMI 修正叢集建立失敗。

  • 修正使用 CustomLambdaRole 建立 ParallelCluster CloudFormation 自訂資源提供者時,導致建立懸置 IAM 政策的問題。

  • 修正使用 SlurmSettings/Dns/UseEc2Hostnames 等於 時,在具有多個網路介面的執行個體上造成運算節點 DNS 名稱不一致的問題 True

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2023 年 8 月 30 日

僅限文件版本

AWS ParallelCluster 已發佈第 3 版的特定使用者指南。

僅限文件版本:

  • AWS ParallelCluster 第 3 版有自己的個別使用者指南。

2023 年 7 月 17 日

AWS ParallelCluster 3.6.1 版已發行

AWS ParallelCluster 3.6.1 版已發行。

變更:

  • clustermgtd 如果運算節點新增至多個 Slurm 分割區,請避免 看到的節點重複。

錯誤修正:

  • 移除根磁碟區裝置名稱 (/dev/sda1/dev/xvda) 的硬式編碼,並從 期間使用的 AMIs 中擷取create-cluster

  • 修正使用 CloudFormation 自訂資源並將 ElasticIp設定為 時的叢集建立失敗True

  • 修正叢集在搭配大型組態檔案使用 a AWS CloudFormation 自訂資源時建立和更新失敗的問題。

  • 修正無法在 Ubuntu 上停用ptrace保護,且不允許 libfabric 中跨記憶體連接 (CMA) 的問題。

  • 修正使用多種執行個體類型時,容量快速不足的容錯移轉邏輯,且不會傳回任何執行個體。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2023 年 7 月 5 日

AWS ParallelCluster 3.6.0 版已發行

AWS ParallelCluster 3.6.0 版已發行。

文件:

增強功能:

  • 新增對 RHEL8 的支援。

  • 新增 AWS CloudFormation 自訂資源,以使用 CloudFormation 建立和管理叢集。

  • 新增在組態 YAML 檔案中自訂叢集 Slurm AWS ParallelCluster 組態的支援。

  • 建置支援 LUA 的 Slurm。

  • 將每個叢集的佇列數量上限從 10 個增加到 50 個。每個佇列最多可有 50 個運算資源。每個叢集最多可有 50 個運算資源。

  • 新增針對在 OnNodeStartOnNodeConfiguredOnNodeUpdated 參數中設定的事件指定多個自訂動作指令碼序列的支援。

  • 新增組態區段 HealthChecks / Gpu,用於在執行任務之前在運算節點上套用 GPU 運作狀態檢查。

  • SlurmQueues和 / SlurmQueues ComputeResources組態Tags中新增對 的支援。

  • Monitoring組態中新增對 DetailedMonitoring 的支援。

  • CloudWatch 儀表板中 AWS ParallelCluster 新增前端節點記憶體和根磁碟區磁碟使用率追蹤的 mem_used_percentdisk_used_percent 指標,並設定警示以監控這些指標。

  • 新增 AWS ParallelCluster 受管日誌的日誌輪換支援。

  • CloudWatch Dashboard 中追蹤常見的運算節點錯誤和動態節點最長閒置時間。

  • 建立 SSL Socket 時,強制 DCV Authenticator Server 至少使用TLS-1.2通訊協定。

  • 在所有支援的作業系統上安裝 NVIDIA Data Center GPU Manager (DCGM) 套件,但 aarch64centos7和 除外alinux2

  • 根據預設,載入核心模組 nvidia-uvm,以提供統一虛擬記憶體 (UVM) 功能給 CUDA 驅動程式。

  • 安裝 NVIDIA 持續性協助程式做為系統服務。

變更:

  • 升級 Slurm 至版本 23.02.2(從版本 22.05.8)。

  • 將 munge 升級到版本 0.5.15(從版本 0.5.14)。

  • 將 Slurm TreeWidth設定為 30。

  • 將 Slurm prologepilog組態/opt/slurm/etc/scripts/epilog.d/分別設定為目標目錄 /opt/slurm/etc/scripts/prolog.d/和 。

  • 在運算節點註冊期間,將Prolog執行指令碼的 Slurm BatchStartTimeout設定為 3 分鐘上限。

  • 將 CloudWatch 日誌RetentionInDays的預設值從 14 天增加到 180 天。

  • 將 EFA 安裝程式升級至 1.22.1

    • Dkms: 2.8.3-2

    • Efa-driver:efa-2.1.1g(無變更)

    • Efa-config:efa-config-1.13-1(無變更)

    • Efa-profile:efa-profile-1.5-1(無變更)

    • Libfabric-aws: libfabric-aws-1.17.1-1(來自 libfabric-aws-1.17.0-1)

    • Rdma-core:rdma-core-43.0-1(無變更)

    • 開啟 MPI:openmpi40-aws-4.1.5-1(無變更)

  • 在 Amazon Linux 2 2.12 上將 Lustre 用戶端版本升級至 。Lustre 用戶端2.12已安裝在 Ubuntu 20.04、18.04 和 CentOS >= 7.7 上。

  • 在 CentOS 72.10.8.6 上將 Lustre 用戶端版本升級至 。

  • 將 NVIDIA 驅動程式升級至版本 470.182.03(從版本 )470.141.03

  • 將 NVIDIA Fabric Manager 升級到版本 470.182.03(從版本 )470.141.03

  • 將 NVIDIA CUDA Toolkit 升級到版本 11.8.0(從版本 )11.7.1

  • 將 NVIDIA CUDA 範例升級至版本 11.8.0

  • 將 Intel MPI 程式庫升級至版本 2021 Update 9 (自版本 2021 Update 6 起)。如需詳細資訊,請參閱 Intel® MPI Library 2021 Update 9

  • 將 NICE DCV 升級到版本 2023.0-15022(從版本 2022.2-14521)。

    • 伺服器: 2023.0.15022-1(從版本 )2022.2-14521-1

    • xdcv: 2023.0.547-1(從 版本)2022.2.519-1

    • gl: 2023.0.1027-1(從版本 )2022.2.1012-1

    • web_viewer: 2023.0.15022-1(從版本 開始2022.2.14521-1)。

  • aws-cfn-bootstrap 升級至版本 2.0-24

  • 建置 AWS 批次叢集的容器映像時,CodeBuild 環境使用的升級映像:

    • aws/codebuild/amazonlinux2-x86_64-standard:4.0 (來自 aws/codebuild/amazonlinux2-x86_64-standard:3.0)。

    • aws/codebuild/amazonlinux2-aarch64-standard:2.0 (來自 aws/codebuild/amazonlinux2-aarch64-standard:1.0)。

錯誤修正:

  • 修正 Amazon EFS 和 Amazon FSx 網路安全群組驗證器,以避免報告錯誤。

  • 修正 Image Builder 在build-image操作期間所建立資源的遺失標記。

  • 修正 的更新政策MaxCount,以一律在 MaxCount 屬性上執行數值比較。

  • 使用多個網路卡修正運算節點執行個體上的 IP 對齊。

  • 在執行佇列參數更新且未更新 Slurm 會計組態slurm_parallelcluster_slurmdbd.conf時,修正 StoragePass中 的替換。

  • 修正使用現有 EFS 檔案系統建立叢集時,導致建立懸置安全群組的問題。

  • 修正重新啟動時導致cfn-hup協助程式失敗的問題。

  • 將具有INVALID_REG旗標的動態節點視為 Slurm 保護模式的引導失敗。未通過 Slurm 註冊的靜態節點在 之後已視為引導失敗node_replacement_timeout

如需變更的詳細資訊,請參閱 GitHub 上的 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2023 年 5 月 22 日

AWS ParallelCluster 3.5.1 版已發行

AWS ParallelCluster 3.5.1 版已發行。

增強功能:

變更:

  • 將 EFA 安裝程式升級至 1.22.0

    • Efa-driver: efa-2.1.1g (來自 efa-2.1.1-1)

    • Efa-config:efa-config-1.13-1(來自 efa-config-1.12-1)

    • Efa-profile:efa-profile-1.5-1(無變更)

    • Libfabric-aws: libfabric-aws-1.17.0-1(來自 libfabric-aws-1.16.1amzn3.0-1)

    • Rdma-core:rdma-core-43.0-1(無變更)

    • 開啟 MPI: openmpi40-aws-4.1.5-1 (來自 openmpi40-aws-4.1.4-3)

    將 NICE DCV 升級至版本 2022.2-14521

    • 伺服器: 2022.2.14521-1

    • xdcv: 2022.2.519-1

    • gl: 2022.2.1012-1

    • web_viewer: 2022.2.14521-1

錯誤修正:

  • 修正在叢集更新中移除共用 Amazon EBS 磁碟區/etc/exports時,因 MountDir和 之間的模式比對所導致的潛在節點啟動失敗。

  • 修正 以防止日誌compute_console_output檔案在每次clustermgtd反覆運算時截斷。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2023 年 3 月 29 日

AWS ParallelCluster 3.5.0 版已發行

AWS ParallelCluster 3.5.0 版已發行。

增強功能:

  • 使用 AWS ParallelCluster UI 存取和管理叢集。

  • 在 CloudFormation 範本中新增版本控制 AWS ParallelCluster 政策,供您在工作負載中參考。

  • 新增 Python AWS ParallelCluster 程式庫,以搭配您自己的程式碼使用。

  • 在運算節點引導失敗時,將運算節點主控台輸出的記錄新增至 Amazon CloudWatch。

  • 新增失敗欄位,其中包含當叢集建立失敗時要describe-cluster輸出的失敗代碼和原因。

  • 新增驗證程式,以防止在呼叫子程序模組時插入惡意字串。

  • 佈建靜態節點PROTECTED時,如果叢集狀態變更為 ,則建立叢集失敗。

變更:

  • 升級到 Slurm 版本 22.05.8(從版本 開始22.05.7)

  • 將 EFA 安裝程式升級至 1.21.0

    • Efa-driver: efa-2.1.1-1(來自 efa-2.1)

    • Efa-config:efa-config-1.12-1(來自 efa-config-1.11-1)

    • Efa-profile:efa-profile-1.5-1(無變更)

    • Libfabric-aws: libfabric-aws-1.16.1amzn3.0-1(來自 libfabric-aws-1.16.1)

    • Rdma-core: rdma-core-43.0-1 (來自 rdma-core-43.0-2)

    • 開啟 MPI:openmpi40-aws-4.1.4-3(無變更)

  • 讓 Slurm 控制器更詳細地記錄,並啟用 Slurm 省電外掛程式的額外記錄。

錯誤修正:

  • 修正叢集資料庫建立,方法是在啟用 Slurm 會計時,驗證叢集名稱不超過 40 個字元。

  • 修正 中clustermgtd導致運算節點在 Amazon EC2 執行個體狀態檢查失敗時透過 Slurm 重新啟動的問題。

  • 修正因為前端節點上的 IAM 政策不正確,導致其他帳戶共用容量保留無法啟動的運算節點問題。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-nodeaws-parallelcluster-ui 套件CHANGELOG的檔案。

2023 年 2 月 20 日

AWS ParallelCluster 3.4.1 版已發行

AWS ParallelCluster 3.4.1 版已發行。

錯誤修正:

  • 修正 Slurm 排程器問題,這些問題可能導致不正確地套用更新至其運算節點的內部登錄檔。因此,如果此問題,EC2 執行個體可能會變得無法使用,或可能受到不正確執行個體類型的支援。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2023 年 1 月 13 日

AWS ParallelCluster 3.4.0 版已發行

AWS ParallelCluster 3.4.0 版已發行。

增強功能:

  • 新增跨多個可用區域啟動節點的支援,以提高容量可用性。

  • 新增為每個佇列指定多個子網路的支援,以提高容量可用性。

  • Iam / ResourcePrefix 中新增組態參數,以指定由 建立之 IAM 資源的路徑和名稱的字首 AWS ParallelCluster。

  • 新增新的組態區段 DeploymentSettings / LambdaFunctionsVpcConfig,以指定 AWS ParallelCluster Lambda 函數使用的 Vpc 組態。

  • 新增在叢集更新期間指定要在前端節點中執行的自訂指令碼的功能。使用 Slurm 做為排程器時,可以使用 HeadNode / CustomActions / OnNodeUpdated 指定指令碼。

變更:

  • 移除為現有檔案系統建立 Amazon EFS 掛載目標。

  • 使用 掛載 EFS 檔案系統amazon-efs-utils。EFS 檔案系統可以使用傳輸中加密和 IAM 授權使用者進行掛載。

  • 在 CentOS7 和 Ubuntu 上安裝 stunnel 5.67,以支援 EFS 傳輸中加密。

  • 將 EFA 安裝程式升級至 1.20.0(從 1.18.0)。

    • Efa-driver: efa-2.1 (來自 efa-1.16.0-1)

    • Efa-config:efa-config-1.11-1(無變更)

    • Efa-profile:efa-profile-1.5-1(無變更)

    • Libfabric-aws: libfabric-aws-1.16.1(來自 libfabric-aws-1.16.0~amzn4.0-1)

    • Rdma-core:rdma-core-43.0-2來自 (rdma-core-41.0-2)

    • 開啟 MPI:openmpi40-aws-4.1.4-3來自 (openmpi40-aws-4.1.4-2)

  • 升級 Slurm 至版本 22.05.7(從 22.05.5)。

  • 將 Python 升級至 3.9.163.7.16。 (從 3.9.153.7.13)。

  • 使用 Slurm 時22.05.7,處於 IDLE+CLOUD+COMPLETING+POWER_DOWN+NOT_RESPONDING 狀態的動態節點不會被視為運作狀態不佳。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2022 年 12 月 22 日

AWS ParallelCluster 3.3.1 版已發行

AWS ParallelCluster 3.3.1 版已發行。

變更:

  • 官方 AWS ParallelCluster 產品 AMIs 現已在兩年的 Amazon EC2 棄用後提供。

  • 將 AWS ParallelCluster API Lambda 的記憶體大小增加至 2048,以減少冷啟動懲罰並避免逾時。

錯誤修正:

  • 防止替換受管 FSx for Lustre 檔案系統,以及遺失包含運算機群子網路 ID 變更的叢集更新資料。

  • SharedStorage DeletionPolicy適用於叢集更新動作。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelcluster 套件CHANGELOG的檔案。

2022 年 12 月 2 日

AWS ParallelCluster 文件專用 hpc6id 備註

AWS ParallelCluster 僅文件更新

2022 年 12 月 2 日

AWS ParallelCluster 3.1.5 版已發行

AWS ParallelCluster 3.1.5 版已發行。

增強功能:

  • 修正防止閒置節點終止的 Slurm 問題。

  • 將 EFA 安裝程式升級至 1.18.0

    • Efa-driver: efa-1.16.0-1

    • Efa-config: efa-config-1.11-1 (來自 efa-config-1.9-1)

    • Efa-profile:efa-profile-1.5-1(無變更)

    • Libfabric-aws: libfabric-aws-1.16.0~amzn4.0-1(來自 libfabric-1.13.2)。

    • Rdma-core: rdma-core-41.0-2 (來自 rdma-core-37.0)

    • 開啟 MPI: openmpi40-aws-4.1.4-2 (來自 openmpi40-aws-4.1.1-2)

變更:

  • ParallelClusterUserRolelambda:ListTagslambda:UntagResource新增至 AWS ParallelCluster API 堆疊用於叢集更新的 。

  • 將 Intel MPI Library 升級至版本 2021 Update 6 (自版本 2021 Update 4 起)。如需詳細資訊,請參閱 Intel® MPI Library 2021 Update 6

  • 將 NVIDIA 驅動程式升級至 470.141.03 版 (從 470.103.01)。

  • 將 NVIDIA Fabric Manager 升級到 470.141.03 版 (從 470.103.01)。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2022 年 11 月 16 日

AWS ParallelCluster 3.3.0 版已發行

AWS ParallelCluster 3.3.0 版已發行。

增強功能:

  • 使用 Slurm 做為排程器時,為運算資源新增對多個執行個體配置組態的支援。如需詳細資訊,請參閱使用 Slurm 進行多個執行個體類型配置

  • 使用更新的組態,新增對使用叢集更新新增和移除 SharedStorage 的支援。如需詳細資訊,請參閱共用儲存

  • 新增 EfsFsxLustre DeletionPolicy 共用儲存設定的新組態參數,以支援儲存保留。

  • 使用新的組態參數排程/SlurmSettings/資料庫新增對 Slurm 會計的支援。 ./Scheduling-v3.html#Scheduling-v3-SlurmSettings-Database如需詳細資訊,請參閱使用 Slurm 會計 AWS ParallelCluster

  • 新增對隨需容量保留 (ODCR) 和容量保留資源群組的支援。如需詳細資訊,請參閱使用隨需容量保留 (ODCR) 啟動執行個體

  • 新增組態參數以指定要在叢集中支援的 IMDS 版本,或在叢集中建置映像基礎設施、Imds / ImdsSupport 和建置、Imds / ImdsSupport、組態。

  • SlurmQueues / ComputeResources 區段中新增對網路 / PlacementGroup 的支援。

  • 新增對具有多個網路介面的執行個體的支援,每個裝置僅限一個 ENI。

  • 檢查已連接安全群組中的 CIDR 區塊,以改善外部 Amazon EFS 檔案系統的聯網驗證。

  • 新增驗證程式,以檢查設定的執行個體類型是否支援置放群組。

  • 將 NFS 執行緒設定為 min(256, max(8, num_cores * 4)),以確保更好的穩定性和效能。

  • 在建置時間移動 NFS 安裝,以減少組態時間。

  • 針對部署 AWS ParallelCluster API 時建立的 EcrImageBuilder SNS 主題啟用伺服器端加密,並用於通知 docker 映像建置事件。

變更:

  • 變更 SlurmQueues / Networking / PlacementGroup / 的行為Enabled。它現在會為每個運算資源建立唯一的受管置放群組,而不是為所有運算資源建立單一受管置放群組。

  • 新增對 SlurmQueues / Networking / PlacementGroup / Name 的支援作為偏好的命名方法。

  • 將前端節點標籤從啟動範本移至執行個體定義,以避免在標籤更新時更換前端節點。

  • 停用透過 執行的指令碼執行的多執行緒cloud-init,而不是透過啟動範本中的CpuOptions設定。

  • 在 API 基礎設施、API Docker 容器和叢集 Lambda 資源中,將 Python 升級至 3.9 版和 NodeJS 升級至 16 版。

  • 在 中移除對 Python 3aws-parallelcluster-batch-cli.6 的支援。

  • 升級 Slurm 至版本 22.05.5(從 21.08.8-2)。

  • 將 NVIDIA 驅動程式升級至版本 470.141.03(從 470.129.06)。

  • 將 NVIDIA Fabric Manager 升級到版本 470.141.03(從 470.129.06)。

  • 將 NVIDIA CUDA Toolkit 升級到 11.7.1 版 (from 11.4.4)。

  • 將 AWS ParallelCluster Virtualenvs 中使用的 Python 從 升級至 3.7.13 3.9.15

  • 將 EFA 安裝程式升級至 1.18.0 版。

    • Efa-driver:efa-1.16.0-1(無變更)

    • Efa-config:efa-config-1.11-1(from efa-config-1.10-1)

    • Efa-profile:efa-profile-1.5-1(無變更)

    • Libfabric-aws: libfabric-aws-1.16.0~amzn4.0-1(來自 libfabric-aws-1.16.0~amzn2.0-1)。

    • Rdma-core: rdma-core-41.0-2 (來自 rdma-core-37.0)

    • 開啟 MPI: openmpi40-aws-4.1.4-2 (來自 openmpi40-aws-4.1.1-2)

  • 將 NICE DCV 升級到版本 2022.1-13300(從 2022.0-12760)。

  • 為 啟用抑制 SingleSubnetValidator Queues

  • DRAIN節點處於 COMPLETING 狀態時,請勿取代節點,因為 Epilog 可能仍在執行中。

錯誤修正:

  • 修正 AWS ParallelCluster ListClusterLogStreams命令中篩選條件參數的驗證,以便在傳遞不正確的篩選條件時失敗。

  • 修正當 與其他 SharedStorage / EfsSettings 參數指定FileSystemId時,參數 SharedStorage / EfsSettings 的驗證失敗。先前FileSystemId並未包含 。

  • 修正變更 SharedStorage 順序與組態中其他變更時的叢集更新。

  • 修正 AWS ParallelCluster API UpdateParallelClusterLambdaRole中的 ,以將日誌上傳至 CloudWatch。

  • 修正在執行任何技術指南之前安裝套件時,未使用本機 CA 憑證套件的 Cinc。

  • Build:UpdateOsPackages:Enabled:true 使用 設定 pcluster build-image時,修正升級 ubuntu 時的懸置。

  • 透過重複金鑰失敗來修正 YAML 叢集組態的剖析。

如需變更的詳細資訊,請參閱 GitHub 上的 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2022 年 11 月 2 日

AWS ParallelCluster 僅新增 文件 API 參考。

AWS ParallelCluster 僅文件更新

2022 年 10 月 27 日

AWS ParallelCluster 3.2.1 版已發行

AWS ParallelCluster 3.2.1 版已發行。

增強功能:

  • 改善邏輯,將主機路由表與不同的網路卡建立關聯,以更好地支援具有多個 NICs Amazon EC2 執行個體。

變更:

  • 將 NVIDIA 驅動程式升級至 470.141.03 版。

  • 將 NVIDIA Fabric Manager 升級到 470.141.03 版。

  • 停用cron任務 man-dbmlocate,這可能會對節點效能產生負面影響。

  • 將 Intel MPI Library 升級至 2021.6.0.602。

  • 將 Python 從 3.7.10 升級到 3.7.13 以回應此安全風險。

錯誤修正:

  • 避免在叢集組態無法使用DescribeCluster時失敗。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2022 年 10 月 3 日

AWS ParallelCluster 3.2.0 版已發行

AWS ParallelCluster 3.2.0 版已發行。

增強功能:

變更:

  • 將 EFA 安裝程式升級至 1.17.2 版。

    • EFA 驅動程式: efa-1.16.0-1

    • EFA 組態: efa-config-1.10-1

    • EFA 設定檔: efa-profile-1.5-1

    • Libfabric: libfabric-aws-1.16.0~amzn2.0-1

    • RDMA 核心: rdma-core-41.0-2

    • 開啟 MPI: openmpi40-aws-4.1.4-2

  • 將 NICE DCV 升級至 2022.0-12760 版。

  • 將 NVIDIA 驅動程式升級至 470.129.06 版。

  • 將 NVIDIA Fabric Manager 升級到 470.129.06 版。

  • 在根磁碟區和其他磁碟區中,將預設 EBS 磁碟區類型從 gp2 變更為 gp3。

  • FSx for Lustre 檔案系統的變更建立者 AWS ParallelCluster:

    • 將預設部署類型變更為 Scratch_2

    • 將 Lustre 伺服器版本變更為 2.12

  • 傳遞現有的 / true時,不需要將 PlacementGroup PlacementGroup / Enabled 設定為 Id

  • PlacementGroup / Enabled明確設為 Id時,不允許設定 PlacementGroup /false

  • parallelcluster:cluster-name標籤新增至 建立的所有資源 AWS ParallelCluster。

  • lambda:UntagResourcelambda:ListTags和 新增至 AWS ParallelCluster API ParallelClusterUserRole 堆疊用於叢集更新。

  • Secured 啟用組態參數 / HeadNode / 時,僅限IMDS根和叢集管理員使用者的 IPv6 Imds 存取。

  • 使用自訂 AMI 時,請使用 AMI 根磁碟區大小,而非 ParallelCluster 預設值 35 GiB。您可以在叢集組態檔案中變更 值。

  • 當組態參數 Scheduling / SlurmQueues / / SpotPrice 低於所需的 Spot ComputeResources 請求履行價格下限時,自動停用運算機群。

  • 在更新期間新增或移除區段時,在變更集中顯示 requested_valuecurrent_value值。

  • 停用 aws-ubuntu-eni-helper服務,可在深度學習 AMIs 中使用,以避免在使用多個網路卡設定執行個體configure_nw_interface.sh時與 衝突。

  • 移除對 Python 3.6 的支援。

  • 使用多個網路卡設定執行個體時,將所有網路介面的 MTU 設定為 9001。

  • 設定運算節點 FQDN 時,移除結尾的點。

  • 在 中管理靜態節點POWERING_DOWN

  • 不會在 中取代動態節點,POWER_DOWN因為任務可能仍在執行中。

  • 只有在叢集組態中更新Scheduling參數時,才能在叢集更新時間重新啟動 slurmctld clustermgtd和 精靈。

  • 更新 slurmctld slurmdsystemd和服務檔案。

  • Secured 啟用組態參數 / / 時,將 IMDS Imds 的 IPv6 HeadNode 存取限制為僅限根和叢集管理員使用者。

  • 設定 Slurm 組態AuthInfo=cred_expire=70,以減少節點無法使用時,重新排入佇列任務必須等待的時間,然後再重新開始。

  • 升級第三方技術指南相依性:

    • apt-7.4.2 (來自 apt-7.4.0)

    • line-4.5.2 (從 line-4.0.1)

    • openssh-2.10.3 (來自 openssh-2.9.1)

    • pyenv-3.5.1 (來自 pyenv-3.4.2)

    • selinux-6.0.4 (來自 selinux-3.1.1)

    • yum-7.4.0 (來自 yum-6.1.1)

    • yum-epel-4.5.0 (來自 yum-epel-4.1.2)

錯誤修正:

  • 修正預設行為,以便在建置自訂 AMI 時略過 AWS ParallelCluster 驗證和測試步驟。

  • 修正 中的檔案控制代碼洩漏computemgtd

  • 修正偶爾導致啟動的執行個體因為尚未在 EC2 DescribeInstances 回應中提供而立即終止的競爭條件。

  • 修正對使用 Arm 處理器之執行個體類型的 DisableSimultaneousMultithreading 參數支援。

  • 從舊版升級時修正 AWS ParallelCluster API 堆疊更新失敗。在 中新增用於ListImagePipelineImages動作的資源模式EcrImageDeletionLambdaRole

  • 修正 AWS ParallelCluster API 在建立 FSx for Lustre 檔案系統時,新增從 Amazon S3 匯入或匯出所需的缺少許可。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2022 年 7 月 27 日

AWS ParallelCluster 今年至今僅提供文件的更新

AWS ParallelCluster 僅限文件的更新。

新區段:

區段更新:

2022 年 7 月 6 日

AWS ParallelCluster 3.1.4 版已發行

AWS ParallelCluster 3.1.4 版已發行。

增強功能:

變更:

  • 升級 Slurm 至 21.08.8-2 版。

  • 使用 JWT 支援建置 Slurm。

  • 傳遞現有的 / true時,不需要將 PlacementGroup / Enabled PlacementGroup 設定為 Id

  • lambda:TagResource新增至 ParallelClusterUserRole ParallelCluster API 堆疊用於建立叢集和建立映像。

錯誤修正:

  • 修正使用 export-cluster-logs命令搭配 --filters選項時匯出叢集日誌的功能。

  • 修正 AWS Batch Docker 進入點,以使用/home共用目錄來協調Multi-node-Parallel任務執行。

  • 將 Slurm 運作狀態不良的靜態節點設定為關閉時重設節點地址,以避免將容量不足的靜態節點視為引導失敗節點。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2022 年 5 月 16 日

AWS ParallelCluster 3.1.3 版已發行

AWS ParallelCluster 3.1.3 版已發行。

增強功能:

  • 執行 SSH 金鑰建立以及建立 HOME 目錄,例如,在 SSH 登入期間、切換到另一個使用者時,以及以另一個使用者身分執行命令時。

  • 在組態參數 DirectoryService / DomainName 中新增對 FQDN 和 LDAP 辨別名稱的支援。新的驗證程式現在會檢查這兩個語法。

  • 部署在前端節點上的新update_directory_service_password.sh指令碼支援在 SSSD 組態中手動更新 Active Directory 密碼。密碼由 AWS Secrets Manager 從叢集組態擷取為 。

  • 新增支援以在沒有預設 VPC 的環境中部署 API 基礎設施。

變更:

  • 在透過build-image命令建立的 x86_64 官方 AMIs 和 AMIs 中停用更深的 C-States,以確保高效能和低延遲。

  • 作業系統套件更新和安全性修正。

  • 將 Amazon Linux 2 基礎映像變更為搭配核心 5.10 使用 AMIs。

錯誤修正:

  • 由於新的 EC2 Image Builder 政策,在映像建置成功DELETE_FAILED之後修正 中的建置映像堆疊。

  • 修正組態參數 DirectoryService/DomainAddr 在包含多個網域地址時轉換為 ldap_uri SSSD 屬性的問題。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbook 套件CHANGELOG的檔案。

2022 年 4 月 20 日

AWS ParallelCluster 3.1.2 版已發行

AWS ParallelCluster 3.1.2 版已發行。

變更:

  • 升級 Slurm 至版本 21.08.6(從 21.08.5)。

錯誤修正:

  • 在沒有網際網路存取的子網路中部署叢集時,修正運算節點上的/etc/hosts檔案更新。

  • 修正運算節點引導,在加入叢集之前等待暫時性磁碟機初始化。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelcluster 套件CHANGELOG的檔案。

2022 年 3 月 2 日

AWS ParallelCluster 3.1.1 版已發行

AWS ParallelCluster 3.1.1 版已發行。

  • 透過與透過 Directory AWS Service 管理的 Active Directory (AD) 網域整合,新增對多個使用者叢集環境的支援。

  • 在叢集組態檔案中新增對 UseEc2Hostnames 的支援。設為 true 時,針對運算節點使用 Amazon EC2 預設主機名稱 (例如 ip-1-2-3-4)。

  • 新增在沒有網際網路存取的子網路中建立叢集的支援。

  • 為每個佇列新增對多個運算執行個體類型的支援。

  • 新增使用 NVIDIA 卡在 ARM 執行個體上使用 Slurm 進行 GPU 排程的支援。

  • cluster-name(-n)、 region (-r)、 image-id(-i) 和 / cluster-configuration image-configuration(-c) 的縮寫旗標新增至 AWS ParallelCluster CLI。

  • 新增對 FSx for Lustre AutoImportPolicy 參數NEW_CHANGED_DELETED選項的支援。

  • parallelcluster:compute-resource-name標籤新增至運算節點使用的 EC2 LaunchTemplates 資源。

  • 改善叢集內建立的安全群組,以便在為某些前端節點和/或佇列指定SecurityGroups參數時,允許來自自訂安全群組的傳入連線。

  • 安裝適用於 ARM 的 NVIDIA 驅動程式和 CUDA 程式庫。

變更:

  • 升級 Slurm 至版本 21.08.5(從 20.11.8)。

  • 將 Slurm 外掛程式升級至版本 21.08(從 20.11)。

  • 將 NICE DCV 升級到版本 2021.3-11591(從 2021.1-10851)。

  • 將 NVIDIA 驅動程式升級至版本 470.103.01(從 470.57.02)。

  • 將 NVIDIA Fabric Manager 升級到版本 470.103.01(從 470.57.02)。

  • 將 CUDA 升級到版本 11.4.4(從 11.4.0)。

  • Intel MPI 已更新至版本 2021 Update 4 (更新自版本 2019 Update 8)。如需詳細資訊,請參閱 Intel® MPI Library 2021 Update 4

  • 將 PMIx 升級到版本 3.2.3(從 3.1.5)。

  • 將失敗的運算節點傾印移除至 /home/logs/compute。運算節點日誌檔案可在 CloudWatch 和 Amazon EC2 主控台日誌中使用。

  • 啟用隱藏SlurmQueuesComputeResources長度驗證程式的潛力。

  • 在 Amazon Linux 2 上的執行個體啟動時間停用套件更新。

  • 在建置 AWS ParallelCluster 自訂映像時停用 Amazon EC2 ImageBuilder 增強型映像中繼資料。

  • cloud-init資料來源明確設定為 EC2。這可節省 Ubuntu 和 CentOS 平台的開機時間。

  • 在運算機群啟動範本名稱中使用運算資源名稱,而非執行個體類型。

  • 將 stderr 和 stdout 重新導向至 CLI 日誌檔案,以防止 pcluster CLI 輸出中出現不需要的文字。

  • 將設定/安裝配方移至從主要技術指南呼叫的個別技術指南。現有的進入點會維護並回溯相容。

  • 在 AMI 建置期間下載 Intel HPC 平台的相依性,以避免在叢集建立期間接觸網際網路。

  • 設定 Slurm 節點時,請勿-從運算資源名稱中分割。

  • 未安裝 NVIDIA 驅動程式時,請勿在 Slurm 中設定 GPUs。

  • 修正 中的ecs:ListContainerInstances許可BatchUserRole

  • 修正未指定字首、先前匯出至字None首的叢集日誌匯出。

  • 在叢集更新失敗時,不會執行修正轉返。

  • 修正 中的ecs:ListContainerInstances許可BatchUserRole

  • 如果KmsKeyId指定不支援的 RootVolumeHeadNode請引發錯誤來修正 的結構描述。

  • 修正要在 CloudWatch Dashboard 中顯示的 Amazon FSx 遺失指標。

  • 修正 EfaSecurityGroupValidator。先前,當提供自訂安全群組並啟用 EFA 時,它可能會導致錯誤失敗。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2022 年 2 月 10 日

AWS ParallelCluster 3.0.3 版已發行

AWS ParallelCluster 3.0.3 版已發行。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbook 套件CHANGELOG的檔案。

2022 年 1 月 17 日

AWS ParallelCluster 3.0.2 版已發行

AWS ParallelCluster 3.0.2 版已發行。

Elastic Fabric Adapter 安裝程式升級至 1.14.1

  • EFA 組態: efa-config-1.9-1(來自 efa-config-1.9)

  • EFA 設定檔: efa-profile-1.5-1(來自 efa-profile-1.5)

  • EFA 核心模組: efa-1.14.2(來自 efa-1.13.0)

  • RDMA 核心: rdma-core-37.0(來自 rdma-core-35)

  • Libfabric: libfabric-1.13.2 (來自 libfabric-1.13.0)

  • 開啟 MPI:openmpi40-aws-4.1.1-2(無變更)

如果執行個體類型支援,一律會啟用 GPUDirect RDMA。GdrSupport 組態選項沒有效果。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2021 年 11 月 5 日

AWS ParallelCluster 3.0.1 版已發行

AWS ParallelCluster 3.0.1 版已發行。

叢集組態遷移工具

  • 客戶現在可以將叢集組態從第 2 AWS ParallelCluster 版格式遷移至 YAML 型第 3 AWS ParallelCluster 版格式。如需詳細資訊,請參閱 pcluster3-config-converter

前端節點可以停止

  • 停止運算機群後,可以使用 Amazon EC2 主控台或 stop-instances AWS CLI 命令來停止前端節點,並在稍後重新啟動。

預設 AWS 區域讀取自 ~/.aws/config 檔案

  • 對於 pcluster 命令,如果未在組態檔案、環境或命令列中指定 AWS 區域,則會使用 ~/.aws/config 檔案 [default]區段中 region設定中指定的預設 AWS 區域。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2021 年 10 月 27 日

AWS ParallelCluster 3.0.0 版已發行

AWS ParallelCluster 3.0.0 版已發行。

透過 Amazon API Gateway 支援叢集管理

  • 客戶現在可以使用 Amazon API Gateway 透過 HTTP 端點管理和部署叢集。這會為指令碼或事件驅動的工作流程開啟新的可能性。

    AWS ParallelCluster 命令列界面 (CLI) 也經過重新設計,可與此 API 相容,並包含新的 JSON 輸出選項。這項新功能可讓客戶使用 CLI 實作類似的建置區塊功能。

改善自訂 AMI 建立

  • 客戶現在可以存取更強大的程序,以使用 EC2 Image Builder 建立和管理自訂 AMIs。自訂 AMIs 現在可以透過單獨的 AWS ParallelCluster 組態檔案進行管理,並且可以使用 AWS ParallelCluster 命令列界面中的 pcluster build-image 命令來建立。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelclusteraws-parallelcluster-cookbookaws-parallelcluster-node 套件CHANGELOG的檔案。

2021 年 9 月 10 日

PCUI
變更 描述 日期

PCUI 2025.04.0 版已發行

PCUI 2025.04.0 版已發行

重大變更:

  • 移除 PC 版本的預設值。現在,使用者必須指定要使用的 PC 版本。

功能:

  • 新增新的堆疊參數 'AdditionalPoliciesPCAPI',以新增 ParallelCluster API Lambda 角色的自訂許可,以及預設的許可。

錯誤修正:

安全性:

2025 年 4 月 16 日

PCUI 2024.11.0 版已發行

PCUI 2024.11.0 版已發行

錯誤修正:

  • 明確設定 ECR 私有儲存庫的政策,以防止在會影響 Lambda 函數的堆疊更新上移除政策。此政策包含 Lambda 函數擷取程式碼所需的許可。

2024 年 11 月 22 日

PCUI 2024.10.0 版已發行

PCUI 2024.10.0 版已發行

變更:

  • 新增對 AWS ParallelCluster 3.11.1 的支援。

  • 在精靈中新增對隨需容量預留和容量區塊的支援。

  • 將 g6、m7 和 p5 系列新增至精靈中支援的執行個體類型清單。

  • 新增堆疊選用參數,以設定 PCUI 和 Cognito 的自訂網域。

錯誤修正:

  • 修正中斷自訂網域設定的錯誤。

安全性:

  • 從 3.0.10 升級 Flask-CORS 至 4.0.2,以解決漏洞 CVE-2024-6221。

  • 從 13.0.3 升級到 15.2.5,以解決漏洞 CVE-2024-4068。

  • 完整變更日誌

2024 年 10 月 22 日

PCUI 2024.05.0 版已發行

PCUI 2024.05.0 版已發行。

錯誤修正:

  • 修正當使用者開啟任務狀態面板時,前端封鎖 UI 的錯誤。

  • 完整變更日誌

2024 年 5 月 14 日

PCUI 2024.04.0 版已發行

PCUI 2024.04.0 版已發行。

功能:

2024 年 4 月 17 日

PCUI 2024.03.0 版已發行

PCUI 2024.03.0 版已發行。

功能:

  • 新增對 3.9.0 AWS ParallelCluster 版的支援

  • 新增對 Ubuntu 22.04 和 Red Hat Enterprise Linux 9 的支援

  • 已取代的 Ubuntu 18.04

錯誤修正

  • 已修正使用許多叢集時,導致某些叢集未出現的問題

如需變更的詳細資訊,請參閱 GitHub 上aws-parallelcluster-ui套件CHANGELOG的檔案。

2024 年 3 月 12 日

PCUI 2024.02.0 版已發行

PCUI 2024.02.0 版已發行

變更:

  • 將 Lambda 執行期環境更新為 Python v3.9

如需變更的詳細資訊,請參閱 GitHub 上aws-parallelcluster-ui套件CHANGELOG的檔案。

2024 年 2 月 8 日

PCUI 2023.12.0 版已發行

PCUI 2023.12.0 版已發行。

功能:

  • 新增使用私有聯網進行 PCUI 部署的支援。

  • 新增選擇性地將許可界限套用至 PCUI 和 PCAPI 基礎設施建立的每個 IAM 角色的可能性

  • 新增可選擇將字首套用至 PCUI 和 PCAPI 基礎設施建立的每個 IAM 角色和政策的可能性。

  • 新增對 ParallelCluster 3.8.0 版的支援,在精靈中沒有功能同位。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelcluster-ui 套件CHANGELOG的檔案。

2023 年 12 月 21 日

PCUI 2023.10.0 版已發行

PCUI 2023.10.0 版已發行。

功能:

  • 新增對 ParallelCluster 3.7.2 的支援,精靈中的功能同位僅限於 FSx 檔案快取,以及記憶體型排程與多個執行個體類型的相容性。

錯誤修正:

  • 已修正當 PCUI 沒有與 Cost Explorer 互動的許可時,導致 UI 錯誤的問題。

改善項目

  • 透過將存取權杖 TTL 從 10 分鐘減少到 5 分鐘來提高安全性。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelcluster-ui 套件CHANGELOG的檔案。

2023 年 10 月 20 日

PCUI 2023.06.0 版已發行

PCUI 2023.06.0 版已發行。

變更:

  • 已將預設 AWS ParallelCluster API 版本升級至 3.6.0。

錯誤修正:

  • 已修正 AWS GovCloud (美國西部) 區域的中斷部署。

  • 分割面板現在可在建立開始後正確載入叢集詳細資訊。

備註:

  • 成本監控功能不適用於 AWS GovCloud (US) 區域。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelcluster-ui 套件CHANGELOG的檔案。

2023 年 6 月 7 日

PCUI 2023.05.0 版已發行

PCUI 2023.05.0 版已發行。

增強功能:

  • 從 3.6.0 AWS ParallelCluster 版開始,新增對 RHEL 8 的支援。

  • 新增叢集成本監控。

  • 從 3.6.0 AWS ParallelCluster 版開始,增加佇列和運算資源配額。

變更:

  • 已改善叢集建立精靈使用者介面。

  • 增加 PCUI 部署的速度。

  • 已改善新增使用者的界面。

  • 根據預設,佇列位於前端節點子網路中。

錯誤修正:

  • 在叢集建立完成後切換到正確的區域。

  • 修正「編輯叢集」功能中的載入指標顯示。

  • 修正移除 EBS SnapshotId 屬性時的叢集建立。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelcluster-ui 套件CHANGELOG的檔案。

2023 年 5 月 16 日

PCUI 2023.04.0 版已發行

PCUI 2023.04.0 版已發行。

增強功能:

  • 叢集建立精靈重新設計。

  • 叢集日誌頁面重新設計。

  • 新增共用儲存體的自訂名稱設定。

  • 在將儲存新增至叢集時新增多個儲存體選擇。

  • 新增對 Amazon EFS 和 FSx for Lustre 的DeletionPolicy支援。

  • 在叢集組態中新增ImdsSupport設定。

  • 新增對 C7 執行個體類型的支援。

  • 新增教學 還原至先前的 AWS Systems Manager 文件版本

變更:

  • 叢集組態 YAML 大小上限為 1MB。

  • 由於使用 Boto3 IAM 臨時憑證的授權,使用者不會登出。

  • 選取 HPC 執行個體時停用多執行緒選項。

  • 已移除叢集建立頁面上的停用轉返。

  • 在提供必要資訊之前,使用者無法使用 PCUI。

  • 最多可新增 10 個佇列。

  • 在 PCUI 安裝期間,不會覆寫SSM-SessionManagerRunShell文件。

錯誤修正:

  • 修正中斷的重設密碼連結。

  • 修正因EcrPrivateRepository不是空的delete stack而造成的損壞

  • 修正多個使用者管理屬性區段中產生 SSH 金鑰核取方塊的初始化問題。

  • 已修正當機原因為具有未定義屬性的任務。

  • 已修正 SCRATCH FSx 設定。

  • 已修正啟動和停止執行個體按鈕,在按一下後仍然啟用。

如需變更的詳細資訊,請參閱 GitHub 上 aws-parallelcluster-ui 套件CHANGELOG的檔案。

2023 年 4 月 17 日

Terraform
變更 描述 日期

Terraform Provider for AWS ParallelCluster 1.1.0 已發行

錯誤修正:

  • 修正使用 ParallelCluster API 3.11.x 部署具有登入節點的叢集時,導致 terraform-apply 失敗的問題。

2024 年 12 月 6 日

Terraform Module for AWS ParallelCluster 1.1.0 已發行

變更:

  • 在所有模組範例中使用 AWS ParallelCluster Terraform Provider 1.x。

  • 在堆疊名稱為 ParallelCluster API的所有範例中,使用 ParallelClusterAPI API 3.11.1。

  • 在所有模組範例中部署登入節點。

2024 年 12 月 6 日

Terraform Provider for AWS ParallelCluster 1.0.0 已發行

功能:

2024 年 6 月 26 日

發行適用於 AWS ParallelCluster 1.0.0 的 Terraform 模組

功能:

2024 年 6 月 26 日