本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
更新 AWS PCS 叢集
使用這些步驟來修改叢集上的排程器設定、會計組態和 Slurm 自訂設定。如需詳細資訊,請參閱AWS PCS 叢集的自訂 Slurm 設定。
先決條件
-
叢集必須處於
ACTIVE、UPDATE_FAILED或SUSPENDED狀態 -
所有相關資源 (佇列、運算節點群組) 必須處於
ACTIVE狀態 -
無法進行其他更新操作
程序
- AWS Management Console
-
-
在 https://https://console.aws.amazon.com/pcs/
開啟 AWS PCS 主控台。 -
在導覽窗格中,選擇叢集。
-
選取要更新的叢集。
-
選擇編輯。
-
在編輯叢集頁面上,修改所需的設定:
-
在排程器組態下,更新縮減閒置時間,以控制動態執行個體在自動終止前保持閒置的時間長度。
-
視需要修改 Prolog、Epilog 和 Select 類型參數設定。
-
啟用、停用或設定受管會計的保留時間。
-
在其他排程器設定下,新增、編輯或移除 Slurm 自訂設定。如需支援參數的詳細資訊,請參閱 AWS PCS 叢集的自訂 Slurm 設定。
注意
無法編輯的欄位會顯示為唯讀,並顯示其目前的值。
-
-
選擇更新以提交變更。
-
監控叢集狀態,在程序期間顯示為「更新」。當更新成功完成時,狀態會變更。
-
- AWS CLI
-
-
開啟終端機或命令提示字元。
-
使用下列命令驗證叢集狀態:
aws pcs get-cluster --cluster-identifiermy-cluster -
使用下列其中一個範例提交更新請求:
-
若要啟用受管會計:
aws pcs update-cluster --cluster-identifiermy-cluster\ --slurm-configuration 'accounting={mode=STANDARD}' -
若要更新 Slurm Prolog 設定:
aws pcs update-cluster --cluster-identifiermy-cluster\ --slurm-configuration \ 'SlurmCustomSettings=[{parameterName=Prolog,parameterValue="/path/to/prolog.sh"}]' -
若要更新縮減規模閒置時間:
aws pcs update-cluster --cluster-identifiermy-cluster\ --slurm-configuration 'scaleDownIdleTimeInSeconds=300'
-
-
檢查叢集狀態以監控更新進度:
aws pcs get-cluster --cluster-identifiermy-cluster
成功更新請求後,命令會傳回包含所有變更的叢集物件。叢集狀態會在完成
UPDATINGACTIVE時從 變更為 。 -
更新叢集
常見問答集