更新 AWS PCS 叢集 - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

更新 AWS PCS 叢集

使用這些步驟來修改叢集上的排程器設定、會計組態和 Slurm 自訂設定。如需詳細資訊,請參閱AWS PCS 叢集的自訂 Slurm 設定

先決條件

  • 叢集必須處於 ACTIVEUPDATE_FAILEDSUSPENDED 狀態

  • 所有相關資源 (佇列、運算節點群組) 必須處於 ACTIVE 狀態

  • 無法進行其他更新操作

程序

AWS Management Console
  1. 在 https://https://console.aws.amazon.com/pcs/ 開啟 AWS PCS 主控台。

  2. 在導覽窗格中,選擇叢集

  3. 選取要更新的叢集。

  4. 選擇編輯

  5. 在編輯叢集頁面上,修改所需的設定:

    • 排程器組態下,更新縮減閒置時間,以控制動態執行個體在自動終止前保持閒置的時間長度。

    • 視需要修改 PrologEpilogSelect 類型參數設定。

    • 啟用、停用或設定受管會計的保留時間。

    • 在其他排程器設定下,新增、編輯或移除 Slurm 自訂設定。如需支援參數的詳細資訊,請參閱 AWS PCS 叢集的自訂 Slurm 設定

    注意

    無法編輯的欄位會顯示為唯讀,並顯示其目前的值。

  6. 選擇更新以提交變更。

  7. 監控叢集狀態,在程序期間顯示為「更新」。當更新成功完成時,狀態會變更。

AWS CLI
  1. 開啟終端機或命令提示字元。

  2. 使用下列命令驗證叢集狀態:

    aws pcs get-cluster --cluster-identifier my-cluster
  3. 使用下列其中一個範例提交更新請求:

    • 若要啟用受管會計:

      aws pcs update-cluster --cluster-identifier my-cluster \ --slurm-configuration 'accounting={mode=STANDARD}'
    • 若要更新 Slurm Prolog 設定:

      aws pcs update-cluster --cluster-identifier my-cluster \ --slurm-configuration \ 'SlurmCustomSettings=[{parameterName=Prolog,parameterValue="/path/to/prolog.sh"}]'
    • 若要更新縮減規模閒置時間:

      aws pcs update-cluster --cluster-identifier my-cluster \ --slurm-configuration 'scaleDownIdleTimeInSeconds=300'
  4. 檢查叢集狀態以監控更新進度:

    aws pcs get-cluster --cluster-identifier my-cluster

成功更新請求後,命令會傳回包含所有變更的叢集物件。叢集狀態會在完成UPDATINGACTIVE時從 變更為 。