使用 SageMaker AI 主控台在訓練計畫上建立 SageMaker HyperPod 叢集 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 SageMaker AI 主控台在訓練計畫上建立 SageMaker HyperPod 叢集

若要從 SageMaker AI 主控台 UI 使用訓練計劃建立 SageMaker HyperPod 叢集,請遵循下列步驟:

  1. 導覽至 SageMaker AI 主控台,網址為 https://https://console.aws.amazon.com/sagemaker/

  2. 在左側導覽窗格中,選擇 Hyperpod,然後選擇建立叢集

  3. 設定執行個體群組時,您可以選擇符合您運算容量需求的計劃。

SageMaker AI 主控台界面顯示用於在 SageMaker HyperPod 叢集中建立執行個體群組的模態視窗。表單包含執行個體群組名稱、執行個體類型、數量、執行個體容量 (具有隨需和訓練計劃選項) 的欄位,以及建立中生命週期指令碼的目錄路徑。

檢閱並建立您的叢集。當訓練計畫變成 時,使用訓練計畫的執行個體群組會擴展到指定的目標執行個體計數Active,視可用容量而定。在每個預留容量期間結束前 30 分鐘,執行個體群組會開始縮減至零個執行個體。此縮減狀態會持續到下一個預留容量期間開始或計劃結束為止。在此過程中,運作狀態良好的執行個體群組會在其初始建立後維持 InService 狀態,無論目前的執行個體計數為何。