設定 SageMaker HyperPod Slurm 叢集的多個控制器節點 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定 SageMaker HyperPod Slurm 叢集的多個控制器節點

本主題說明如何使用生命週期指令碼在 SageMaker HyperPod Slurm 叢集中設定多個控制器 (主) 節點。開始前,請檢閱使用 SageMaker HyperPod 的先決條件中列出的先決條件,並熟悉使用生命週期指令碼自訂 SageMaker HyperPod 叢集中的生命週期指令碼。本主題中的指示會在 Amazon Linux 環境中使用 AWS CLI 命令。請注意,除非明確保留,否則這些命令中使用的環境變數可在目前工作階段中使用。