連線至 HyperPod 叢集並將任務提交至叢集 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

連線至 HyperPod 叢集並將任務提交至叢集

您可以在 Amazon SageMaker Studio IDE 內的 HyperPod 叢集上啟動機器學習工作負載。當您在 HyperPod 叢集上啟動 Studio IDE 時,有一組命令可用來協助您開始使用。您可以處理訓練指令碼、將訓練指令碼用於 Docker 容器,以及將任務提交至叢集,所有這些動作都可以在 Studio IDE 內完成。下節提供如何將您叢集連線至 Studio IDE 的相關資訊。

在 Amazon SageMaker Studio 中,您可以導覽至 HyperPod 叢集中的其中一個叢集 (在運算下),並檢視叢集清單。您可以將叢集連線到動作下列出的 IDE。

您也可以從選項清單中選擇您的自訂檔案系統。如需如何取得此設定的相關資訊,請參閱在 Studio 中設定 HyperPod

或者,您可以使用 AWS CLI 建立空間並啟動 IDE。使用下列命令以這樣做。下列範例會在連接 fs-id FSx for Lustre 檔案系統的情況下為 user-profile-name 建立 PrivateJupyterLab 空間。

  1. 使用 建立空間create-spaceAWS CLI。

    aws sagemaker create-space \ --region your-region \ --ownership-settings "OwnerUserProfileName=user-profile-name" \ --space-sharing-settings "SharingType=Private" \ --space-settings "AppType=JupyterLab,CustomFileSystems=[{FSxLustreFileSystem={FileSystemId=fs-id}}]"
  2. 使用 建立應用程式create-appAWS CLI。

    aws sagemaker create-app \ --region your-region \ --space-name space-name \ --resource-spec '{"ec2InstanceType":"'"instance-type"'","appEnvironmentArn":"'"image-arn"'"}'

一旦開啟了應用程式,您就可以直接將任務提交至您連線至其中的叢集。