本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 中建立服務環境 AWS Batch
您需要建立服務環境 AWS Batch,才能在 中執行 SageMaker Training 任務。您可以建立服務環境,其中包含 與 SageMaker AI 服務 AWS Batch 整合所需的組態參數,並代表您提交 SageMaker Training 任務。
先決條件
在建立服務環境之前,請確定您有:
-
IAM 許可 – 建立和管理服務環境的許可。如需詳細資訊,請參閱AWS Batch IAM 政策、角色和許可。
- Create a service environment (AWS Console)
-
使用 AWS Batch 主控台透過 Web 界面建立服務環境。
建立服務環境
-
在 https://https://console.aws.amazon.com/batch/
開啟 AWS Batch 主控台。 -
在導覽窗格中,選擇 Environments (環境)。
-
選擇建立環境,然後選取服務環境。
-
針對服務環境組態,選擇 SageMaker AI。
-
在名稱中,輸入服務環境的唯一名稱。有效字元為 a-z、A-Z、0-9、連字號 (-) 和底線 (_)。
-
針對執行個體數目上限,輸入並行訓練執行個體數目上限
-
(選用) 透過選擇新增標籤並輸入鍵/值對來新增標籤。
-
選擇下一步。
-
檢閱新服務環境的詳細資訊,然後選擇建立服務環境。
-
- Create a service environment (AWS CLI)
-
使用
create-service-environment
命令透過 CLI AWS 建立服務環境。建立服務環境
-
使用基本必要參數建立服務環境:
aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10
-
(選用) 使用標籤建立服務環境:
aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10 \ --tags team=data-science,project=ml-training
-
確認已成功建立服務環境:
aws batch describe-service-environments \ --service-environment my-sagemaker-service-env
服務環境會出現在具有
CREATING
狀態的環境清單中。當建立成功完成時,狀態會變更為 ,VALID
且服務環境已準備好新增服務任務佇列,以便服務環境可以開始處理任務。 -
服務環境狀態定義
更新服務環境