在 中建立服務環境 AWS Batch - AWS Batch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 中建立服務環境 AWS Batch

您需要建立服務環境 AWS Batch,才能在 中執行 SageMaker Training 任務。您可以建立服務環境,其中包含 與 SageMaker AI 服務 AWS Batch 整合所需的組態參數,並代表您提交 SageMaker Training 任務。

先決條件

在建立服務環境之前,請確定您有:

Create a service environment (AWS Console)

使用 AWS Batch 主控台透過 Web 界面建立服務環境。

建立服務環境

  1. 在 https://https://console.aws.amazon.com/batch/ 開啟 AWS Batch 主控台。

  2. 在導覽窗格中,選擇 Environments (環境)

  3. 選擇建立環境,然後選取服務環境

  4. 針對服務環境組態,選擇 SageMaker AI。

  5. 名稱中,輸入服務環境的唯一名稱。有效字元為 a-z、A-Z、0-9、連字號 (-) 和底線 (_)。

  6. 針對執行個體數目上限,輸入並行訓練執行個體數目上限

  7. (選用) 透過選擇新增標籤並輸入鍵/值對來新增標籤

  8. 選擇下一步

  9. 檢閱新服務環境的詳細資訊,然後選擇建立服務環境

Create a service environment (AWS CLI)

使用 create-service-environment命令透過 CLI AWS 建立服務環境。

建立服務環境

  1. 使用基本必要參數建立服務環境:

    aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10
  2. (選用) 使用標籤建立服務環境:

    aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10 \ --tags team=data-science,project=ml-training
  3. 確認已成功建立服務環境:

    aws batch describe-service-environments \ --service-environment my-sagemaker-service-env

服務環境會出現在具有 CREATING 狀態的環境清單中。當建立成功完成時,狀態會變更為 ,VALID且服務環境已準備好新增服務任務佇列,以便服務環境可以開始處理任務。