在中创建服务环境 AWS Batch - AWS Batch

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在中创建服务环境 AWS Batch

您需要先创建一个服务环境 AWS Batch,然后才能在中运行 SageMaker 训练作业。您可以创建包含与 SageMaker AI 服务集成所需的配置参数 AWS Batch 的服务环境,并代表您提交 SageMaker 训练作业。

先决条件

在创建服务环境之前,请确保:

Create a service environment (AWS Console)

使用 AWS Batch 控制台通过 Web 界面创建服务环境。

创建服务环境

  1. 打开 AWS Batch 控制台,网址为https://console.aws.amazon.com/batch/

  2. 在导航窗格中,选择环境

  3. 选择创建环境,选择服务环境

  4. 对于服务环境配置,请选择 SageMaker AI。

  5. 名称中,为您的服务环境输入一个唯一的名称。有效字符为 a-z、A-Z、0-9、连字符 (-) 和下划线 (_)。

  6. 在 “最大实例数” 中,输入并发训练实例的最大数量

  7. (可选)通过选择添加标签并输入键值对来添加标签。

  8. 选择下一步

  9. 查看新服务环境的详细信息,然后选择创建服务环境

Create a service environment (AWS CLI)

使用create-service-environment命令 AWS 通过 CLI 创建服务环境。

创建服务环境

  1. 使用基本必需参数创建服务环境:

    aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10
  2. (可选)使用标签创建服务环境:

    aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10 \ --tags team=data-science,project=ml-training
  3. 验证服务环境是否已成功创建:

    aws batch describe-service-environments \ --service-environment my-sagemaker-service-env

服务环境以CREATING状态显示在 “环境” 列表中。成功完成创建后,状态将更改为,VALID并且服务环境已准备好向其添加服务作业队列,这样服务环境就可以开始处理作业了。