本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在中创建服务环境 AWS Batch
您需要先创建一个服务环境 AWS Batch,然后才能在中运行 SageMaker 训练作业。您可以创建包含与 SageMaker AI 服务集成所需的配置参数 AWS Batch 的服务环境,并代表您提交 SageMaker 训练作业。
先决条件
在创建服务环境之前,请确保:
-
IAM 权限 — 创建和管理服务环境的权限。有关更多信息,请参阅 AWS Batch IAM 策略、角色和权限。
- Create a service environment (AWS Console)
-
使用 AWS Batch 控制台通过 Web 界面创建服务环境。
创建服务环境
-
打开 AWS Batch 控制台,网址为https://console.aws.amazon.com/batch/
。 -
在导航窗格中,选择环境。
-
选择创建环境,选择服务环境。
-
对于服务环境配置,请选择 SageMaker AI。
-
在名称中,为您的服务环境输入一个唯一的名称。有效字符为 a-z、A-Z、0-9、连字符 (-) 和下划线 (_)。
-
在 “最大实例数” 中,输入并发训练实例的最大数量
-
(可选)通过选择添加标签并输入键值对来添加标签。
-
选择下一步。
-
查看新服务环境的详细信息,然后选择创建服务环境。
-
- Create a service environment (AWS CLI)
-
使用
create-service-environment
命令 AWS 通过 CLI 创建服务环境。创建服务环境
-
使用基本必需参数创建服务环境:
aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10
-
(可选)使用标签创建服务环境:
aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10 \ --tags team=data-science,project=ml-training
-
验证服务环境是否已成功创建:
aws batch describe-service-environments \ --service-environment my-sagemaker-service-env
服务环境以
CREATING
状态显示在 “环境” 列表中。成功完成创建后,状态将更改为,VALID
并且服务环境已准备好向其添加服务作业队列,这样服务环境就可以开始处理作业了。 -
服务环境状态定义
更新服务环境