本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 AWS Batch中创建服务环境
您需要先创建一个服务环境 AWS Batch,然后才能在中运行 SageMaker 训练作业。您可以创建包含与 SageMaker AI 服务集成所需的配置参数 AWS Batch 的服务环境,并代表您提交 SageMaker 训练作业。
先决条件
在创建服务环境之前,请确保您已满足下列前提条件:
-
IAM 权限:创建和管理服务环境的权限。有关更多信息,请参阅 AWS Batch IAM 策略、角色和权限。
- Create a service environment (AWS Console)
-
使用 AWS Batch 控制台通过 Web 界面创建服务环境。
创建服务环境
-
打开 AWS Batch 控制台,网址为https://console.aws.amazon.com/batch/
。 -
在导航窗格中,选择环境。
-
选择创建环境,然后选择服务环境。
-
对于服务环境配置,请选择 SageMaker AI。
-
对于名称,为您的服务环境输入一个唯一的名称。有效字符为 a-z、A-Z、0-9、连字符(-)和下划线(_)。
-
对于最大实例数,请输入并发训练实例的最大数量
-
(可选)要添加标签,请选择添加标签并输入键值对。
-
选择下一步。
-
检查新服务环境的详细信息,然后选择创建服务环境。
-
- Create a service environment (AWS CLI)
-
使用
create-service-environment命令 AWS 通过 CLI 创建服务环境。创建服务环境
-
创建具有基本必需参数的服务环境:
aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10 -
(可选)创建带标签的服务环境:
aws batch create-service-environment \ --service-environment-name my-sagemaker-service-env \ --service-environment-type SAGEMAKER_TRAINING \ --capacity-limits capacityUnit=NUM_INSTANCES,maxCapacity=10 \ --tags team=data-science,project=ml-training -
验证服务环境是否已成功创建:
aws batch describe-service-environments \ --service-environment my-sagemaker-service-env
服务环境在“环境”列表中显示为
CREATING状态。成功完成创建后,服务环境的状态将变为VALID并准备就绪,可以向其添加服务作业队列,从而可以开始处理作业。 -
服务环境状态定义
更新服务环境