中的服务任务有效负载 AWS Batch - AWS Batch

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

中的服务任务有效负载 AWS Batch

使用提交服务作业时 SubmitServiceJob,您需要提供两个用于定义任务的关键参数:serviceJobType、和serviceRequestPayload

  • serviceJobType指定哪个 AWS 服务将执行作业。对于 SageMaker 培训作业,此值为SAGEMAKER_TRAINING

  • serviceRequestPayload是一个 JSON 编码的字符串,其中包含通常会直接发送到目标服务的完整请求。对于 SageMaker 训练作业,此负载包含的参数与您在 SageMaker A CreateTrainingJobI API 中使用的参数相同。

有关所有可用参数及其描述的完整列表,请参阅 SageMaker A CreateTrainingJobI API 参考。支持的所有参数CreateTrainingJob都可以包含在您的服务任务负载中。

有关更多训练作业配置的示例 APIs,请参阅 CLI 和 SDKs SageMaker AI 开发者指南

我们建议使用 PySDK 创建服务作业,因为 pySDK 有帮助类和实用程序。有关使用 pySDK 的示例,请参阅上的 SageMaker AI 示例。 GitHub

服务任务负载示例

以下示例显示了运行 “hello world” SageMaker 训练脚本的训练作业的简单服务作业负载:

调用时,此有效负载将作为 JSON 字符串传递给serviceRequestPayload参数SubmitServiceJob

{ "TrainingJobName": "my-simple-training-job", "RoleArn": "arn:aws:iam::123456789012:role/SageMakerExecutionRole", "AlgorithmSpecification": { "TrainingInputMode": "File", "TrainingImage": "763104351884.dkr.ecr.us-west-2.amazonaws.com/pytorch-training:2.0.0-cpu-py310", "ContainerEntrypoint": [ "echo", "hello world" ] }, "ResourceConfig": { "InstanceType": "ml.c5.xlarge", "InstanceCount": 1, "VolumeSizeInGB": 1 }, "OutputDataConfig": { "S3OutputPath": "s3://your-output-bucket/output" }, "StoppingCondition": { "MaxRuntimeInSeconds": 30 } }