本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
搜索培训计划内容
要创建训练计划,首先要调用 SearchTrainingPlanOfferingsAPI 操作,将您的计划要求(例如实例类型、计数和所需的时间窗口)作为输入参数传递。培训计划是针对其目标资源的。请务必指定计划将用于哪个目标资源(training-job或hyperpod-cluster)。API 会返回符合您要求的可用产品列表。如果找不到合适的产品,则可能需要调整要求并重新搜索。
此 API 调用检索最能满足您的容量需求的培训计划产品。响应中TrainingPlanOffering返回的每一个都由一个唯一的报价 ID 进行标识。列表中的第一个产品最符合您的需求。如果在您指定的日期内没有合适的培训计划,则该列表为空。调整搜索条件并寻找一组新的产品。
-
预订时长以 1 天为增量提供,从 1 天到 182 天不等。
-
预留实例数量选项为 1、2、4、8、16、32 或 64 个实例。
要了解 SageMaker 训练计划支持的可用实例列表,请参阅支持的实例类型 AWS 区域和定价。
以下示例使用 AWS CLI 命令请求包含指定实例类型、计数和时间信息的训练计划产品。
# List training plan offerings with instance type, instance count, duration in hours, start time after, and end time before. aws sagemaker search-training-plan-offerings \ --target-resources "training-job" \ --instance-type "ml.p4d.24xlarge" \ --instance-count1\ --duration-hours15\ --start-time-after "1737484800" --end-time-before "1737657600"
此 JSON 文档是来自 SageMaker 训练计划 API 的示例响应。该响应提供了与指定容量要求相匹配的多种可用培训计划选项的信息。它包括三种不同的产品,它们的持续时间、预付费用和 start/end 时间各不相同,它们都使用相同的实例类型并针对培训作业。
{ "TrainingPlanOfferings": [ { "TrainingPlanOfferingId": "tpo-SHA-256-hash-value", "TargetResources": [ "training-job" ], "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00", "DurationHours": 15, "DurationMinutes": 51, "UpfrontFee": "xxxx.xx", "CurrencyCode": "USD", "ReservedCapacityOfferings": [ { "InstanceType": "ml.p4d.24xlarge", "InstanceCount": 1, "AvailabilityZone": "us-west-2a", "DurationHours": 15, "DurationMinutes": 51, "StartTime": "2025-01-21T11:39:00-08:00", "EndTime": "2025-01-22T03:30:00-08:00" } ] }, { "TrainingPlanOfferingId": "tpo-SHA-256-hash-value", "TargetResources": [ "training-job" ], "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00", "DurationHours": 39, "DurationMinutes": 51, "UpfrontFee": "xxxx.xx", "CurrencyCode": "USD", "ReservedCapacityOfferings": [ { "InstanceType": "ml.p4d.24xlarge", "InstanceCount": 1, "AvailabilityZone": "us-west-2a", "DurationHours": 39, "DurationMinutes": 51, "StartTime": "2025-01-21T11:39:00-08:00", "EndTime": "2025-01-23T03:30:00-08:00" } ] }, { "TrainingPlanOfferingId": "tpo-SHA-256-hash-value", "TargetResources": [ "training-job" ], "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00", "DurationHours": 24, "DurationMinutes": 0, "UpfrontFee": "xxxx.xx", "CurrencyCode": "USD", "ReservedCapacityOfferings": [ { "InstanceType": "ml.p4d.24xlarge", "InstanceCount": 1, "AvailabilityZone": "us-west-2a", "DurationHours": 24, "DurationMinutes": 0, "StartTime": "2025-01-22T03:30:00-08:00", "EndTime": "2025-01-23T03:30:00-08:00" } ] } ] }
以下是如何使用 AWS CLI 来搜索包含以下内容的培训计划选项的示例命令 UltraServers。
aws sagemaker search-training-plan-offerings \ --ultra-server-type ml.c6i-32xlargesc \ --ultra-server-count 1 \ --duration-hours 24 \ --target-resources hyperpod-cluster --start-time-after "1737484800" \ --end-time-before "1737657600"
{ "TrainingPlanOfferings": [ { "TrainingPlanOfferingId": "tpo-SHA-256-hash-value", "TargetResources": [ "training-job" ], "RequestedStartTimeAfter": "2025-07-21T16:59:25.760000+00:00", "DurationHours": 24, "DurationMinutes": 0, "UpfrontFee": "0.24", "CurrencyCode": "USD", "ReservedCapacityOfferings": [ { "ReservedCapacityType": "UltraServer", "UltraServerType": "ml.u-p6e-gb200x72", "UltraServerCount": 1, "InstanceType": "ml.p6e-gb200.36xlarge", "InstanceCount": 18, "AvailabilityZone": "us-east-2a", "DurationHours": 24, "DurationMinutes": 0, "StartTime": "2025-07-22T11:30:00+00:00", "EndTime": "2025-07-23T11:30:00+00:00" } ] } ] }
以下各节定义了 SearchTrainingPlanOfferings API 操作的必填和可选输入请求参数。
必需参数
在调用 SearchTrainingPlanOfferingsAPI 列出符合您要求的培训计划时,必须提供以下值:
-
TargetResources:计划将用于的目标资源(training-job或hyperpod-cluster)。默认值为training-job。培训计划是针对其目标资源的。-
专为训练作业设计的 SageMaker 训练计划只能用于安排和运行训练作业。
-
HyperPod 集群训练计划只能用于为集群的实例组提供计算资源。
-
-
InstanceType:要置备的实例类型。InstanceType必须是支持的类型。要了解 SageMaker 训练计划支持的可用实例列表,请参阅支持的实例类型 AWS 区域和定价。
-
InstanceCount:要置备的实例数量。如果实例数大于 1,则应为 2 的乘方。 -
DurationHour:您请求的套餐的总时长(以小时为单位)。四DurationHour舍五入到最接近的 24 的倍数。
可选参数
以下各节详细介绍了您可以传递给 SearchTrainingPlanOfferings API 请求的一些可选参数。
-
StartTimeAfter:指定计划的请求开始时间。将来StartTimeAfter应该是 atimestamp或 aISO 8601 date/time值。 -
EndTimeBefore:以timestamp或的ISO 8601 date/time格式指定计划的请求结束时间。EndTimeBefore应在开始时间之后至少 24 小时。 -
UltraServerType:指定 UltraServer 要搜索的类型。有关的更多信息 UltraServers,请参阅UltraServers 在 SageMaker 人工智能中。 -
UltraServerCount:指定 UltraServers 要搜索的数量。