View a markdown version of this page

培训计划延期 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

培训计划延期

SageMaker 培训计划允许您延长现有的培训计划,以避免工作量中断。当训练计划即将到期时,您可以直接通过 SageMaker AI 控制台延长该计划,也可以使用 API 或 AWS CLI以编程方式延长该计划。这样就无需创建新计划和使用新的训练计划 ARN 重新配置工作负荷。

通过延长训练计划,计划延长后,您的正在运行的 SageMaker 训练作业或 SageMaker HyperPod 集群可以继续无缝运行,而不会中断。延期计划反映了新的结束日期,您可以检索训练计划中所有延期的历史记录。

重要

请注意,不能取消或修改扩展以添加或删除实例。

主要 功能

  • 通过控制台或 API 扩展训练计划

  • 以 1 天为增量延长计划,最多 14 天,或以 7 天为增量延长计划,最多 182 天

  • 将计划延长任意次数

  • 在控制台中或通过 API 查看/列出训练计划的延期历史记录

  • 无需重新配置即可在 SageMaker AI 中无缝继续运行工作负载

先决条件

在延长培训计划之前,请确保以下几点:

  • 培训计划的状态必须为ActiveScheduled

  • 该计划的Payment Pending状态不得有任何延期。

  • 计划到期前最少 1 小时或最多 56 天可以申请延期。