

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 特殊注意事项
<a name="sagemaker-eks-checkpointless-considerations"></a>

我们收集某些常规汇总和匿名的运营指标，以提供基本的服务可用性。这些指标的创建是完全自动化的，不需要对底层模型训练工作负载进行人工审查。这些指标与作业操作、资源管理和基本服务功能有关。

HyperPod 托管分层检查点和弹性训练：请注意， HyperPod 无检查点训练目前与 HyperPod托管分层检查点和弹性训练不兼容。

提供了 GPT OSS 120B 和 Llama 模型的无检查点训练配方，以简化入门。这些配方已在 ml.p5 实例上进行了验证。使用其他实例类型可能需要对底层配方进行额外修改。这些配方也可以适应完整的微调工作流程。对于自定义模型，我们建议您查看[入门示例](https://docs.aws.amazon.com/sagemaker-eks-checkpointless-recipes-custom)。