监督式微调（SFT）

SFT 训练流程主要包含两个阶段：

数据准备：遵循既定指南，创建、清理或重新格式化数据集，使其符合所需结构。确保输入、输出和辅助信息（例如推理轨迹或元数据）正确对齐和格式化。
训练配置：定义模型的训练方式。使用时，此配置是在 YAML 配方文件中编写的，包括：
- 数据来源路径（训练和验证数据集）
- 关键超参数（epoch、学习率、批次大小）
- 可选组件（分布式训练参数等）

Nova 模型对比与选型

Amazon Nova 2.0 模型的训练数据集比 Nova 1.0 模型规模更大、种类更丰富。重要改进包括：

满足以下条件时，建议选择 Amazon Nova 1.0：

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

微调

Nova 1.0 上的 SFT