监督式微调(Full FT、PEFT)
监督式微调 (SFT) 是指向基础模型提供一组提示-响应对的过程,用于提高预训练基础模型在特定任务中的性能。标注示例的格式为提示-回答对,措辞为指示。这个微调过程修改模型的权重。
当您拥有需要提供特定提示-响应对来获得最佳结果的特定领域数据时,应使用 SFT。全秩 SFT 和参数高效的 SFT 均可用。
有关 Amazon Nova 模型自定义使用 SFT 的详细说明,请参阅《SageMakerUser 指南》中的监督式微调(Full FT、PEFT)部分。