Amazon Nova 理解模型自定义超参数 - Amazon Bedrock

Amazon Nova 理解模型自定义超参数

Amazon Nova Lite、Amazon Nova Micro 和 Amazon Nova Pro 模型支持以下三个用于自定义模型的超参数。有关更多信息,请参阅 针对使用案例自定义模型以提高其性能

有关微调 Amazon Nova 模型的信息,请参阅微调 Amazon Nova 模型

您指定的 epoch 数会处理更多词元,因而会增加模型的自定义成本。每个 epoch 对整个训练数据集进行一次处理。有关定价的信息,请参阅 Amazon Bedrock 定价

超参数(控制台) 超参数(API) 定义 类型 最小值 最大值 默认值
Epoch epochCount 整个训练数据集的迭代次数 整数 1 5 2
学习率 learningRate 每个批次之后模型参数的更新速率 浮点数 1.00E-6 1.00E-4 1.00E-5
学习率预热步骤 learningRateWarmupSteps 学习率逐渐提高到指定速率的迭代次数 整数 0 100 10

默认的 epoch 数为 2,适用于大多数情况。通常,较大的数据集需要较少的 epoch 就能收敛,而较小的数据集则需要较多的 epoch 才能收敛。您也可以通过提高学习率来实现更快的收敛,但这种方法不太令人满意,因为可能会导致收敛时的训练不稳定。建议从默认超参数开始,这些超参数基于我们对各种复杂程度和数据大小的任务的评估。

在预热阶段,学习率将逐渐提高到设定值。因此,在训练样本较小时,建议您避免使用过大的预热值,因为在训练过程中,学习率可能永远无法达到设定值。建议将数据集大小分别除以 640(对于 Amazon Nova Micro)、160(对于 Amazon Nova Lite)和 320(对于 Amazon Nova Pro),以此来设置预热步骤数。