Anthropic Claude 3 模型自定义超参数
Anthropic Claude 3 模型支持以下用于自定义模型的超参数。您指定的 epoch 数会处理更多词元,因而会增加模型的自定义成本。每个 epoch 对整个训练数据集进行一次处理。有关定价的信息,请参阅 Amazon Bedrock 定价
| 控制台名称 | API 名称 | 定义 | 默认值 | 最小值 | 最大值 |
|---|---|---|---|---|---|
| 周期计数 | epochCount | 整个训练数据集的最大迭代次数 | 2 | 1 | 10 |
| 批次大小 | batchSize | 更新模型参数之前处理的样本数 | 32 | 4 | 256 |
| 学习率乘数 | learningRateMultiplier | 该乘数会影响模型参数在每个批次之后更新的学习率 | 1 | 0.1 | 2 |
| 提前停止阈值 | earlyStoppingThreshold | 防止训练过程过早终止所需的最低验证损失改善 | 0.001 | 0 | 0.1 |
| 提前停止容忍度 | earlyStoppingPatience | 停止训练过程之前对验证损失指标停滞的容忍程度 | 2 | 1 | 10 |