持续预训练 (CPT)

持续预训练（CPT）是一种训练技术，它通过将基础模型暴露于来自特定领域或语料库的其他未标记文本来扩展基础模型的预训练阶段。与需要标记输入输出对的监督微调不同，CPT在原始文档上进行训练，以帮助模型更深入地了解新领域，学习特定领域的术语和写作模式，并适应特定的内容类型或主题领域。

当您拥有大量（数百亿个代币）特定领域的文本数据（例如法律文档、医学文献、技术文档或专有业务内容），并且您希望模型在该领域具有原生流畅性时，这种方法特别有价值。通常，在 CPT 阶段之后，模型需要经过额外的指令调整阶段，以使模型能够使用新获得的知识并完成有用的任务。

CPT 适用于以下 Amazon Nova 型号：

Amazon Nova 系列机型提供多个性价比操作点，可在精度、速度和成本之间进行优化。

当你需要以下内容时，请选择 Nova 2.0：

如果符合以下条件，请选择 Nova 1.0：

较大的型号并不总是更好。在 Nova 1.0 和 Nova 2.0 机型之间进行选择时，请考虑性价比和您的具体业务需求。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

训练

Nova 1.0 上的 CPT