Fine-tune 带有加固微调功能的 Amazon Nova 型号

在微调之前，请确保您具备先决条件，因为 Amazon Bedrock 需要特定的权限才能创建和管理微调流程。有关全面的安全和权限信息，请参阅Amazon Nova 机型的访问和安全。

通过 5 个步骤对 Amazon Nova 型号进行强化微调：

提供训练数据集-上传所需格式（例如 JSONL）的提示作为强化微调训练数据集。有关更多信息，请参阅为 Amazon Nova 机型准备数据。
配置奖励功能（评分器）-定义评分者以根据正确性、结构、语气或其他目标对模型响应进行评分。可以使用 Lambda 执行奖励函数来计算客观分数。您还可以选择模型作为评判（通过控制台），并根据您配置的标准和原则对响应进行评分（控制台会自动将其转换为 Lambda 函数）。有关更多信息，请参阅为 Amazon Nova 机型设置奖励功能。
提交钢筋微调作业 — 通过指定基础模型、数据集、奖励函数和其他可选设置（例如超参数）来启动钢筋微调作业。有关更多信息，请参阅为 Amazon Nova 机型创建和管理微调任务。
监控培训-跟踪工作状态、奖励指标和培训进度，直到完成。有关更多信息，请参阅监控您的 RFT 训练作业。
使用 Fine-Tuned 模型-任务完成后，只需单击一下即可部署生成的 RFT 模型以进行按需推理。您也可以将预配置吞吐量用于需要一致性能的任务关键型工作负载。请参阅为自定义模型设置推理。使用 Playg round 中的测试来评估响应并将其与基础模型进行比较。

您最多可以向 Amazon Bedrock 提供 2 万条提示，用于对模型进行加固微调。

支持的新星型号

下表显示了您可以通过钢筋微调进行自定义的 Amazon Nova 型号：

有关其他支持的型号（包括开放式重量型号）的信息，请参阅Fine-tune 开放式重量模型使用 OpenAI-兼容的 API。

支持钢筋微调的模型
Provider	模型	模型 ID	Single-region 模型支持
Amazon	Nova 2 Lite	amazon.nova-2-lite-v1:0:256k	us-east-1

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

强化微调

访问和安全