通过增强微调来微调 Amazon Nova 型号 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

通过增强微调来微调 Amazon Nova 型号

在微调之前,请确保您具备先决条件,因为 Amazon Bedrock 需要特定的权限才能创建和管理微调流程。有关全面的安全和权限信息,请参阅Amazon Nova 机型的访问和安全

通过 5 个步骤对 Amazon Nova 型号进行强化微调:

  1. 提供训练数据集-上传所需格式(例如 JSONL)的提示作为强化微调训练数据集。有关更多信息,请参阅 为 Amazon Nova 机型准备数据

  2. 配置奖励功能(评分器)-定义评分者以根据正确性、结构、语气或其他目标对模型响应进行评分。可以使用 Lambda 执行奖励函数来计算客观分数。您还可以选择模型作为评判(通过控制台),并根据您配置的标准和原则对响应进行评分(控制台会自动将其转换为 Lambda 函数)。有关更多信息,请参阅 为 Amazon Nova 机型设置奖励功能

  3. 提交钢筋微调作业 — 通过指定基础模型、数据集、奖励函数和其他可选设置(例如超参数)来启动钢筋微调作业。有关更多信息,请参阅 为 Amazon Nova 机型创建和管理微调任务

  4. 监控培训-跟踪工作状态、奖励指标和培训进度,直到完成。有关更多信息,请参阅 监控您的 RFT 训练作业

  5. 使用微调模型 — 任务完成后,只需单击一下即可部署生成的 RFT 模型以进行按需推理。您也可以将预配置吞吐量用于需要一致性能的任务关键型工作负载。请参阅为自定义模型设置推理。使用 Playg round 中的测试来评估响应并将其与基础模型进行比较。

重要

您最多可以向 Amazon Bedrock 提供 2 万条提示,用于对模型进行加固微调。

支持的新星型号

下表显示了您可以通过钢筋微调进行自定义的 Amazon Nova 型号:

注意

有关其他支持的型号(包括开放式重量型号)的信息,请参阅使用兼容功能微调开放式重量模型 OpenAI APIs

支持钢筋微调的模型
Provider 模型 模型 ID 支持单区域模型
Amazon 新星 2 精简版 amazon.nova-2-lite-v 1:0:256 k us-east-1