训练数据源的要求 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

训练数据源的要求

Amazon Bedrock 支持用于强化微调训练的多个数据源。本节概述了 Bedrock API 日志和新训练数据集的要求。

注意

我们仅支持 OpenAI 聊天完成格式。

使用现有的 Bedrock API 调用日志

您可以使用客户端存储的 Amazon S3 中的 Invoke/Converse API 调用日志进行培训。

要求:

  • 必须启用 API 日志才能使用 Amazon Bedrock

  • 日志必须采用支持的格式(Amazon Bedrock Invoke/Converse API)

  • 至少 100 个提示示例

上传新的训练数据集

您可以上传 JSONL 格式的自定义数据集,也可以从 Amazon S3 中选择现有数据集。

要求:

  • JSONL 格式,提示符采用 OpenAI 聊天完成格式(每行一个提示)

  • 训练数据集中至少有 100 条记录

  • Amazon Bedrock 会自动验证训练数据集格式