トレーニングデータの形式と要件ファイル API 効果的なトレーニングデータの特徴その他のプロパティ

オープンウェイトモデルのデータを準備する

OpenAI 互換 APIs を使用して強化ファインチューニングを使用してオープンウェイトモデルをファインチューニングする場合は、目的を使用して独自のプロンプトを JSONL 形式で取得してトレーニングデータを提供しますfine-tune。

トレーニングデータの形式と要件

トレーニングデータは、100-20K000 の例を含む OpenAI チャット完了形式に従う必要があります。各トレーニングの例は次のとおりです。

messages: このフィールドには、モデルに提供される入力プロンプトを含むユーザー、システム、またはアシスタントロールを含めます。
reference_answer: このフィールドには、報酬関数がモデルのレスポンスをスコアリングするために使用する期待される出力または評価基準が含まれている必要があります。これは構造化された出力に限定されず、報酬関数が品質を評価するのに役立つ任意の形式を含めることができます。
[オプション] グレーダー Lambda がグレーディングに使用するフィールドを追加できます。

要件:

OpenAI チャット完了形式のプロンプトを含む JSONL 形式 (1 行あたり 1 つのプロンプト)
目的はに設定する必要があります fine-tune
トレーニングデータセットに最低 100 レコード
Amazon Bedrock はトレーニングデータセットの形式を自動的に検証します

ファイル API

OpenAI 互換ファイル API を使用して、ファインチューニングジョブのトレーニングデータをアップロードできます。ファイルは Amazon Bedrock に安全に保存され、ファインチューニングジョブを作成するときに使用されます。API の詳細については、OpenAIファイルドキュメントを参照してください。

トレーニングファイルをアップロードするには、任意の方法のタブを選択し、ステップに従います。

特定のファイルの詳細を取得するには、任意の方法のタブを選択し、手順に従います。

アップロードしたファイルを一覧表示するには、任意の方法のタブを選択し、手順に従います。

ファイルを削除するには、任意の方法のタブを選択し、手順に従います。

効果的なトレーニングデータの特徴

効果的な RFT トレーニングデータには、次の 3 つの主要な特性が必要です。

明確性と一貫性 – 明確であいまいなプロンプトを一貫したフォーマットで使用します。トレーニングを誤解する矛盾するラベル、あいまいな指示、または矛盾する参照回答は避けてください。
多様性 – さまざまな入力形式、エッジケース、およびさまざまなユーザータイプやシナリオにわたる本番稼働用の使用パターンを反映する難易度レベルが含まれます。
効率的な報酬関数 – 迅速に (数分ではなく秒単位で) 実行され、と並列化され AWS Lambda、費用対効果の高いトレーニングのために一貫したスコアを返す関数を設計します。

その他のプロパティ

RFT データ形式は、コアスキーマ要件 (messages および reference_answer) を超えるカスタムフィールドをサポートします。この柔軟性により、報酬関数が適切な評価に必要な追加データを追加できます。

注記

レシピでこれを設定する必要はありません。データ形式は、本質的に追加のフィールドをサポートします。トレーニングデータ JSON に含めるだけで、metadata フィールドの報酬関数に渡されます。

その他の一般的なプロパティ

task_id – 追跡用の一意の識別子
difficulty_level – 問題の複雑さインジケータ
domain – サブジェクトエリアまたはカテゴリ
expected_reasoning_steps – ソリューションのステップ数

これらの追加フィールドは評価中に報酬関数に渡されるため、特定のユースケースに合わせた高度なスコアリングロジックが可能になります。

追加プロパティの例

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

アクセスとセキュリティ

報酬関数の設定