教師ありファインチューニング (SFT)
SFT トレーニングプロセスは、主に 2 つのステージで構成されます。
-
データ準備: 確立されたガイドラインに従って、データセットを作成、クリーンアップ、または必要な構造に再フォーマットします。入力、出力、補助情報 (推論トレースやメタデータなど) が適切に整列され、フォーマットされていることを確認します。
-
トレーニング設定: モデルのトレーニング方法を定義します。使用する場合、この設定は以下を含む YAML レシピファイルに書き込まれます。
-
データソースパス (トレーニングデータセットと検証データセット)
-
主要なハイパーパラメータ (エポック、学習レート、バッチサイズ)
-
オプションのコンポーネント (分散トレーニングパラメータなど)
-
Nova モデルの比較と選択
Amazon Nova 2.0 は、Amazon Nova 1.0 よりも大規模で多様なデータセットでトレーニングされたモデルです。主要な改善点は以下のとおりです。
-
明示的な推論モードのサポートによる推論機能の強化
-
追加言語での多言語パフォーマンスの向上
-
コーディングやツールの使用を含む複雑なタスクのパフォーマンスの向上
-
コンテキスト長が長くても精度と安定性が向上する拡張コンテキスト処理
Nova 1.0 または Nova 2.0 を使用する場合
以下の場合は、Amazon Nova 1.0 を選択します。
-
高度な推論を必要とせず、標準的な言語理解で十分なユースケースである場合
-
パフォーマンスを Amazon Nova 1.0 で既に検証していて、追加の機能を必要を必要としない場合