RFT トレーニングジョブをモニタリングする - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

RFT トレーニングジョブをモニタリングする

強化ファインチューニング中は、Amazon Bedrock コンソールのビジュアルグラフとメトリクスを使用して、トレーニングの進行状況をリアルタイムでモニタリングできます。トレーニングメトリクスダッシュボードには、報酬スコア、損失曲線、時間の経過に伴う精度の向上など、主要なパフォーマンス指標が表示されます。これらのメトリクスは、モデルが適切に収束するかどうか、および報酬関数が学習プロセスを効果的に導くかどうかを理解するのに役立ちます。

リアルタイムのトレーニングメトリクス

Amazon Bedrock は、トレーニングと検証のメトリクスを表示するビジュアルグラフを使用して、RFT トレーニング中にリアルタイムモニタリングを提供します。

コアトレーニングメトリクス

  • トレーニング損失 - モデルがトレーニングデータからどの程度学習しているかを測定します

  • トレーニング報酬統計 - 報酬関数によって割り当てられた報酬スコアを表示します

  • 報酬マージン - 良い応答報酬と悪い応答報酬の差を測定します

  • トレーニングセットと検証セットの精度 - トレーニングデータとホールドアウトデータの両方でモデルのパフォーマンスを表示します

トレーニングの進行状況の視覚化

コンソールには、RFT ジョブの進行に合わせてリアルタイムで更新されるインタラクティブなグラフが表示されます。これらの視覚化は、以下に役立ちます。

  • 最適なパフォーマンスへの収束を追跡する

  • 潜在的なトレーニング問題を早期に特定する

  • 最適な停止ポイントを決定する

  • 異なるエポック間でパフォーマンスを比較する

ジョブステータスの追跡

Amazon Bedrock コンソールを使用して RFT ジョブのステータスをモニタリングします。

ジョブフェーズ:

  1. 検証

  2. トレーニング

完了インジケータ:

  • トレーニングが正常に完了すると、ジョブのステータスは完了に変わります

  • カスタムモデル ARN がデプロイ可能になる

  • トレーニングメトリクスが収束しきい値に達する