翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
トレーニングデータセットと検証データセットのモデル要件
以下のセクションでは、モデルのトレーニングデータセットと検証データセットの要件を一覧表示します。Amazon Nova モデルのデータセット制約の詳細については、Amazon Nova「モデルの微調整」を参照してください。
| 説明 | 最大値 (ファインチューニング) |
|---|---|
| バッチサイズが 1 の場合の入力トークンと出力トークンの合計 | 4,096 |
| バッチサイズが 2、3 または 4 の場合の入力トークンと出力トークンの合計 | 該当なし |
| データセット内のサンプルあたりの文字数クォータ | トークンクォータ x 6 (推定) |
| トレーニングデータセットのファイルサイズ | 1 GB |
| 検証データセットのファイルサイズ | 100 MB |
| 説明 | 最大値 (継続的な事前トレーニング) | 最大値 (ファインチューニング) |
|---|---|---|
| バッチサイズが 1 の場合の入力トークンと出力トークンの合計 | 4,096 | 4,096 |
| バッチサイズが 2、3 または 4 の場合の入力トークンと出力トークンの合計 | 2,048 | 2,048 |
| データセット内のサンプルあたりの文字数クォータ | トークンクォータ x 6 (推定) | トークンクォータ x 6 (推定) |
| トレーニングデータセットのファイルサイズ | 10 GB | 1 GB |
| 検証データセットのファイルサイズ | 100 MB | 100 MB |
| 説明 | 最大値 (継続的な事前トレーニング) | 最大値 (ファインチューニング) |
|---|---|---|
| バッチサイズが 1 または 2 の場合の入力トークンと出力トークンの合計 | 4,096 | 4,096 |
| バッチサイズが 3、4、5 または 6 の場合の入力トークンと出力トークンの合計 | 2,048 | 2,048 |
| データセット内のサンプルあたりの文字数クォータ | トークンクォータ x 6 (推定) | トークンクォータ x 6 (推定) |
| トレーニングデータセットのファイルサイズ | 10 GB | 1 GB |
| 検証データセットのファイルサイズ | 100 MB | 100 MB |
| 説明 | 最小 (ファインチューニング) | 最大値 (ファインチューニング) |
|---|---|---|
| トレーニングサンプルの文字単位のテキストプロンプトの長さ | 3 | 1,024 |
| トレーニングデータセット内のレコード | 5 | 10,000 |
| 入力イメージサイズ | 0 | 50 MB |
| 入力イメージのピクセル単位の高さ | 512 | 4,096 |
| 入力イメージのピクセル単位の幅 | 512 | 4,096 |
| 入力イメージのピクセル総数 | 0 | 12,582,912 |
| 入力イメージのアスペクト比 | 1:4 | 4:1 |
| 説明 | 最小 (ファインチューニング) | 最大値 (ファインチューニング) |
|---|---|---|
| トレーニングサンプルの文字単位のテキストプロンプトの長さ | 0 | 2,560 |
| トレーニングデータセット内のレコード | 1,000 | 500,000 |
| 入力イメージサイズ | 0 | 5 MB |
| 入力イメージのピクセル単位の高さ | 128 | 4096 |
| 入力イメージのピクセル単位の幅 | 128 | 4096 |
| 入力イメージのピクセル総数 | 0 | 12,528,912 |
| 入力イメージのアスペクト比 | 1:4 | 4:1 |
| 説明 | 最小 (ファインチューニング) | 最大値 (ファインチューニング) |
|---|---|---|
| 入力トークン | 0 | 16,000 |
| 出力トークン | 0 | 16,000 |
| データセット内のサンプルあたりの文字数クォータ | 0 | トークンクォータ x 6 (推定) |
| 入力トークンと出力トークンの合計 | 0 | 16,000 |
| トレーニングレコードと検証レコードの合計 | 100 | 10,000 (サービスクォータを使用して調整可能) |
Meta Llama-3.2 11B Vision Instruct および でサポートされているイメージ形式はgif、、jpeg、png、および Meta Llama-3.2 90B Vision Instructですwebp。これらのモデルの微調整中にimage-to-token変換を推定するには、次の式を近似値として使用できます: Tokens = min(2, max(Height // 560, 1)) * min(2, max(Width // 560, 1)) * 1601。イメージは、サイズに基づいて約 1,601~6,404 トークンに変換されます。
| 説明 | 最小 (ファインチューニング) | 最大値 (ファインチューニング) |
|---|---|---|
| 入力トークンと出力トークンの合計 | 0 | 16,000 ( の場合は 10,000 Meta Llama 3.2 90B) |
| トレーニングレコードと検証レコードの合計 | 100 | 10,000 (サービスクォータを使用して調整可能) |
| Meta Llama 11B and 90B instruct モデルの入力イメージサイズ) | 0 | 10 MB |
| Meta Llama 11B and 90B instruct モデルの入力イメージの高さをピクセル単位で表示 | 10 | 8192 |
| Meta Llama 11B and 90B90B instruct モデルのピクセル単位の入力イメージ幅 | 10 | 8192 |
| 説明 | 最小 (ファインチューニング) | 最大値 (ファインチューニング) |
|---|---|---|
| 入力トークンと出力トークンの合計 | 0 | 16000 |
| トレーニングレコードと検証レコードの合計 | 100 | 10,000 (Service Quotas を使用して調整可能) |
| 説明 | 最大値 (ファインチューニング) |
|---|---|
| 入力トークン | 4,096 |
| 出力トークン | 2,048 |
| データセット内のサンプルあたりの文字数クォータ | トークンクォータ x 6 (推定) |
| トレーニングデータセット内のレコード | 10,000 |
| 検証データセット内のレコード | 1,000 |
| 説明 | 最大値 (ファインチューニング) |
|---|---|
| レコードの最小数 | 32 |
| 最大トレーニングレコード | 10,000 |
| 最大検証レコード | 1,000 |
| 最大合計レコード数 | 10,000 (サービスクォータを使用して調整可能) |
| 最大トークン | 32,000 |
| トレーニングデータセットの最大サイズ | 10 GB |
| 検証データセットの最大サイズ | 1 GB |