蒸留用の教師モデルと生徒モデルを選択する
Model Distillation では、教師モデルと生徒モデルを選択します。
-
教師モデルを選択する
生徒モデルよりもかなり大規模で性能が高く、ユースケースに合わせて達成する必要がある精度の教師モデルを選択してください。蒸留の効果を高めるには、ユースケースと同様のタスクで既にトレーニングされているモデルを選択します。
一部の教師モデルでは、クロスリージョン推論プロファイル (クロスリージョン推論によりスループットを向上させる) を選択できます。クロスリージョン推論では、推論リクエストを処理するのに最適な AWS リージョンが地域内で自動的に選択されます。これにより、利用可能なリソースとモデルの可用性が最大限に高まり、カスタマーエクスペリエンスが向上します。クロスリージョン推論プロファイルを使用するには、推論プロファイルの各リージョン内のモデルのほかに、AWS リージョンで推論プロファイルを呼び出すためのアクセス許可がサービスロールに必要です。ポリシーの例については「(オプション) クロスリージョン推論プロファイルを使用して蒸留ジョブを作成するためのアクセス許可」を参照してください。
-
生徒モデルを選択する
生徒モデルには、教師モデルよりもサイズがかなり小さいモデルを選択してください。生徒モデルは、次の表で教師モデルとペアになっている生徒モデルのいずれかである必要があります。
次のセクションでは、Amazon Bedrock Model Distillation でサポートされているモデルとリージョンの一覧を示します。教師モデルと生徒モデルを選択したら、蒸留用のトレーニングデータセットを準備して最適化します。詳細については、「蒸留用トレーニングデータセットを準備する」を参照してください。
Amazon Bedrock Model Distillation でサポートされているモデルとリージョン
次の表は、Amazon Bedrock Model Distillation が教師モデルと生徒モデル用にサポートしているモデルと AWS リージョンを示しています。クロスリージョン推論プロファイルを使用する場合、モデル蒸留ではシステム推論プロファイルのみがサポートされます。詳細については、「クロスリージョン推論によりスループットを向上させる」を参照してください。
| プロバイダー | 教師 | 教師 ID | 推論プロファイルのサポート | 生徒 | 生徒 ID | リージョン |
|---|---|---|---|---|---|---|
| Amazon | Nova Pro | amazon.nova-pro-v1:0 | 両方 | Nova Lite Nova Micro |
amazon.nova-lite-v1:0:300k amazon.nova-micro-v1:0:128k |
米国東部 (バージニア北部) |
| Nova Premier | amazon.nova-premier-v1:0 | 推論プロファイルのみ | Nova Lite Nova Micro Nova Pro |
amazon.nova-lite-v1:0:300k amazon.nova-micro-v1:0:128k amazon.nova-pro-v1:0:300k |
米国東部 (バージニア北部) | |
| Anthropic | Claude 3.5 v1 | anthropic.claude-3-5-sonnet-20240620-v1:0 | 両方 | Claude 3 Haiku |
anthropic.claude-3-haiku-20240307-v1:0:200k |
米国西部 (オレゴン) |
| Claude 3.5 v2 | anthropic.claude-3-5-sonnet-20241022-v2:0 | 両方 | Claude 3 Haiku |
anthropic.claude-3-haiku-20240307-v1:0:200k |
米国西部 (オレゴン) | |
| Meta | Llama 3.1 405B | meta.llama3-1-405b-instruct-v1:0 | オンデマンド | Llama 3.1 8B Llama 3.1 70B Llama 3.2 1B Llama 3.3 70B |
meta.llama3-1-8b-instruct-v1:0:128k meta.llama3-1-70b-instruct-v1:0:128k meta.llama3-2-1b-instruct-v1:0:128k meta.llama3-3-70b-instruct-v1:0:128k |
米国西部 (オレゴン) |
| Llama 3.1 70B | meta.llama3-1-70b-instruct-v1:0 | 両方 | Llama 3.1 8B Llama 3.2 1B Llama 3.2 3B |
meta.llama3-1-8b-instruct-v1:0:128k meta.llama3-2-1b-instruct-v1:0:128k meta.llama3-2-3b-instruct-v1:0:128k |
米国西部 (オレゴン) | |
| Llama 3.3 70B | meta.llama3-3-70b-instruct-v1:0 | 推論プロファイルのみ | Llama 3.1 8B Llama 3.2 1B Llama 3.2 3B |
meta.llama3-1-8b-instruct-v1:0:128k meta.llama3-2-1b-instruct-v1:0:128k meta.llama3-2-3b-instruct-v1:0:128k |
米国西部 (オレゴン) |
注記
-
Claude および Llama モデルの場合、蒸留ジョブは米国西部 (オレゴン) で実行されます。米国西部 (オレゴン) でプロビジョンドスループットを購入することも、蒸留されたモデルを別のリージョンにコピーしてからプロビジョンドスループットを購入することもできます。
-
Nova モデルの場合、米国東部 (バージニア北部) で蒸留ジョブを実行します。推論を行うには、米国東部 (バージニア北部) でプロビジョンドスループットを購入する必要があります。Nova モデルを他のリージョンにコピーすることはできません。