翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
モデル推論を使用してモデルのレスポンスを強化する
基盤モデルによっては、モデル推論を実行できます。モデル推論では、より大規模で複雑なタスクを、より小規模でシンプルなステップに分割できます。このプロセスは多くの場合、思考の連鎖 (CoT) 推論と呼ばれます。思考の連鎖推論は、モデルが応答する前に考察する機会を与えることで、モデルの正解率が向上することがよくあります。モデル推論は、マルチステップ分析、数値問題、複雑な推論タスクなどにおいて最も有用です。
例えば、数学的な単語問題を解く場合、モデルはまず関連する変数を特定したら、与えられた情報に基づいて方程式を構築し、最後にそれらの方程式を解いて解決できます。このような戦略の場合、エラーを最小限に抑えるのみでなく、推論プロセスをより明確化して理解しやすくするため、基盤モデルの品質向上につながります。
モデルの推論はすべてのタスクに必要であるとは限らず、レイテンシーの増大や出力トークン数の増加など、追加のオーバーヘッドを伴います。追加の説明を必要としないシンプルなタスクは、CoT 推論に適していません。
モデルによっては、モデルの推論に割り当てられる出力トークン数を設定できるわけではないことに注意が必要です。
モデル推論は、次のモデルで使用できます。
| 基盤モデル | モデル ID | トークンの数 | 推論設定 |
|---|---|---|---|
| Anthropic Claude Opus 4 | anthropic.claude-opus-4-20250514-v1:0 | このモデルには 32,768 個のトークンがあり、出力トークンと推論トークンの両方が含まれます。 | このモデルでは、設定可能なトークン予算を使用して、推論を有効または無効にすることができます。デフォルトでは、推論は無効になっています。 |
| Anthropic Claude Sonnet 4 | anthropic.claude-sonnet-4-20250514-v1:0 | このモデルには 65,536 個のトークンがあり、出力トークンと推論トークンの両方が含まれます。 | このモデルでは、設定可能なトークン予算を使用して、推論を有効または無効にすることができます。デフォルトでは、推論は無効になっています。 |
| Anthropic Claude 3.7 Sonnet | anthropic.claude-3-7-sonnet-20250219-v1:0 | このモデルには 65,536 個のトークンがあり、出力トークンと推論トークンの両方が含まれます。 | このモデルでは、設定可能なトークン予算を使用して、推論を有効または無効にすることができます。デフォルトでは、推論は無効になっています。 |
| DeepSeek DeepSeek-R1 | deepseek.r1-v1:0 | このモデルには 8,192 個のトークンがあり、出力トークンと推論トークンの両方が含まれます。思考トークンの数は設定できません。出力トークンの最大数は 8192 以下にする必要があります。 | このモデルでは、推論は常に有効になっています。このモデルは、推論機能のオンとオフの切り替えをサポートしていません。 |