翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
アダプティブシンキング
適応的思考は、 を 4.6 Claude Opus 拡張思考で使用するための推奨方法です。アダプティブシンキングでは、シンキングトークンの予算を手動で設定する代わりに、各リクエストの複雑さに基づいて、考えるタイミングと量をClaude動的に決定できます。アダプティブシンキングはbudget_tokens、固定 を使用した拡張シンキングよりも確実にパフォーマンスを向上させます。4.6 Claude Opus から最もインテリジェントなレスポンスを得るために、アダプティブシンキングに移行することをお勧めします。ベータヘッダーは必要ありません。
サポートされているモデルは次のとおりです。
| モデル | モデル ID |
|---|---|
Claude Opus 4.6 |
|
Claude Sonnet 4.6 |
|
注記
thinking.type: "enabled" と budget_tokensは 4Claude Opus.6 で廃止され、今後のモデルリリースで削除されます。代わりに、エフォートパラメータthinking.type: "adaptive"で を使用します。
古いモデル (Claude Sonnet 4.5、4.5 など) Claude Opus は適応的思考をサポートしておらず、 thinking.type: "enabled"で が必要ですbudget_tokens。
適応的思考の仕組み
アダプティブモードでは、 は各リクエストの複雑さClaudeを評価し、考えるかどうか、どの程度考えるかを決定します。デフォルトのエフォートレベル (high) では、 Claude はほとんどの場合考えます。労力レベルが低い場合、 Claudeはより単純な問題に対する思考をスキップする可能性があります。
アダプティブシンキングでは、 も自動的に有効になりますインターリーブ思考 (ベータ版)。つまり、 Claudeはツール呼び出し間で考えることができるため、エージェントワークフローに特に効果的です。
API リクエスト"adaptive"で thinking.typeを に設定します。
エフォートパラメータを使用した適応的思考
適応的思考と労力パラメータを組み合わせて、思考の量を導くことができますClaude。労力レベルは、 Claudeの思考割り当てのソフトガイダンスとして機能します。
| 労力レベル | 思考動作 |
|---|---|
max |
Claude は常に思考深度に制約を課さずに思考します。 Claude Opus 4.6 のみ — 他のモデルmaxで を使用するリクエストはエラーを返します。 |
high (デフォルト) |
Claude は常に考えます。複雑なタスクに関する深い推論を提供します。 |
medium |
Claude は中程度の思考を使用します。非常に単純なクエリの思考をスキップすることがあります。 |
low |
Claude は思考を最小限に抑えます。速度が最も重要である単純なタスクの思考をスキップします。 |
Converse API での適応的思考の使用
Converse API を使用する場合は、 thinking および effortパラメータを 内に渡しますadditionalModelRequestFields。次の例は、デフォルトの労力レベルでの適応的思考を示しています。
import boto3, json bedrock_runtime = boto3.client(service_name='bedrock-runtime', region_name='us-east-2') response = bedrock_runtime.converse( modelId="us.anthropic.claude-opus-4-6-v1", messages=[{ "role": "user", "content": [{"text": "Explain why the sum of two even numbers is always even."}] }], additionalModelRequestFields={ "thinking": { "type": "adaptive" } } ) print(json.dumps(response["output"], indent=2, default=str))
エフォートレベルを指定するには、 thinking オブジェクト内に effortフィールドを追加します。
response = bedrock_runtime.converse( modelId="us.anthropic.claude-opus-4-6-v1", messages=[{ "role": "user", "content": [{"text": "What is 2 + 2?"}] }], additionalModelRequestFields={ "thinking": { "type": "adaptive", "effort": "low" } } )
プロンプトキャッシュ
adaptive 思考を使用した連続リクエストは、プロンプトキャッシュのブレークポイントを保持します。ただし、 と enabled/disabled 思考モードを切り替えるadaptiveと、メッセージのキャッシュブレークポイントが壊れます。モードの変更に関係なく、システムプロンプトとツール定義はキャッシュされたままになります。
思考動作の調整
Claude が目的よりも頻繁に考えている場合は、システムプロンプトにガイダンスを追加できます。
Extended thinking adds latency and should only be used when it will meaningfully improve answer quality — typically for problems that require multi-step reasoning. When in doubt, respond directly.
警告
より少ない頻度で考えるClaudeようにステアリングすると、推論の恩恵を受けるタスクの品質が低下する可能性があります。プロンプトベースのチューニングを本番環境にデプロイする前に、特定のワークロードへの影響を測定します。まず、労力レベルを低くしてテストすることを検討してください。