Wie funktioniert adaptives Denken Adaptives Denken mit dem Parameter Aufwand Prompt-Caching Optimierung des Denkverhaltens

Adaptives Denken

Adaptives Denken ist die empfohlene Methode Erweitertes Denken für Claude Opus 4.6. Anstatt manuell ein Budget für Denkmuster festzulegen, ermöglicht adaptives Denken anhand der Komplexität der einzelnen Anfragen Claude dynamisch zu entscheiden, wann und wie viel nachgedacht werden soll. Adaptives Denken führt zuverlässig zu einer besseren Leistung als erweitertes Denken mit einer festen Einstellungbudget_tokens, und wir empfehlen, zu adaptivem Denken überzugehen, um die intelligentesten Antworten aus Claude Opus 4.6 zu erhalten. Es ist kein Beta-Header erforderlich.

Es werde folgende Modelle unterstützt:

Modell	Modell-ID
Claude Opus4.6	`anthropic.claude-opus-4-6-v1`
Claude Sonett 4,6	`anthropic.claude-sonnet-4-6`

Anmerkung

thinking.type: "enabled"und budget_tokens sind in Version Claude Opus 4.6 veraltet und werden in einer future Modellversion entfernt. Verwenden Sie es thinking.type: "adaptive" stattdessen mit dem Effort-Parameter.

Ältere Modelle (Claude Sonnet 4.5, Claude Opus 4.5 usw.) unterstützen adaptives Denken nicht und erfordern thinking.type: "enabled" mitbudget_tokens.

Wie funktioniert adaptives Denken

Im adaptiven Modus Claude wird die Komplexität jeder Anfrage bewertet und entschieden, ob und wie viel darüber nachgedacht werden soll. Auf der Standardaufwandsebene (high) denkt er fast immer nach. Claude Bei niedrigerem Aufwand überspringt er Claude möglicherweise das Denken für einfachere Probleme.

Adaptives Denken ermöglicht dies auch automatischVerschachteltes Denken (Beta). Das bedeutet, dass es zwischen den einzelnen Toolaufrufen denken Claude kann, was es besonders effektiv für die Arbeitsabläufe von Agenturen macht.

Stellen Sie "adaptive" in thinking.type Ihrer API-Anfrage auf Folgendes ein:

CLI


aws bedrock-runtime invoke-model \
--model-id "us.anthropic.claude-opus-4-6-v1" \
--body '{
"anthropic_version": "bedrock-2023-05-31",
"max_tokens": 16000,
"thinking": {
"type": "adaptive"
},
"messages": [
{
"role": "user",
"content": "Three players A, B, C play a game. Each has a jar with 100 balls numbered 1-100. Simultaneously, each draws one ball. A beats B if As number > Bs number (mod 100, treating 100 as 0 for comparison). Similarly for B vs C and C vs A. The overall winner is determined by majority of pairwise wins (ties broken randomly). Is there a mixed strategy Nash equilibrium where each player draws uniformly? If not, characterize the equilibrium."
}
]
}' \
--cli-binary-format raw-in-base64-out \
output.json && cat output.json | jq '.content[] | {type, thinking: .thinking[0:200], text}'

Python


import boto3
import json

bedrock_runtime = boto3.client(
    service_name='bedrock-runtime',
    region_name='us-east-2'
)

response = bedrock_runtime.invoke_model(
    modelId="us.anthropic.claude-opus-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 16000,
        "thinking": {
            "type": "adaptive"
        },
        "messages": [{
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even."
        }]
    })
)

response_body = json.loads(response["body"].read())

for block in response_body["content"]:
    if block["type"] == "thinking":
        print(f"\nThinking: {block['thinking']}")
    elif block["type"] == "text":
        print(f"\nResponse: {block['text']}")

TypeScript


import { BedrockRuntimeClient, InvokeModelCommand } from "@aws-sdk/client-bedrock-runtime";

async function main() {
    const client = new BedrockRuntimeClient({});

    const command = new InvokeModelCommand({
        modelId: "us.anthropic.claude-opus-4-6-v1",
        body: JSON.stringify({
            anthropic_version: "bedrock-2023-05-31",
            max_tokens: 16000,
            thinking: {
                type: "adaptive"
            },
            messages: [{
                role: "user",
                content: "Explain why the sum of two even numbers is always even."
            }]
        })
    });

    const response = await client.send(command);
    const responseBody = JSON.parse(new TextDecoder().decode(response.body));

    for (const block of responseBody.content) {
        if (block.type === "thinking") {
            console.log(`\nThinking: ${block.thinking}`);
        } else if (block.type === "text") {
            console.log(`\nResponse: ${block.text}`);
        }
    }
}

main().catch(console.error);

Adaptives Denken mit dem Parameter Aufwand

Sie können adaptives Denken mit dem Leistungsparameter kombinieren, um zu bestimmen, wie viel Denken Claude bewirkt. Das Aufwandsniveau dient als Orientierungshilfe für die Verteilung Claude des Denkens:

Aufwand-Ebene	Denkverhalten
`max`	Claudedenkt immer ohne Einschränkungen in Bezug auf die Denktiefe. Claude Opusnur 4.6 — Anfragen, die `max` auf anderen Modellen verwendet werden, geben einen Fehler zurück.
`high` (Standard)	Claudedenkt immer. Bietet fundierte Überlegungen zu komplexen Aufgaben.
`medium`	Claudeverwendet gemäßigtes Denken. Kann bei sehr einfachen Fragen das Nachdenken überspringen.
`low`	Claudeminimiert das Denken. Überspringt das Denken bei einfachen Aufgaben, bei denen Geschwindigkeit am wichtigsten ist.

Prompt-Caching

Aufeinanderfolgende Anfragen, bei denen adaptive Thinking verwendet wird, behalten die Zwischenspeicher-Haltepunkte bei. Beim Umschalten zwischen den disabled Denkmodi adaptive undenabled/werden jedoch die Cache-Breakpoints für Nachrichten unterbrochen. Systemaufforderungen und Werkzeugdefinitionen bleiben unabhängig von Modusänderungen zwischengespeichert.

Optimierung des Denkverhaltens

Wenn Claude Sie mehr oder weniger häufig denken, als Sie möchten, können Sie Ihrer Systemaufforderung eine Anleitung hinzufügen:


Extended thinking adds latency and should only be used when it
will meaningfully improve answer quality — typically for problems
that require multi-step reasoning. When in doubt, respond directly.

Warnung

Wenn Sie weniger häufig nachdenken, kann dies Claude zu Qualitätseinbußen bei Aufgaben führen, für die Argumentation von Vorteil ist. Messen Sie die Auswirkungen auf Ihre spezifischen Workloads, bevor Sie das Prompt-basierte Tuning in der Produktion einsetzen. Erwägen Sie, zunächst mit geringerem Aufwand zu testen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Erweitertes Denken

Verschlüsselung beim Denken