As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Pensamento adaptativo
O pensamento adaptativo é a forma recomendada de usar Raciocínio estendido com o Claude Opus 4.6. Em vez de definir manualmente um orçamento simbólico, o pensamento adaptativo permite decidir Claude dinamicamente quando e quanto pensar com base na complexidade de cada solicitação. O pensamento adaptativo gera um desempenho melhor de forma confiável do que o pensamento estendido com um pensamento fixobudget_tokens, e recomendamos mudar para o pensamento adaptativo para obter as respostas mais inteligentes do 4.6. Claude Opus Nenhum cabeçalho beta é necessário.
Os modelos compatíveis são os seguintes:
| Modelo | ID do modelo |
|---|---|
Claude Opus4.6 |
|
Soneto de Claude 4.6 |
|
nota
thinking.type: "enabled"e budget_tokens estão obsoletos na versão Claude Opus 4.6 e serão removidos em uma versão futura do modelo. Em vez disso, use thinking.type: "adaptive" com o parâmetro de esforço.
Modelos mais antigos (Claude Sonnet 4.5, Claude Opus 4.5, etc.) não suportam o pensamento adaptativo e exigemthinking.type: "enabled". budget_tokens
Como funciona o pensamento adaptativo
No modo adaptativo, Claude avalia a complexidade de cada solicitação e decide se e em quanto pensar. No nível de esforço padrão (high), quase sempre Claude pensará. Em níveis mais baixos de esforço, Claude pode deixar de pensar em problemas mais simples.
O pensamento adaptativo também é ativado automaticamente. Raciocínio intercalado (beta) Isso significa que Claude pode pensar entre chamadas de ferramentas, tornando-a especialmente eficaz para fluxos de trabalho agentes.
thinking.typeDefina como "adaptive" na sua solicitação de API:
Pensamento adaptativo com o parâmetro de esforço
Você pode combinar o pensamento adaptativo com o parâmetro de esforço para orientar o quanto Claude o pensamento faz. O nível de esforço atua como uma orientação suave para a alocação Claude do pensamento:
| Nível de esforço | Comportamento de pensamento |
|---|---|
max |
Claudesempre pensa sem restrições na profundidade do pensamento. Claude OpusSomente 4.6 — solicitações usadas max em outros modelos retornarão um erro. |
high (padrão) |
Claudesempre pensa. Fornece um raciocínio profundo sobre tarefas complexas. |
medium |
Claudeusa pensamento moderado. Pode deixar de pensar em perguntas muito simples. |
low |
Claudeminimiza o pensamento. Pare de pensar em tarefas simples, nas quais a velocidade é mais importante. |
Usando o pensamento adaptativo com a API Converse
Ao usar a API Converse, passe os effort parâmetros thinking e para dentroadditionalModelRequestFields. O exemplo a seguir mostra o pensamento adaptativo com o nível de esforço padrão:
import boto3, json bedrock_runtime = boto3.client(service_name='bedrock-runtime', region_name='us-east-2') response = bedrock_runtime.converse( modelId="us.anthropic.claude-opus-4-6-v1", messages=[{ "role": "user", "content": [{"text": "Explain why the sum of two even numbers is always even."}] }], additionalModelRequestFields={ "thinking": { "type": "adaptive" } } ) print(json.dumps(response["output"], indent=2, default=str))
Para especificar um nível de esforço, adicione o effort campo dentro do thinking objeto:
response = bedrock_runtime.converse( modelId="us.anthropic.claude-opus-4-6-v1", messages=[{ "role": "user", "content": [{"text": "What is 2 + 2?"}] }], additionalModelRequestFields={ "thinking": { "type": "adaptive", "effort": "low" } } )
Armazenamento em cache de prompts
Solicitações consecutivas usando o adaptive thinking preservam pontos de interrupção imediatos do cache. No entanto, alternar entre adaptive os modos enabled disabled e/thinking interrompe os pontos de interrupção do cache das mensagens. Os prompts do sistema e as definições de ferramentas permanecem em cache, independentemente das alterações de modo.
Ajustando o comportamento de pensamento
Se Claude estiver pensando com mais ou menos frequência do que gostaria, você pode adicionar orientações ao prompt do sistema:
Extended thinking adds latency and should only be used when it will meaningfully improve answer quality — typically for problems that require multi-step reasoning. When in doubt, respond directly.
Atenção
ClaudePassar a pensar com menos frequência pode reduzir a qualidade das tarefas que se beneficiam do raciocínio. Meça o impacto em suas cargas de trabalho específicas antes de implantar o ajuste baseado em solicitações na produção. Considere testar primeiro com níveis de esforço mais baixos.