

# Pensamento estendido no Amazon Nova 2
<a name="extended-thinking"></a>

O Amazon Nova 2 Lite apresenta recursos de **pensamento estendido** que permitem que o modelo realize um raciocínio mais profundo para problemas complexos. Esse recurso opcional oferece controle sobre quando e como o modelo aloca recursos computacionais adicionais para pensar em tarefas desafiadoras.

## Como funciona o pensamento estendido
<a name="how-extended-thinking-works"></a>

 O Amazon Nova 2 apresenta o pensamento estendido como uma **capacidade híbrida**. Você tem controle total:
+ **Pensamento estendido DESATIVADO (padrão)**: o Amazon Nova 2 opera com raciocínio latente eficiente, ideal para tarefas diárias e aplicações de alto volume.
+ **Pensamento estendido ATIVADO**: o Amazon Nova 2 usa o melhor raciocínio explícito, passo a passo, para problemas complexos que exigem uma análise profunda.

### Esforço de raciocínio
<a name="reasoning-effort"></a>

Confira a seguir diferentes níveis de esforço de raciocínio.

#### Baixo esforço (maxReasoningeffort:"low")
<a name="reasoning-effort-low"></a>

**Ideal para:** tarefas com maior complexidade que exigem pensamento estruturado. Por exemplo, você pode usar para análise de código e sugestões de melhoria em que o modelo precisa considerar cuidadosamente a qualidade do código existente, tarefas de análise que exigem consideração cuidadosa de vários fatores ou cenários de solução de problemas que se beneficiam de uma abordagem metódica. O baixo esforço é ideal para tarefas compostas em que o raciocínio básico melhora a precisão sem exigir um planejamento profundo em várias etapas.

#### Esforço médio (maxReasoningEffort: "medium")
<a name="reasoning-effort-medium"></a>

**Ideal para:** tarefas de várias etapas e fluxos de trabalho de codificação. Por exemplo, você pode usar para desenvolvimento e depuração de software em que o modelo precisa entender a estrutura de código existente antes de implementar alterações, geração de código que requer coordenação entre vários arquivos ou componentes, cálculos de várias etapas com interdependências ou tarefas de planejamento com várias restrições. O esforço médio é ideal para fluxos de trabalho agênticos que coordenam várias ferramentas e exigem que o modelo mantenha o contexto em várias operações sequenciais.

#### Alto esforço (maxReasoningeffort:"high")
<a name="reasoning-effort-high"></a>

**Ideal para:** raciocínio lógico-científico e resolução avançada de problemas. Por exemplo, você pode usar para comprovações e problemas matemáticos avançados que exigem verificação passo a passo rigorosa, análise científica e tarefas de pesquisa que exigem investigação aprofundada, design de sistema complexo com considerações de arquitetura em várias dimensões ou cenários críticos de tomada de decisão com implicações significativas. O alto esforço proporciona a máxima precisão para tarefas que exigem raciocínio sofisticado, avaliação cuidadosa das alternativas e validação completa das conclusões.

### Início rápido: habilitação do pensamento estendido
<a name="enable-extended-thinking"></a>

O pensamento estendido é controlado por meio do parâmetro `reasoningConfig`.

```
import boto3

bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')

response = bedrock.converse(
    modelId='us.amazon.nova-2-lite-v1:0',
    system=[{"text": "You are a highly capable personal assistant"}],
    messages=[{
        "role": "user",
        "content": [{"text": "Provide a meal plan for a gluten free family of 4."}]
    }],
    inferenceConfig={
        "temperature": 0.7,
        "topP": 0.9,
        "maxTokens": 10000
    },
    additionalModelRequestFields={
        "reasoningConfig": {
            "type": "enabled",
            "maxReasoningEffort": "low"
        }
    }
)

content_list = response["output"]["message"]["content"]

for item in content_list:
    if "reasoningContent" in item:
        reasoning_text = item["reasoningContent"]["reasoningText"]["text"]
        print("=== REASONING ===")
        print(reasoning_text)
        print()
    elif "text" in item:
        print("=== ANSWER ===")
        print(item["text"])
```

Parâmetros de raciocínio:
+ `type: enabled` ou `disabled` (padrão: `disabled`)
+ `maxReasoningEffort`: `low`, `medium`, ou `high`

**nota**  
Temperature, topP e topK não podem ser usados com `maxReasoningEffort` definido como `high`. Usar esses parâmetros juntos gera um erro.

Para obter exemplos completos de código que utiliza o pensamento estendido, consulte [Biblioteca de códigos](code-library.md).

### Estrutura de respostas
<a name="extended-thinking-response-structure"></a>

Quando você habilita o pensamento estendido, as respostas incluem blocos `reasoningContent` seguidos por blocos de conteúdo `text`:

```
{
    "output": {
        "message": {
            "role": "assistant",
            "content": [
                {
                    "reasoningContent": {
                        "reasoningText": {
                            "text": "[REDACTED]"
                        }
                    }
                },
                {
                    "text": "Based on the premises, we can conclude..."
                }
            ]
        }
    },
    "stopReason": "end_turn"
}
```

**nota**  
Com o Amazon Nova 2, o conteúdo de raciocínio é exibido como `[REDACTED]`. Você ainda é cobrado pelos tokens de raciocínio, pois eles contribuem para melhorar a qualidade da saída. Esse campo foi incluído na estrutura de respostas para preservar a opção de expor o conteúdo de raciocínio no futuro. Estamos trabalhando ativamente com os clientes para determinar a melhor abordagem para apresentar o processo de raciocínio do modelo. O conteúdo do raciocínio é exibido como `[REDACTED]`. Você ainda é cobrado pelos tokens de raciocínio, pois eles contribuem para melhorar a qualidade da resposta.

## Opções de configuração
<a name="extended-thinking-configuration"></a>

O Amazon Nova 2 introduz um novo parâmetro `reasoningConfig` que você pode adicionar à sua estrutura de solicitação conversa existente para permitir o raciocínio:

```
additionalModelRequestFields={
    "reasoningConfig": {
        "type": "enabled",  # or "disabled" (default)
        "maxReasoningEffort": "high"  # "low", "medium", or "high"
    }
}
```

**Parâmetros:**
+ **type:** alternar entre `"enabled"` e `"disabled"` (o padrão é `"disabled"`)
+ **`maxReasoningEffort`:** quando habilitado, controla a profundidade do raciocínio
+ **"low":** tarefas moderadamente complexas
+ **"medium":** problemas complexos que exigem análises substanciais
+ **"high":** o raciocínio mais completo para tarefas altamente complexas

**nota**  
 ao usar `"high"`, temp, topP e maxToken devem ser desativados. Nesse modo, o modelo realiza uma análise mais profunda para encontrar a melhor solução. Esse processamento mais completo pode gerar uma saída que excede 65 mil tokens. A quantidade exata depende da complexidade da sua solicitação, mas, em alguns problemas, vimos um aumento de até 128 mil tokens. Isso garante que você obtenha um raciocínio completo e de alta qualidade, em vez de resultados truncados. 

## Modelos compatíveis
<a name="extended-thinking-supported-models"></a>

O pensamento estendido está atualmente disponível em: Amazon Nova 2 Lite (us.amazon.nova-2-lite-v1:0)

## Raciocínio estendido com o uso de ferramentas
<a name="extended-thinking-with-tools"></a>

O pensamento estendido funciona perfeitamente com a chamada de ferramentas, permitindo que o Amazon Nova raciocine sobre quais ferramentas usar e como interpretar seus resultados.

## Compreensão de preços e tokens de raciocínio
<a name="reasoning-tokens-pricing"></a>

### Tipos de token
<a name="reasoning-token-types"></a>

Os tokens de pensamento estendido são cobrados como tokens de saída:
+ **Tokens de entrada**: o conteúdo original da sua solicitação (preço de entrada padrão) 
+ **Tokens de saída**: inclui tokens de raciocínio e o conteúdo final da resposta visível (preço de saída padrão) 

### Detalhamento de uso
<a name="reasoning-usage-breakdown"></a>

Todos os três tipos de token estão incluídos em suas métricas de uso e cobrança. Os tokens de raciocínio têm o mesmo preço dos tokens de saída e aparecerão como “REDACTED” na resposta do modelo.

```
  {
  "usage": {
    "inputTokens": 45,
    "outputTokens": 1240,
    "totalTokens": 1285
  }
}
```

## Perguntas frequentes
<a name="reasoning-faq"></a>

Por que o Amazon Nova 2 Lite mostra “[REDACTED]” como conteúdo de raciocínio em vez de exibir o processo de raciocínio do modelo?  
 Nosso foco principal neste lançamento é garantir que o Nova 2 ofereça a melhor inteligência da categoria para suas tarefas, e você verá isso refletido na melhoria da precisão.  
 Reconhecemos que a visibilidade do processo de raciocínio é valiosa, e temos notado um grande interesse por parte dos clientes em compreender o processo de pensamento do modelo ao resolver problemas.  
 Estamos procurando formas de disponibilizar esse recurso em breve.  
**Você ainda será cobrado pelos tokens de raciocínio**, pois eles representam o trabalho real realizado para melhorar a qualidade da resposta,   
o que será contabilizado em `outputTokens` junto com os tokens de resposta. 

Como saberei se o pensamento estendido está funcionando se o raciocínio estiver omitido?  
Você pode confirmar se o pensamento estendido está funcionando verificando a saída em busca de blocos `reasoningContent` na resposta (eles só aparecem quando o raciocínio está habilitado)