

# Pensamiento extendido en Amazon Nova 2
<a name="extended-thinking"></a>

Amazon Nova 2 Lite presenta capacidades de **pensamiento extendido** que permiten al modelo hacer un razonamiento más profundo para problemas complejos. Esta característica opcional le permite controlar cuándo y cómo el modelo asigna recursos computacionales adicionales para analizar tareas difíciles.

## Cómo funciona el pensamiento extendido
<a name="how-extended-thinking-works"></a>

 Amazon Nova 2 presenta el pensamiento extendido como una **capacidad híbrida**. Usted tiene el control total:
+ **Pensamiento extendido desactivado (predeterminado)**: Amazon Nova 2 funciona con un razonamiento latente eficiente, óptimo para tareas diarias y aplicaciones de gran volumen.
+ **Pensamiento extendido activado**: Amazon Nova 2 utiliza el razonamiento explícito y paso a paso, ideal para problemas complejos que requieren un análisis profundo.

### Esfuerzo de razonamiento
<a name="reasoning-effort"></a>

A continuación se muestran los diferentes niveles de esfuerzo de razonamiento.

#### Esfuerzo bajo (maxReasoningeffort:“bajo”)
<a name="reasoning-effort-low"></a>

**Ideal para:** tareas con mayor complejidad que requieren un pensamiento estructurado. Por ejemplo, puede utilizarlo para hacer sugerencias de revisión y mejora del código en las que el modelo deba tener en cuenta detenidamente la calidad del código existente, llevar a cabo tareas de análisis que requieran tener en cuenta detenidamente varios factores o situaciones de resolución de problemas que se beneficien de un enfoque metódico. El esfuerzo bajo es ideal para tareas complejas en las que el razonamiento básico mejore la precisión sin requerir una planificación profunda de varios pasos.

#### Esfuerzo medio (maxReasoningeffort:“medio”)
<a name="reasoning-effort-medium"></a>

**Ideal para:** tareas de varios pasos y flujos de trabajo de codificación. Por ejemplo, puede utilizarlo para el desarrollo y la depuración de software cuando el modelo necesite comprender la estructura del código existente antes de implementar los cambios, la generación de código que requiere la coordinación entre varios archivos o componentes, los cálculos de varios pasos con interdependencias o la planificación de tareas con varias restricciones. Un esfuerzo medio es óptimo para flujos de trabajo agénticos que coordinan varias herramientas y requieren que el modelo mantenga el contexto en varias operaciones secuenciales.

#### Esfuerzo alto (maxReasoningeffort:“alto”)
<a name="reasoning-effort-high"></a>

**Ideal para:** razonamiento STEM y resolución avanzada de problemas. Por ejemplo, puede utilizarlo para pruebas y problemas matemáticos avanzados que requieran una verificación minuciosa, tareas de análisis e investigación que requieran una investigación exhaustiva, diseños de sistemas complejos con consideraciones arquitectónicas en varias dimensiones o casos críticos de toma de decisiones con implicaciones significativas. Un esfuerzo alto proporciona la máxima precisión para tareas que requieran un razonamiento sofisticado, una evaluación cuidadosa de las alternativas y una validación exhaustiva de las conclusiones.

### Inicio rápido: activación del pensamiento extendido
<a name="enable-extended-thinking"></a>

El pensamiento extendido se controla a través del parámetro `reasoningConfig`.

```
import boto3

bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')

response = bedrock.converse(
    modelId='us.amazon.nova-2-lite-v1:0',
    system=[{"text": "You are a highly capable personal assistant"}],
    messages=[{
        "role": "user",
        "content": [{"text": "Provide a meal plan for a gluten free family of 4."}]
    }],
    inferenceConfig={
        "temperature": 0.7,
        "topP": 0.9,
        "maxTokens": 10000
    },
    additionalModelRequestFields={
        "reasoningConfig": {
            "type": "enabled",
            "maxReasoningEffort": "low"
        }
    }
)

content_list = response["output"]["message"]["content"]

for item in content_list:
    if "reasoningContent" in item:
        reasoning_text = item["reasoningContent"]["reasoningText"]["text"]
        print("=== REASONING ===")
        print(reasoning_text)
        print()
    elif "text" in item:
        print("=== ANSWER ===")
        print(item["text"])
```

Parámetros de razonamiento:
+ `type: enabled` o `disabled` (predeterminado: `disabled`)
+ `maxReasoningEffort`: `low`, `medium`, o bien `high`

**nota**  
Temperatura, TopP y TopK no se pueden usar con `maxReasoningEffort` establecido en `high`. Si se utilizan estos parámetros juntos, se producirá un error.

Para ver ejemplos completos de código que utiliza el pensamiento extendido, consulte [Biblioteca de códigos](code-library.md).

### Estructura de la respuesta
<a name="extended-thinking-response-structure"></a>

Al habilitar el pensamiento extendido, las respuestas incluyen bloques `reasoningContent` seguidos de bloques de contenido `text`:

```
{
    "output": {
        "message": {
            "role": "assistant",
            "content": [
                {
                    "reasoningContent": {
                        "reasoningText": {
                            "text": "[REDACTED]"
                        }
                    }
                },
                {
                    "text": "Based on the premises, we can conclude..."
                }
            ]
        }
    },
    "stopReason": "end_turn"
}
```

**nota**  
Con Amazon Nova 2, el contenido de razonamiento se muestra como `[REDACTED]`. Se le continuará cobrando por los tokens de razonamiento, ya que contribuyen a mejorar la calidad de la salida. Ahora incluimos este campo en la estructura de la respuesta para preservar la opción de exponer el contenido del razonamiento en el futuro. Estamos trabajando activamente con los clientes para determinar el mejor enfoque para dar a conocer el proceso de razonamiento del modelo. El contenido del razonamiento se muestra como `[REDACTED]`. Se le continuará cobrando por los tokens de razonamiento, ya que contribuyen a mejorar la calidad de la respuesta.

## Opciones de configuración
<a name="extended-thinking-configuration"></a>

Amazon Nova 2 presenta un nuevo parámetro `reasoningConfig` que puede agregar a la estructura de solicitudes de conversación existente para permitir el razonamiento:

```
additionalModelRequestFields={
    "reasoningConfig": {
        "type": "enabled",  # or "disabled" (default)
        "maxReasoningEffort": "high"  # "low", "medium", or "high"
    }
}
```

**Parámetros:**
+ **tipo:** cambie entre `"enabled"` y `"disabled"` (la opción predeterminada es `"disabled"`)
+ **`maxReasoningEffort`:** si está habilitado, controla la profundidad del razonamiento.
+ **“bajo”:** tareas moderadamente complejas
+ **“medio”:** problemas complejos que requieren un análisis sustancial
+ **“alto”:** el razonamiento más completo para tareas muy complejas

**nota**  
 Al utilizar `"high"`, temp, TopP y maxToken no deben estar configurados. En este modo, el modelo lleva a cabo un análisis más profundo para encontrar la mejor solución. Este procesamiento más exhaustivo puede generar una salida que supere los 65 000 tokens. La cantidad exacta depende de la complejidad de la solicitud, pero, para algunos problemas, hemos visto que puede llegar a 128 000 tokens. Esto garantiza que obtendrá un razonamiento completo y de alta calidad, en lugar de resultados truncados. 

## Modelos compatibles
<a name="extended-thinking-supported-models"></a>

El pensamiento extendido está disponible actualmente en: Amazon Nova 2 Lite (us.amazon.nova-2-lite-v1:0).

## Pensamiento extendido con el uso de herramientas
<a name="extended-thinking-with-tools"></a>

El pensamiento extendido funciona a la perfección con las llamadas a herramientas, lo que permite a Amazon Nova razonar sobre qué herramientas utilizar y cómo interpretar sus resultados.

## Descripción de los tokens de razonamiento y los precios
<a name="reasoning-tokens-pricing"></a>

### Tipos de token
<a name="reasoning-token-types"></a>

Los tokens de pensamiento extendido se facturan como tokens de salida:
+ **Tokens de entrada**: contenido original de la solicitud (precio de entrada estándar). 
+ **Tokens de salida**: incluye los tokens de razonamiento y el contenido final de la respuesta visible (precio de salida estándar). 

### Desglose de usos
<a name="reasoning-usage-breakdown"></a>

Los tres tipos de token se incluyen en las métricas de uso y en la facturación. Los tokens de razonamiento tienen el mismo precio que los de salida y aparecerán como “REDACTADO” en la respuesta del modelo.

```
  {
  "usage": {
    "inputTokens": 45,
    "outputTokens": 1240,
    "totalTokens": 1285
  }
}
```

## Preguntas frecuentes
<a name="reasoning-faq"></a>

¿Por qué Amazon Nova 2 Lite muestra “[REDACTADO]” para el contenido de razonamiento en lugar de mostrar el proceso de pensamiento del modelo?  
 Nuestro objetivo principal para este lanzamiento es asegurarnos de que Nova 2 ofrezca la mejor inteligencia de su clase para sus tareas, lo que se verá reflejado en la mejora de la precisión.  
 Reconocemos que la visibilidad del proceso de razonamiento es valiosa y hemos escuchado un gran interés por parte de los clientes por comprender cómo el modelo resuelve los problemas.  
 Estamos buscando formas de hacer que esté disponible pronto.  
**Se le continuarán facturando los tokens de razonamiento**, ya que representan un trabajo real que mejora la calidad de la producción   
que se capturará en `outputTokens` junto con los tokens de respuesta. 

¿Cómo puedo saber si el pensamiento extendido funciona si el razonamiento está redactado?  
Para confirmar si el pensamiento extendido funciona, puede comprobar si hay bloques `reasoningContent` en la salida de la respuesta (solo aparecen cuando el razonamiento está habilitado).