

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Configurare la generazione di risposte per modelli di ragionamento con Knowledge Bases
<a name="kb-test-configure-reasoning"></a>

Alcuni modelli di fondazione sono in grado di eseguire il ragionamento basato su modello, in cui eseguono un’attività più ampia e complessa e la suddividono in fasi più piccole e più semplici. Questo processo, spesso denominato ragionamento a catena di pensiero, può migliorare la precisione del modello dando al modello la possibilità di pensare prima di rispondere. Il ragionamento basato su modello è particolarmente utile per attività come l’analisi in più fasi, problemi matematici e attività di ragionamento complesse. Per ulteriori informazioni, consulta [Migliorare le risposte del modello con il ragionamento basato su modello](inference-reasoning.md).

**Nota**  
Questa pagina descrive come utilizzare la configurazione del ragionamento specificamente per Knowledge Base per Amazon Bedrock. Per informazioni sulla configurazione del ragionamento per l’invocazione diretta del modello tramite l’API `InvokeModel`, consultare [Migliorare le risposte del modello con il ragionamento basato su modello](inference-reasoning.md).

Quando il ragionamento basato sui modelli è abilitato, può migliorare la precisione e generare risultati di citazione più accurati, ma può comportare un aumento della latenza. Di seguito sono riportate alcune considerazioni quando si interrogano le origini dati e si generano risposte utilizzando modelli di ragionamento con Knowledge Base per Amazon Bedrock.

**Topics**
+ [Modelli di ragionamento](#kb-test-reasoning-models)
+ [Utilizzo del ragionamento basato su modello per Claude 3.7 Sonnet](#kb-test-reasoning-using)
+ [Considerazioni generali](#kb-test-reasoning-general-considerations)
+ [Considerazioni sull’API RetrieveandGenerate](#kb-test-reasoning-api-considerations)

## Modelli di ragionamento
<a name="kb-test-reasoning-models"></a>

Per vedere quali modelli supportano il ragionamento, consulta la sezione [dedicata ai modelli in sintesi](model-cards.md) e scegli il modello che ti interessa.

## Utilizzo del ragionamento basato su modello per Claude 3.7 Sonnet
<a name="kb-test-reasoning-using"></a>

**Nota**  
Il ragionamento del modello è sempre abilitato per il DeepSeek modello -R1. Il modello non supporta l’attivazione e la disattivazione della funzionalità di ragionamento.

Quando si utilizza il modello Claude 3.7 Sonnet, il ragionamento basato su modello può essere abilitato o disabilitato utilizzando il parametro `additionalModelRequestFields` dell’API [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html). Questo parametro accetta qualsiasi coppia chiave-valore. Ad esempio, è possibile aggiungere un campo `reasoningConfig` e utilizzare una chiave `type` per abilitare o disabilitare il ragionamento, come mostrato di seguito.

```
{
   "input": { 
      "text": "string",
      "retrieveAndGenerateConfiguration": { 
      "knowledgeBaseConfiguration": { 
         "generationConfiguration": { 
            "additionalModelRequestFields": {
                "reasoningConfig" : {
                    "type": "enabled",
                    "budget_tokens": INT_VAL, #required when enabled
                }
            }
         },
         "knowledgeBaseId": "string",
      },
      "type": "string"
   },
   "sessionId": "string"
}
```

## Considerazioni generali
<a name="kb-test-reasoning-general-considerations"></a>

Di seguito sono riportate alcune considerazioni generali sull’utilizzo dei modelli di ragionamento per Knowledge Bases.
+ I modelli di ragionamento hanno a disposizione fino a cinque minuti per rispondere a una domanda. Se il modello impiega più di cinque minuti per rispondere alla domanda, si verifica un timeout.
+ Per evitare il superamento del timeout di cinque minuti, il ragionamento basato su modello è abilitato solo nella fase di generazione, quando si configurano le query e la generazione delle risposte. La fase di orchestrazione non può avere il ragionamento basato su modello.
+ I modelli di ragionamento possono utilizzare fino a 8192 token per rispondere alle domande, che includono sia i token di output che quelli di ragionamento. Qualsiasi richiesta che richiede un numero massimo di token di output superiore a questo limite genera un errore.

## Considerazioni sull’API RetrieveandGenerate
<a name="kb-test-reasoning-api-considerations"></a>

Di seguito sono riportate alcune considerazioni sull’utilizzo dell’API [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html) per i modelli di ragionamento.
+ Per impostazione predefinita, quando il ragionamento è disabilitato per tutti i modelli, incluso Claude 3.7 Sonnet, la temperatura è impostata su zero. Quando il ragionamento è abilitato, la temperatura deve essere impostata su uno.

  ```
  "inferenceConfig": {
      "textInferenceConfig": {
          "maxTokens": 8192,
          "temperature": 1
      }
  }
  ```
+ Il parametro Top P deve essere disabilitato quando il ragionamento è abilitato per il modello Claude 3.7 Sonnet. Top P è un campo aggiuntivo di richiesta del modello che determina il percentile di possibili token da selezionare durante la generazione. Per impostazione predefinita, il valore Top P per gli altri modelli Anthropic Claude è uno. Per il modello Claude 3.7 Sonnet, questo valore è disabilitato per impostazione predefinita.
+ Quando si utilizza il ragionamento basato su modello, può comportare un aumento della latenza. Quando si utilizza l’operazione di questa API e l’operazione dell’API [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateStream.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerateStream.html), è possibile notare un ritardo nella ricezione della risposta dall’API.