Comment fonctionne la pensée étendue Options de configuration Modèles pris en charge Réflexion approfondie avec utilisation d’outils Comprendre les jetons de raisonnement et les prix Questions fréquentes (FAQ)

Réflexion approfondie dans Amazon Nova 2

Amazon Nova 2 Lite introduit des capacités de réflexion étendues qui permettent au modèle d'engager un raisonnement plus approfondi pour des problèmes complexes. Cette fonctionnalité optionnelle vous permet de contrôler quand et comment le modèle alloue des ressources informatiques supplémentaires pour effectuer des tâches difficiles.

Comment fonctionne la pensée étendue

Amazon Nova 2 introduit la pensée étendue en tant que capacité hybride. Vous avez le contrôle total :

Extended Thinking OFF (par défaut) : Amazon Nova 2 fonctionne avec un raisonnement latent efficace, optimal pour les tâches quotidiennes et les applications à volume élevé.
Réflexion approfondie : Amazon Nova 2 adopte un step-by-step raisonnement explicite, idéal pour les problèmes complexes nécessitant une analyse approfondie.

Effort de raisonnement

Ce qui suit montre les différents niveaux d'effort de raisonnement.

Faible effort (MaxReasoningEffort : « faible »)

Idéal pour : les tâches plus complexes qui nécessitent une réflexion structurée. Par exemple, vous pouvez l'utiliser pour la révision du code et les suggestions d'amélioration lorsque le modèle doit prendre en compte attentivement la qualité du code existant, pour les tâches d'analyse qui nécessitent une prise en compte approfondie de plusieurs facteurs ou pour les scénarios de résolution de problèmes bénéficiant d'une approche méthodique. Le faible niveau d'effort est idéal pour les tâches complexes où le raisonnement de base améliore la précision sans nécessiter une planification approfondie en plusieurs étapes.

Effort moyen (maxReasoningEffort« moyen »)

Idéal pour : les tâches en plusieurs étapes et les flux de travail de codage. Par exemple, vous pouvez l'utiliser pour le développement et le débogage de logiciels lorsque le modèle doit comprendre la structure de code existante avant d'implémenter des modifications, pour générer du code nécessitant une coordination entre plusieurs fichiers ou composants, pour des calculs en plusieurs étapes avec interdépendances ou pour planifier des tâches avec plusieurs contraintes. Un effort moyen est optimal pour les flux de travail agentiques qui coordonnent plusieurs outils et nécessitent que le modèle maintienne le contexte de plusieurs opérations séquentielles.

Effort élevé (effort de raisonnement maximal : « élevé »)

Idéal pour : le raisonnement STEM et la résolution avancée de problèmes. Par exemple, vous pouvez l'utiliser pour des problèmes mathématiques avancés et des preuves qui nécessitent une step-by-step vérification rigoureuse, des analyses scientifiques et des tâches de recherche exigeant une investigation approfondie, une conception de systèmes complexes avec des considérations architecturales à plusieurs dimensions, ou des scénarios de prise de décision critiques ayant des implications importantes. Un effort élevé permet d'obtenir une précision maximale pour les tâches nécessitant un raisonnement sophistiqué, une évaluation minutieuse des alternatives et une validation approfondie des conclusions.

Démarrage rapide : activation de la pensée étendue

La pensée étendue est contrôlée par le reasoningConfig paramètre.


import boto3

bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')

response = bedrock.converse(
    modelId='us.amazon.nova-2-lite-v1:0',
    system=[{"text": "You are a highly capable personal assistant"}],
    messages=[{
        "role": "user",
        "content": [{"text": "Provide a meal plan for a gluten free family of 4."}]
    }],
    inferenceConfig={
        "temperature": 0.7,
        "topP": 0.9,
        "maxTokens": 10000
    },
    additionalModelRequestFields={
        "reasoningConfig": {
            "type": "enabled",
            "maxReasoningEffort": "low"
        }
    }
)

content_list = response["output"]["message"]["content"]

for item in content_list:
    if "reasoningContent" in item:
        reasoning_text = item["reasoningContent"]["reasoningText"]["text"]
        print("=== REASONING ===")
        print(reasoning_text)
        print()
    elif "text" in item:
        print("=== ANSWER ===")
        print(item["text"])

Paramètres de raisonnement :

type: enabledou disabled (par défaut :disabled)
maxReasoningEffort: lowmedium, ou high

Note

Temperature, TopP et TopK ne peuvent pas être utilisés lorsque le paramètre est maxReasoningEffort réglé sur. high L'utilisation conjointe de ces paramètres entraîne une erreur.

Pour des exemples complets de code utilisant la pensée étendue, voirBibliothèque de codes.

Structure de réponse

Lorsque vous activez la pensée étendue, les réponses incluent des reasoningContent blocs suivis de blocs de text contenu :



{
    "output": {
        "message": {
            "role": "assistant",
            "content": [
                {
                    "reasoningContent": {
                        "reasoningText": {
                            "text": "[REDACTED]"
                        }
                    }
                },
                {
                    "text": "Based on the premises, we can conclude..."
                }
            ]
        }
    },
    "stopReason": "end_turn"
}

Note

Avec Amazon Nova 2, le contenu de raisonnement s'affiche sous la forme[REDACTED]. Les jetons de raisonnement vous sont toujours facturés, car ils contribuent à améliorer la qualité de sortie. Nous incluons maintenant ce champ dans la structure de réponse afin de préserver la possibilité d'exposer le contenu du raisonnement à l'avenir. Nous travaillons activement avec les clients afin de déterminer la meilleure approche pour définir le processus de raisonnement du modèle. Le contenu du raisonnement est affiché sous forme de. [REDACTED] Les jetons de raisonnement vous sont toujours facturés, car ils contribuent à améliorer la qualité des réponses.

Options de configuration

Amazon Nova 2 introduit un nouveau reasoningConfig paramètre que vous pouvez ajouter à votre structure de demande converse existante pour permettre le raisonnement :



additionalModelRequestFields={
    "reasoningConfig": {
        "type": "enabled",  # or "disabled" (default)
        "maxReasoningEffort": "high"  # "low", "medium", or "high"
    }
}

Paramètres :

type : Basculer entre "enabled" et "disabled" (la valeur par défaut est"disabled")
maxReasoningEffort: lorsque cette option est activée, contrôlez la profondeur du raisonnement
« faible » : tâches modérément complexes
« moyen » : problèmes complexes nécessitant une analyse approfondie
« élevé » : raisonnement le plus complet pour des tâches très complexes

Note

lors de l'utilisation"high", temp, toPP et maxToken doivent être désactivés. Dans ce mode, le modèle effectue une analyse plus approfondie pour trouver la meilleure solution. Ce traitement plus approfondi peut générer un résultat supérieur à 65 000 jetons. Le montant exact dépend de la complexité de votre demande, mais pour certains problèmes, nous l'avons vu passer à 128 000 jetons. Cela vous garantit un raisonnement complet et de haute qualité plutôt que des résultats tronqués.

Modèles pris en charge

Extended Thinking est actuellement disponible dans : Amazon Nova 2 Lite (us.amazon.nova-2-lite-v 1:0)

Réflexion approfondie avec utilisation d’outils

La réflexion approfondie fonctionne parfaitement avec l'appel d'outils, ce qui permet à Amazon Nova de réfléchir aux outils à utiliser et à la manière d'interpréter leurs résultats.

Comprendre les jetons de raisonnement et les prix

Types de jetons

Les jetons Extended Thinking sont facturés comme des jetons de sortie :

Jetons d'entrée : contenu de votre demande initiale (prix d'entrée standard)
Jetons de sortie : cela inclut les jetons de raisonnement et le contenu de la réponse visible finale (tarification de sortie standard)

Répartition de l'utilisation

Les trois types de jetons sont inclus dans vos statistiques d'utilisation et dans votre facturation. Le prix des jetons de raisonnement est le même que celui des jetons de sortie et apparaîtront comme « SUPPRIMÉ » dans la réponse du modèle ».



  {
  "usage": {
    "inputTokens": 45,
    "outputTokens": 1240,
    "totalTokens": 1285
  }
}

Questions fréquentes (FAQ)

Pourquoi Amazon Nova 2 Lite affiche-t-il « [SUPPRIMÉ] » pour le contenu du raisonnement au lieu d'afficher le processus de réflexion du modèle ?

Notre objectif principal pour ce lancement est de nous assurer que Nova 2 fournit la meilleure intelligence de sa catégorie pour vos tâches, et cela se reflète dans l'amélioration de la précision.

Nous sommes conscients que la visibilité du processus de raisonnement est précieuse, et nous avons constaté que les clients souhaitaient vivement comprendre comment le modèle aborde les problèmes.

Nous cherchons des moyens de le rendre disponible prochainement.

Les jetons de raisonnement vous sont toujours facturés, car ils représentent un travail réel qui améliore la qualité de votre sortie

qui seront capturés outputTokens avec les jetons de réponse.

Comment savoir si la pensée étendue fonctionne si le raisonnement est expurgé ?

Vous pouvez confirmer que la pensée étendue fonctionne en vérifiant la présence de reasoningContent blocs dans la réponse (ceux-ci n'apparaissent que lorsque le raisonnement est activé)

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Systèmes avancés avec Nova

Utilisation d’outil