Qu'est-ce que l'ingénierie rapide

L’ingénierie de requête désigne la pratique consistant à optimiser les entrées textuelles d’un grand modèle de langage (LLM) afin d’améliorer les résultats et d’obtenir les réponses que l’on veut. Les invites aident un LLM à effectuer une grande variété de tâches, notamment la classification, la réponse aux questions, la génération de code, l’écriture créative, etc. La qualité des invites que vous fournissez à un LLM peut avoir un impact sur la qualité des réponses du modèle. Cette section fournit les informations nécessaires pour faire vos premiers pas avec l’ingénierie de requête. Il couvre également des outils pour vous aider à trouver le meilleur format d'invite possible pour votre cas d'utilisation lorsque vous utilisez un LLM sur Amazon Bedrock

L’efficacité des invites dépend de la qualité des informations fournies et de la qualité de l’invite elle-même. Les invites peuvent inclure des instructions, des questions, des détails contextuels, des entrées et des exemples afin de guider efficacement le modèle et d’améliorer la qualité des résultats. Ce document décrit les stratégies et les tactiques permettant d'optimiser les performances de la gamme de modèles Amazon Nova 2 Sonic. Les méthodes présentées ici peuvent être utilisées dans différentes combinaisons afin d’amplifier leur efficacité. Nous vous encourageons à expérimenter afin d'identifier les approches les mieux adaptées à leurs besoins spécifiques.

Commencer par une ingénierie rapide

Avant de commencer l’ingénierie de requête, nous vous recommandons de mettre en place les éléments suivants afin de pouvoir développer de manière itérative la requête la plus optimale pour votre cas d’utilisation :

Définissez votre cas d'utilisation

Définissez votre cas d'utilisation selon quatre dimensions :

Tâche : définissez ce que vous souhaitez que le modèle accomplisse. Cela permet de déterminer la bonne technique d'incitation.
Rôle : définissez le rôle que le modèle doit assumer pour accomplir la tâche. Les modèles Amazon Nova prennent en charge trois rôles (système, utilisateur ou assistant).
Style de réponse : définissez la structure ou le style de réponse que le modèle doit suivre en fonction de l'audience, tel que JSON, Markdown ou conversationnel.
Instructions — Définissez l'ensemble d'instructions que le modèle doit suivre pour répondre aux critères de réussite.

Établissez des critères de réussite

Définissez des critères de réussite ou des mesures d'évaluation. Vous pouvez fournir une liste de critères ou des indicateurs d'évaluation spécifiques, tels que la longueur, le score BLEU, le ROUGE, le format, la factualité et la fidélité.

Rédiger une invite

Créez une invite de départ incorporant votre tâche, votre rôle, votre style de réponse et vos instructions. Effectuez une itération en fonction des résultats.

L'efficacité des instructions dépend de la qualité des informations que vous fournissez.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Ingénierie rapide

Bonnes pratiques