Amélioration de la précision des agents à l’aide de modèles d’invite avancés dans Amazon Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Amélioration de la précision des agents à l’aide de modèles d’invite avancés dans Amazon Bedrock

Après sa création, un agent est configuré avec les quatre modèles d’invite de base par défaut suivants, qui décrivent comment l’agent construit les invites à envoyer au modèle de fondation à chaque étape de la séquence d’agents. Pour plus de détails sur ce que chaque étape englobe, consultez Processus d’exécution.

  • Prétraitement

  • Orchestration

  • Génération de réponses de la base de connaissances

  • Post-traitement (désactivé par défaut)

  • Synthèse de mémoire

  • Classifieur de routage

Les modèles d’invite définissent la manière dont l’agent effectue les opérations suivantes :

  • Traite le texte saisi par l’utilisateur et les invites de sortie des modèles de fondation (FM)

  • S’orchestre entre le FM, les groupes d’action et les bases de connaissances

  • Met en forme et renvoie les réponses à l’utilisateur

En utilisant des invites avancées, vous pouvez améliorer la précision de votre agent en modifiant ces modèles d’invite afin de fournir des configurations détaillées. Vous pouvez également fournir des exemples sélectionnés manuellement pour invites avec peu d’exemples, dans lesquels vous améliorez les performances du modèle en fournissant des exemples étiquetés pour une tâche spécifique.

Sélectionnez une rubrique pour en savoir plus sur les invites avancées.

Terminologie avancée des invites

La terminologie suivante est utile pour comprendre le fonctionnement des invites avancées.

  • Session : groupe de demandes InvokeAgent adressées au même agent avec le même identifiant de session. Lorsque vous effectuez une demande InvokeAgent, vous pouvez réutiliser une réponse sessionId renvoyée par un appel précédent afin de poursuivre la même session avec un agent. Tant que la durée idleSessionTTLInSeconds dans la configuration de l’agent n’a pas expiré, vous conservez la même session avec l’agent.

  • Tour : un seul appel InvokeAgent. Chaque session se compose d’un ou de plusieurs tours.

  • Itération : séquence des actions suivantes :

    1. (Obligatoire) appel au modèle de fondation

    2. (Facultatif) invocation du groupe d’actions

    3. (Facultatif) invocation de la base de connaissances

    4. (Facultatif) réponse à la demande d’informations supplémentaires de l’utilisateur

    Une action peut être ignorée en fonction de la configuration de l’agent ou des besoins de l’agent à ce moment-là. Un tour se constitue d’une ou de plusieurs itérations.

  • Invite : une invite comprend les instructions destinées à l’agent, le contexte et l’entrée de texte. L’entrée de texte peut provenir d’un utilisateur ou de la sortie d’une autre étape de la séquence d’agents. L’invite est fournie au modèle de fondation afin de déterminer la prochaine étape que l’agent devra suivre pour répondre aux entrées utilisateur.

  • Modèle d’invite de base : éléments structurels qui constituent une invite. Ce modèle comprend des espaces réservés qui sont remplis avec les entrées utilisateur, la configuration de l’agent et le contexte au moment de l’exécution pour créer une invite à traiter par le modèle de fondation lorsque l’agent atteint cette étape. Pour plus d’informations sur ces espaces réservés, consultez Utilisation des variables d’espace réservé dans les modèles d’invites des agents Amazon Bedrock. À l’aide des invites avancées, vous pouvez modifier ces modèles.

  • Référencement des données utiles : fonctionnalité de compression des invites utilisée dans le cadre de la collaboration multi-agent et activée par défaut pour l’agent principal. Cela permet de réduire les jetons de sortie utilisés par l’agent principal pour communiquer avec le sous-agent ou l’utilisateur final, contribuant ainsi à réduire les coûts. Cela réduit également la taille de l’historique des conversations en cas de données utiles répétées dans l’invite.