View a markdown version of this page

Configuration de vos invites - Générateur d'applications d'IA générative sur AWS

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration de vos invites

L'assistant du tableau de bord de déploiement comporte une étape de configuration rapide qui vous permet de personnaliser l'expérience instantanée et le modèle qui guidera les interactions entre les utilisateurs et le modèle d'IA. La configuration correcte de ces paramètres est essentielle pour obtenir des réponses précises et pertinentes de la part de l'assistant AI.

Cette section contrôle l'expérience globale et le comportement de l'invite AI.

  • Longueur maximale du modèle d'invite : ce paramètre détermine la longueur maximale (en caractères) du modèle d'invite. Une valeur plus élevée permet de fournir plus de contexte au modèle d'IA, ce qui peut conduire à des réponses plus précises. Cependant, des instructions trop longues peuvent également générer du bruit et avoir un impact négatif sur les performances. Pour les modèles Amazon Bedrock, les valeurs par défaut pour la longueur maximale du modèle d'invite (en caractères) sont calculées à l'aide des limites de jetons du modèle sous-jacent. Si vous modifiez et changez le nom d'un modèle dans Bedrock, le bouton « Réinitialiser par défaut » est surligné et peut être utilisé pour adopter les paramètres par défaut du modèle nouvellement sélectionné. Pour les modèles Amazon SageMaker AI, des valeurs par défaut raisonnables sont fournies, mais il est recommandé de vérifier votre modèle sous-jacent et de choisir la longueur maximale du modèle d'invite et la longueur du texte de saisie en conséquence. Reportez-vous à la section Conseils sur la gestion des limites de jetons des modèles pour plus d'informations.

  • Longueur maximale du texte saisi : ce paramètre limite la longueur maximale (en caractères) du texte saisi par l'utilisateur. Les entrées plus longues peuvent contenir des informations non pertinentes, ce qui augmente le risque d'obtenir des réponses non pertinentes ou inexactes à partir du modèle d'IA.

  • Modification de l'invite utilisateur : cette option vous permet d'activer ou de désactiver la possibilité pour les utilisateurs de modifier le modèle d'invite via l'interface utilisateur du chat. La désactivation de cette fonctionnalité peut contribuer à maintenir la cohérence et à empêcher toute modification involontaire de l'invite.

Modèle d'invite

Cette section vous permet de définir le modèle d'invite réel qui sera utilisé par le modèle d'IA. Le modèle d'invite suit généralement une structure qui inclut des espaces réservés pour divers composants, tels que les entrées de l'utilisateur, les passages de référence et l'historique des discussions.

  • Modèle d'invite : il s'agit de la zone de texte principale dans laquelle vous pouvez écrire ou coller le modèle d'invite souhaité. Le modèle doit être conçu pour fournir le contexte et les instructions nécessaires au modèle d'IA. Il inclut généralement les espaces réservés suivants :

    • {input}: Cet espace réservé est obligatoire pour les déploiements de Sagemaker AI et sera remplacé par la saisie ou la requête de l'utilisateur.

    • {history}: Cet espace réservé est obligatoire pour les déploiements de Sagemaker AI et sera remplacé par l'historique des discussions de la conversation en cours.

    • {context}: Cet espace réservé est obligatoire pour les déploiements RAG et sera remplacé par les extraits de documents obtenus à partir de la base de connaissances configurée.

  • Reformuler la question ? : Cette option (disponible uniquement pour les déploiements RAG) détermine si la requête d'entrée initiale de l'utilisateur doit être reformulée ou désambiguïsée avant d'être transmise au modèle d'IA. La reformulation de la requête peut parfois aider le modèle à mieux comprendre l'intention de l'utilisateur, ce qui peut mener à des réponses plus précises.

Lors de la configuration du modèle d'invite et de l'expérience, il est essentiel de trouver un équilibre entre fournir suffisamment de contexte et d'instructions au modèle d'IA tout en évitant les informations trop longues ou non pertinentes susceptibles d'entraîner des problèmes de bruit ou de performance.

Paramètres d'invite avancés

Cette section vous permet de contrôler la façon dont l'historique des conversations est présenté au modèle d'IA.

  • Taille de l'historique de suivi : ce paramètre détermine le nombre de messages précédents qui doivent être inclus dans l'invite finale. Si cette valeur est définie à zéro, aucun historique ne sera injecté dans le modèle d'invite ou dans le modèle d'invite de désambiguïsation. Remarque : même lorsqu'il est défini sur zéro, un espace réservé {history} doit toujours exister dans les modèles d'invite. Au moment de l'exécution, elle sera remplacée par une chaîne vide.

    • Remarque : Il est recommandé de fournir un nombre pair pour cette valeur. Si vous fournissez un nombre impair, seule la réponse de l'IA d'une interaction jumelée serait renvoyée.

  • Préfixe humain : il s'agit du préfixe utilisé pour identifier les messages envoyés par l'utilisateur dans l'historique des conversations.

  • Préfixe AI : il s'agit du préfixe utilisé pour identifier les messages renvoyés par le modèle AI dans l'historique des conversations.

Configuration de l'invite de désambiguïsation

Cette section vous permet de configurer le comportement et le modèle pour désambiguïser les entrées utilisateur avant de les envoyer à la base de connaissances configurée.

  • Activer la désambiguïsation : cette option détermine si les entrées utilisateur doivent être désambiguïsées avant d'être envoyées à la base de connaissances.

  • Modèle d'invite de désambiguïsation : il s'agit du modèle d'invite utilisé pour lever l'ambiguïté des saisies par les utilisateurs lorsqu'ils sont connectés à une base de connaissances. Le résultat généré à partir de cette invite sera utilisé comme requête envoyée à la base de connaissances. La désactivation de la désambiguïsation entraînerait l'envoi de la requête brute de l'utilisateur à la base de connaissances sans modification.

Par exemple, lorsque la désambiguïsation est activée, une demande de suivi de l'utilisateur intitulée « Combien ça coûte ? » pourrait être désambiguïsé en « Combien coûte le renouvellement de ma plaque d'immatriculation ? » , ce qui permet d'améliorer la requête de recherche.