Création d’une barrière de protection
Les barrières de protection Amazon Bedrock consistent en une collection de politiques de filtrage différentes que vous pouvez configurer pour éviter les contenus indésirables et préjudiciables, et pour supprimer ou masquer les informations sensibles afin de protéger la confidentialité.
Vous pouvez configurer les politiques suivantes dans un barrière de protection :
Filtres de contenu : vous pouvez configurer des seuils pour bloquer les invites d’entrée ou les réponses du modèle en langage naturel pour le texte et séparément pour les images contenant du contenu préjudiciable tel que : haine, insultes, sexe, violences, inconduites (y compris activités criminelles) et attaques d’invites (injection d’invite et débridage). Par exemple, un site de commerce électronique peut concevoir son assistant en ligne de manière à éviter l’utilisation d’images et/ou de langage inappropriés, comme ceux contenant de la haine ou de la violence.
-
Attaques d’invites : peut vous aider à détecter et à filtrer les attaques et les injections d’invites. Permet de détecter les invites destinées à contourner la modération, à remplacer les instructions ou à générer du contenu préjudiciable.
Sujets refusés : vous pouvez définir un ensemble de sujets à éviter dans votre application d’IA générative. Par exemple, une application d’assistant bancaire peut être conçue pour éviter les sujets liés aux conseils d’investissements illégaux.
Filtres de mots : vous pouvez configurer un ensemble de mots ou d’expressions personnalisés (correspondance exacte) que vous souhaitez détecter et bloquer lors de l’interaction entre les utilisateurs et les applications d’IA générative. Par exemple, vous pouvez détecter et bloquer les grossièretés ainsi que des mots personnalisés spécifiques tels que les noms de concurrents, ou d’autres mots offensants.
Filtres d’informations sensibles : peuvent vous aider à détecter les contenus sensibles tels que les données d’identification personnelle (PII) dans des formats standard ou des entités personnalisées basées sur des expressions régulières (regex), présents dans les entrées utilisateur et les réponses du modèle de fondation. Selon le cas d’utilisation, vous pouvez rejeter les entrées contenant des informations sensibles ou les supprimer dans les réponses du modèle de fondation. Par exemple, vous pouvez retirer les informations personnelles des utilisateurs tout en générant des résumés à partir des transcriptions de conversations avec les clients et les agents.
Contrôles d’ancrage contextuel : peuvent vous aider à détecter et à filtrer les hallucinations dans les réponses du modèle quand elles ne sont pas ancrées (inexactes sur le plan factuel ou ajout de nouvelles informations) dans les informations source ou si elles ne sont pas pertinentes pour la requête utilisateur. Par exemple, vous pouvez bloquer ou marquer les réponses dans les applications RAG (génération à enrichissement contextuel), si les réponses du modèle s’écartent des informations contenues dans les passages récupérés ou ne répondent pas à la question de l’utilisateur.
Vérification du raisonnement automatisé : peuvent vous aider à vérifier que les réponses du modèle respectent les règles logiques et les politiques que vous définissez. Vous pouvez créer des politiques en langage naturel qui spécifient les exigences de raisonnement, et la barrière de protection garde-fou évaluera si les sorties du modèle sont conformes à ces contraintes logiques. Par exemple, vous pouvez vous assurer qu’un chatbot de service client recommande uniquement les produits réellement disponibles en stock, ou vérifier que les conseils financiers respectent les règles de conformité réglementaires.
Note
Tout le contenu bloqué conformément aux politiques ci-dessus apparaît sous forme de texte brut dans les journaux d’invocation du modèle Amazon Bedrock, si vous les avez activés. Vous pouvez désactiver les journaux d’invocation Amazon Bedrock si vous ne souhaitez pas que le contenu bloqué apparaisse sous forme de texte brut dans les journaux.
Un barrière de protection doit contenir au moins un filtre et un message lorsque les invites et les réponses utilisateurs sont bloquées. Vous pouvez choisir d’utiliser le message par défaut. Vous pouvez ajouter des filtres et effectuer une itération sur votre barrière de protection ultérieurement en suivant les étapes décrites dans Modification d’une barrière de protection.