Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Créez votre garde-corps
Amazon Bedrock Guardrails consiste en un ensemble de différentes politiques de filtrage que vous pouvez configurer pour éviter les contenus indésirables et dangereux et pour supprimer ou masquer les informations sensibles afin de protéger la confidentialité.
Vous pouvez configurer les politiques suivantes dans un garde-corps :
Filtres de contenu : vous pouvez configurer des seuils pour bloquer les invites de saisie ou modéliser les réponses en langage naturel pour le texte et séparément pour les images contenant du contenu préjudiciable tel que : haine, insultes, violences sexuelles, violences, inconduites (y compris activités criminelles) et attaques rapides (injection rapide et jailbreaks). Par exemple, un site de commerce électronique peut concevoir son assistant en ligne de manière à éviter d'utiliser and/or des images de langage inappropriées telles que la haine ou la violence.
-
Attaques rapides : peut vous aider à détecter et à filtrer les attaques rapides et les injections rapides. Permet de détecter les invites destinées à contourner la modération, à annuler les instructions ou à générer du contenu préjudiciable.
Sujets refusés : vous pouvez définir un ensemble de sujets à éviter dans votre application d'IA générative. Par exemple, une application d'assistant bancaire peut être conçue pour éviter les sujets liés aux conseils d'investissement illégaux.
Filtres de mots : vous pouvez configurer un ensemble de mots ou d'expressions personnalisés (correspondance exacte) que vous souhaitez détecter et bloquer lors de l'interaction entre vos utilisateurs et les applications d'IA générative. Par exemple, vous pouvez détecter et bloquer les grossièretés ainsi que les mots personnalisés spécifiques tels que les noms de concurrents ou d'autres mots offensants.
Filtres d'informations sensibles : peuvent vous aider à détecter les contenus sensibles tels que les informations personnelles identifiables (PII) dans des formats standard ou des entités regex personnalisées dans les entrées utilisateur et les réponses FM. Selon le cas d'utilisation, vous pouvez rejeter les entrées contenant des informations sensibles ou les supprimer dans les réponses FM. Par exemple, vous pouvez supprimer les informations personnelles des utilisateurs tout en générant des résumés à partir des transcriptions de conversations entre clients et agents.
Vérification contextuelle des fondements : peut vous aider à détecter et à filtrer les hallucinations dans les réponses du modèle si elles ne sont pas fondées (inexactes sur le plan factuel ou ajout de nouvelles informations) dans les informations source ou si elles ne sont pas pertinentes pour la requête de l'utilisateur. Par exemple, vous pouvez bloquer ou marquer les réponses dans les applications RAG (génération augmentée par extraction), si les réponses du modèle s'écartent des informations contenues dans les passages extraits ou ne répondent pas à la question de l'utilisateur.
Note
Tout le contenu bloqué conformément aux politiques ci-dessus apparaîtra sous forme de texte brut dans les journaux d'invocation du modèle Amazon Bedrock, si vous les avez activés. Vous pouvez désactiver les journaux d'invocation d'Amazon Bedrock si vous ne souhaitez pas que le contenu bloqué apparaisse sous forme de texte brut dans les journaux.
Un garde-corps doit contenir au moins un filtre et un message lorsque les invites et les réponses des utilisateurs sont bloquées. Vous pouvez choisir d'utiliser la messagerie par défaut. Vous pouvez ajouter des filtres et effectuer une itération sur votre garde-corps ultérieurement en suivant les étapes décrites dans. Modifiez votre rambarde