Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Configurer les filtres de contenu pour Amazon Bedrock Guardrails
Avec Amazon Bedrock Guardrails, vous pouvez configurer des filtres de contenu pour bloquer les demandes et les réponses des modèles en langage naturel pour le texte et les images contenant du contenu préjudiciable. Par exemple, un site de commerce électronique peut concevoir son assistant en ligne de manière à éviter d'utiliser un langage et/ou des images inappropriés.
Niveaux de classification et de blocage des filtres
Le filtrage est effectué sur la base d'une classification de confiance des entrées utilisateur et des réponses FM dans chacune des six catégories. Toutes les entrées utilisateur et les réponses FM sont classées selon quatre niveaux de force : NONE
LOW
,MEDIUM
, etHIGH
. Par exemple, si une déclaration est classée comme haineuse en HIGH
toute confiance, il est fort probable que cette déclaration représente un contenu haineux. Une seule déclaration peut être classée dans plusieurs catégories avec différents niveaux de confiance. Par exemple, une seule déclaration peut être classée dans les catégories suivantes : haine HIGH
en toute confiance, insultes avec LOW
assurance, relations sexuelles avec NONE
et violence MEDIUM
en toute confiance.
Résistance du filtre
Vous pouvez configurer la puissance des filtres pour chacune des catégories de filtres de contenu. La puissance du filtre détermine la sensibilité du filtrage des contenus nocifs. À mesure que la puissance du filtre augmente, la probabilité de filtrer le contenu préjudiciable augmente et la probabilité de voir du contenu nuisible dans votre application diminue.
Vous disposez de quatre niveaux d'intensité du filtre
-
Aucun — Aucun filtre de contenu n'est appliqué. Toutes les entrées utilisateur et les sorties générées par FM sont autorisées.
-
Faible — La résistance du filtre est faible. Le contenu classé comme dangereux en
HIGH
toute confiance sera filtré. Le contenu classé comme dangereux ouMEDIUM
confidentiel sera autorisé.NONE
LOW
-
Moyen — Le contenu classé comme dangereux
HIGH
et digne deMEDIUM
confiance sera filtré. Le contenu classé comme dangereuxNONE
ouLOW
confidentiel sera autorisé. -
Élevé : il s'agit de la configuration de filtrage la plus stricte. Le contenu classé comme dangereux
MEDIUM
etLOW
confidentiel sera filtré.HIGH
Le contenu jugé inoffensif sera autorisé.
Résistance du filtre | Confiance en matière de contenu bloqué | Confiance autorisée dans le contenu |
---|---|---|
Aucun | Pas de filtrage | Aucun, faible, moyen, élevé |
Faible | Élevé | Aucun, faible, moyen |
Moyen | Élevé, moyen | Aucun, faible |
Élevé | Haut, moyen, faible | Aucun |