Configurer les filtres de contenu pour Amazon Bedrock Guardrails - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configurer les filtres de contenu pour Amazon Bedrock Guardrails

Avec Amazon Bedrock Guardrails, vous pouvez configurer des filtres de contenu pour bloquer les demandes et les réponses des modèles en langage naturel pour le texte et les images contenant du contenu préjudiciable. Par exemple, un site de commerce électronique peut concevoir son assistant en ligne de manière à éviter d'utiliser un langage et/ou des images inappropriés.

Niveaux de classification et de blocage des filtres

Le filtrage est effectué sur la base d'une classification de confiance des entrées utilisateur et des réponses FM dans chacune des six catégories. Toutes les entrées utilisateur et les réponses FM sont classées selon quatre niveaux de force : NONELOW,MEDIUM, etHIGH. Par exemple, si une déclaration est classée comme haineuse en HIGH toute confiance, il est fort probable que cette déclaration représente un contenu haineux. Une seule déclaration peut être classée dans plusieurs catégories avec différents niveaux de confiance. Par exemple, une seule déclaration peut être classée dans les catégories suivantes : haine HIGH en toute confiance, insultes avec LOW assurance, relations sexuelles avec NONE et violence MEDIUM en toute confiance.

Résistance du filtre

Vous pouvez configurer la puissance des filtres pour chacune des catégories de filtres de contenu. La puissance du filtre détermine la sensibilité du filtrage des contenus nocifs. À mesure que la puissance du filtre augmente, la probabilité de filtrer le contenu préjudiciable augmente et la probabilité de voir du contenu nuisible dans votre application diminue.

Vous disposez de quatre niveaux d'intensité du filtre

  • Aucun — Aucun filtre de contenu n'est appliqué. Toutes les entrées utilisateur et les sorties générées par FM sont autorisées.

  • Faible — La résistance du filtre est faible. Le contenu classé comme dangereux en HIGH toute confiance sera filtré. Le contenu classé comme dangereux ou MEDIUM confidentiel sera autorisé. NONE LOW

  • Moyen — Le contenu classé comme dangereux HIGH et digne de MEDIUM confiance sera filtré. Le contenu classé comme dangereux NONE ou LOW confidentiel sera autorisé.

  • Élevé : il s'agit de la configuration de filtrage la plus stricte. Le contenu classé comme dangereux MEDIUM et LOW confidentiel sera filtré. HIGH Le contenu jugé inoffensif sera autorisé.

Résistance du filtre Confiance en matière de contenu bloqué Confiance autorisée dans le contenu
Aucun Pas de filtrage Aucun, faible, moyen, élevé
Faible Élevé Aucun, faible, moyen
Moyen Élevé, moyen Aucun, faible
Élevé Haut, moyen, faible Aucun