Niveaux de classification et de blocage des filtres Intensité du filtre

Configuration des filtres de contenu pour barrières de protection Amazon Bedrock

Avec les barrières de protection Amazon Bedrock, vous pouvez configurer des filtres de contenu pour bloquer les invites et les réponses du modèle en langage naturel pour le texte et les images contenant du contenu préjudiciable. Par exemple, un site d’e-commerce peut concevoir son assistant en ligne de manière à éviter d’utiliser un langage et/ou des images inappropriés.

Niveaux de classification et de blocage des filtres

Le filtrage est effectué sur la base d’une classification de confiance des entrées utilisateur et des réponses FM dans chacune des six catégories. Toutes les entrées utilisateur et les réponses FM sont classées selon quatre niveaux d’intensité : NONE, LOW, MEDIUM et HIGH. Par exemple, si une déclaration est classée comme haineuse avec une confiance HIGH, il est fort probable que cette déclaration représente un contenu haineux. Une seule déclaration peut être classée dans plusieurs catégories avec différents niveaux de confiance. Par exemple, une seule déclaration peut être classée dans les catégories suivantes : Haine avec confiance HIGH, Insultes avec confiance LOW, Sexuel avec confiance NONE et Violence avec confiance MEDIUM.

Intensité du filtre

Vous pouvez configurer l’intensité des filtres pour chacune des catégories de filtres de contenu. L’intensité du filtre détermine la sensibilité du filtrage des contenus préjudiciables. À mesure que l’intensité du filtre augmente, la probabilité de filtrer le contenu préjudiciable augmente et la probabilité de voir du contenu préjudiciable dans votre application diminue.

Vous disposez de quatre niveaux d’intensité du filtre

Aucune : aucun filtre de contenu n’est appliqué. Toutes les entrées et FM-generated sorties utilisateur sont autorisées.
Faible : l’intensité du filtre est faible. Le contenu classé comme préjudiciable avec confiance HIGH sera filtré. Le contenu classé comme préjudiciable avec confiance NONE, LOW ou MEDIUM sera autorisé.
Moyenne : le contenu classé comme préjudiciable avec confiance HIGH et MEDIUM sera filtré. Le contenu classé comme préjudiciable avec confiance NONE ou LOW sera autorisé.
Élevée : il s’agit de la configuration de filtrage la plus stricte. Le contenu classé comme préjudiciable avec confiance HIGH, MEDIUM et LOW sera filtré. Le contenu jugé inoffensif sera autorisé.

Intensité du filtre	Confiance du contenu bloqué	Confiance du contenu autorisée
Aucune	Pas de filtrage	Aucune, faible, moyenne, élevée
Faible	Élevée	Aucune, faible, moyenne
Moyenne	Moyenne, élevée	Aucune, faible
Élevée	Élevée, moyenne, faible	Aucune

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Création d’une barrière de protection

Filtres de contenu (texte)