Bloquez les sujets refusés pour aider à supprimer le contenu préjudiciable - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Bloquez les sujets refusés pour aider à supprimer le contenu préjudiciable

Vous pouvez spécifier un ensemble de sujets refusés dans un garde-corps qui ne sont pas souhaitables dans le contexte de votre application d'IA générative. Par exemple, une banque peut souhaiter que son assistant intelligent évite les conversations liées aux conseils d'investissement ou aux cryptomonnaies.

Les suggestions et réponses du modèle en langage naturel sont évaluées par rapport à chaque sujet refusé dans votre garde-fou. Si l'un des sujets refusés est détecté, votre garde-corps renvoie un message bloqué.

Créez un sujet refusé avec les paramètres suivants, que votre garde-corps utilise pour détecter si une invite ou une réponse appartient au sujet :

  • Nom : nom du sujet. Le nom doit être un nom ou une phrase. Ne décrivez pas le sujet dans le nom. Par exemple :

    • Investment Advice

  • Définition — Jusqu'à 200 caractères résumant le contenu du sujet. La définition doit décrire le contenu du sujet et de ses sous-thèmes.

    Voici un exemple de définition de rubrique que vous pouvez fournir :

    Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.

  • Exemples de phrases (facultatif) : liste de cinq exemples de phrases au maximum faisant référence au sujet. Chaque phrase peut comporter jusqu'à 100 caractères. Un exemple est une invite ou une suite qui indique le type de contenu à filtrer. Par exemple :

    • Is investing in the stocks better than bonds?

    • Should I invest in gold?

Bonnes pratiques pour créer des sujets refusés

  • Définissez le sujet de manière claire et précise. Une définition claire et sans ambiguïté du sujet peut améliorer la précision de la détection du sujet. Par exemple, un sujet destiné à détecter les requêtes ou les instructions associées aux cryptomonnaies peut être défini comme suitQuestion or information associated with investing, selling, transacting, or procuring cryptocurrencies.

  • N'incluez pas d'exemples ni d'instructions dans la définition de la rubrique. Par exemple, Block all contents associated to cryptocurrency il s'agit d'une instruction et non d'une définition du sujet. De telles instructions ne doivent pas être utilisées dans le cadre des définitions du sujet.

  • Ne définissez pas de sujets négatifs ou d'exceptions. Par exemple, All contents except medical information ou Contents not containing medical information sont des définitions négatives d'un sujet et ne doivent pas être utilisées.

  • N'utilisez pas de sujets refusés pour capturer des entités ou des mots. Par exemple, Statement or questions containing the name of a person "X" ou Statements with a competitor name Y. Les définitions de sujets représentent un thème ou un sujet et guardrails évalue une entrée de manière contextuelle. Le filtrage par sujet ne doit pas être utilisé pour capturer des mots individuels ou des types d'entités. Pour plus d'informationsSupprimer les informations personnelles des conversations en utilisant des filtres d'informations sensibles, consultez ou Supprimer une liste spécifique de mots et d'expressions des conversations à l'aide de filtres de mots pour ces cas d'utilisation.

Ajoutez des sujets refusés à votre garde-fou

Vous pouvez ajouter jusqu'à 30 sujets refusés à votre garde-fou à l'aide de l'API AWS Management Console Amazon Bedrock.

Console
  1. Connectez-vous au AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ouvrez ensuite la console Amazon Bedrock à https://console.aws.amazon.com/bedrock/l'adresse.

  2. Dans le volet de navigation de gauche, choisissez Gardrails, puis choisissez Créer un garde-corps.

  3. Pour la page Fournir des informations détaillées sur le garde-corps, procédez comme suit :

    1. Dans la section Détails du garde-corps, indiquez un nom et une description facultative pour le garde-corps.

    2. Dans Messagerie pour les invites bloquées, entrez un message qui s'affiche lorsque votre garde-corps est appliqué. Cochez la case Appliquer le même message bloqué pour les réponses pour utiliser le même message lorsque votre garde-fou est appliqué à la réponse.

    3. (Facultatif) Pour activer l'inférence entre régions pour votre garde-corps, développez l'inférence entre régions, puis sélectionnez Activer l'inférence entre régions pour votre garde-corps. Choisissez un profil de garde-corps qui définit la destination vers Régions AWS laquelle les demandes d'inférence de garde-corps peuvent être acheminées.

    4. (Facultatif) Par défaut, votre garde-corps est chiffré avec un. Clé gérée par AWS Pour utiliser votre propre clé KMS gérée par le client, élargissez la sélection de clés KMS et cochez la case Personnaliser les paramètres de chiffrement (avancés).

      Vous pouvez sélectionner une AWS KMS clé existante ou sélectionner Créer une AWS KMS clé pour en créer une nouvelle.

    5. (Facultatif) Pour ajouter des balises à votre garde-corps, développez Tags, puis sélectionnez Ajouter une nouvelle balise pour chaque balise que vous définissez.

      Pour de plus amples informations, veuillez consulter Marquer les ressources Amazon Bedrock.

    6. Choisissez Suivant.

  4. Lorsque vous arrivez sur la page Ajouter des sujets refusés, choisissez Ajouter un sujet refusé et procédez comme suit :

    1. Entrez un Nom pour la rubrique.

    2. Dans le champ Définition, définissez le sujet. Pour obtenir des instructions sur la façon de définir un sujet refusé, consultezBloquez les sujets refusés pour aider à supprimer le contenu préjudiciable.

    3. (Facultatif) Pour la saisie, spécifiez si l'évaluation du garde-corps est activée pour les instructions du modèle. Si cette option est activée, choisissez l'action que vous souhaitez utiliser comme garde-corps. Le blocage est activé par défaut. Pour de plus amples informations, veuillez consulter Options de gestion des contenus dangereux détectés par Amazon Bedrock Guardrails.

    4. (Facultatif) Pour Output, spécifiez si l'évaluation du garde-corps est activée pour les réponses du modèle. Si cette option est activée, choisissez l'action que vous souhaitez que votre garde-corps exécute sur les réponses. Le blocage est activé par défaut. Pour de plus amples informations, veuillez consulter Options de gestion des contenus dangereux détectés par Amazon Bedrock Guardrails.

    5. (Facultatif) Développez Ajoutez des exemples de phrases et entrez une phrase représentative des invites ou des réponses liées à cette rubrique. Vous pouvez saisir jusqu'à cinq phrases. Pour chaque phrase que vous incluez, sélectionnez Ajouter une phrase.

    6. Pour le niveau Sujets refusés, choisissez le niveau de protection que vous souhaitez que votre garde-corps utilise pour bloquer les sujets dans les invites et les réponses. Pour de plus amples informations, veuillez consulter Politiques de protection des niveaux pour les garde-fous.

    7. Lorsque vous avez terminé de configurer le sujet refusé, sélectionnez Confirmer.

    8. Répétez les étapes précédentes pour créer des sujets refusés supplémentaires.

    9. Choisissez Suivant pour configurer d'autres politiques selon vos besoins ou passez directement à la révision et à la création pour terminer la création de votre garde-corps.

  5. Vérifiez les paramètres de votre garde-corps.

    1. Sélectionnez Modifier dans la section à laquelle vous souhaitez apporter des modifications.

    2. Lorsque vous avez terminé de configurer les politiques, sélectionnez Créer pour créer le garde-corps.

API

Ajoutez des sujets refusés à votre garde-fou en envoyant une CreateGuardraildemande. Voici à quoi ressemble le format de demande :

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "inputAction": "BLOCK | NONE", "inputEnabled": true, "name": "string", "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "DENY" }, "tierConfig": { "tierName": "CLASSIC | STANDARD" }, ] }, "crossRegionConfig": { "guardrailProfileIdentifier": "string" }, "description": "string", "name": "string" }
  • Spécifiez les messages lorsque le garde-corps bloque avec succès une invite ou un modèle de réponse dans les champs blockedInputMessaging etblockedOutputsMessaging.

  • Spécifiez les sujets que le garde-corps doit refuser dans l'topicPolicyConfigobjet. Chaque élément de la topicsConfig liste se rapporte à un sujet.

    • Spécifiez un name et definition pour le sujet qui doit être refusé.

    • Spécifiez DENY dans le type champ.

    • Spécifiez l'action à effectuer lorsque le sujet est détecté dans les invites inputAction ou les réponses à l'aide de. outputAction Choisissez BLOCK de bloquer le contenu et de le remplacer par un message bloqué, ou NONE de ne rien faire mais de renvoyer les informations de détection. Pour de plus amples informations, veuillez consulter Options de gestion des contenus dangereux détectés par Amazon Bedrock Guardrails.

    • Définissez inputEnabled et contrôlez si outputEnabled l'évaluation du garde-corps est activée pour les instructions et les réponses du modèle.

    • (Facultatif) Dans la examples liste, spécifiez jusqu'à cinq exemples de phrases représentatifs des invites ou des réponses liées à cette rubrique.

  • (Facultatif) Spécifiez un niveau de protection pour votre garde-corps dans l'tierConfigobjet. Les options incluent STANDARD et les CLASSIC niveaux.

    Pour de plus amples informations, veuillez consulter Politiques de protection des niveaux pour les garde-fous.

  • (Facultatif) Pour activer l'inférence entre régions, spécifiez un profil de garde-corps dans l'objet. crossRegionConfig Cela est obligatoire lors de l'utilisation du STANDARD niveau.

  • Spécifiez un name et description pour le garde-corps.

Le format de réponse est le suivant :

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }