使用单词筛选条件从对话中删除特定的单词和短语 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用单词筛选条件从对话中删除特定的单词和短语

Amazon Bedrock Guardrails 有单词过滤器,你可以用它来屏蔽输入提示和模型响应中的单词和短语(完全匹配)。您可以使用以下单词筛选条件来屏蔽亵渎性内容、冒犯性内容或不当内容,或者提及竞争对手或产品名称的内容。

  • 亵渎性内容筛选条件 – 启用这一功能来屏蔽亵渎性字词。亵渎性内容列表基于常规的亵渎性内容定义制定,并且会不断更新。

  • 自定义单词过滤器-使用最多三个单词向列表中 AWS Management Console 添加自定义单词和短语。您最多可以向自定义单词筛选条件中添加 10,000 个项目。

    您可以通过以下选项使用 Amazon Bedrock AWS Management Console添加单词和短语:

    • 在文本编辑器中手动添加。

    • 上传 .txt 或 .csv 文件。

    • 从 Amazon S3 存储桶上传对象。

    注意

    您只能使用上传文档和对象 AWS Management Console。API 和 SDK 操作仅支持文本,不支持上传文档和对象。

为护栏配置文字政策

您可以使用或 AWS Management Console Amazon Bedrock API 为护栏配置文字政策。

Console
  1. AWS Management Console 使用具有 Amazon Bedrock 权限的 IAM 角色登录,然后通过以下网址打开 Amazon Bedrock 控制台。https://console.aws.amazon.com/bedrock/

  2. 从左侧导航窗格中选择 Guardrails,然后选择创建护栏

  3. 对于提供护栏详细信息页面,请执行以下操作:

    1. 防护机制详细信息部分,提供防护机制的名称和(可选的)描述

    2. 对于已屏蔽提示的消息,请输入在安装护栏时显示的消息。选中 “对回复应用相同的屏蔽消息” 复选框,以便在对响应应用防护栏时使用相同的消息。

    3. (可选)要为护栏启用跨区域推理,请展开跨区域推理,然后为您的护栏选择启用跨区域推理。选择一个护栏配置文件,该配置文件定义了 AWS 区域 可以路由护栏推理请求的目的地。

    4. (可选)默认情况下,您的护栏使用加密。 AWS 托管式密钥要使用您自己的客户管理的 KMS 密钥,请展开 KMS 密钥选择并选中 “自定义加密设置(高级)” 复选框。

      您可以选择现有 AWS KMS 密钥或选择创建 AWS KMS 密钥来创建新密钥。

    5. (可选)要向护栏添加标签,请展开标签,然后为您定义的每个标签选择添加新标签。

      有关更多信息,请参阅 标记 Amazon Bedrock 资源

    6. 选择下一步

  4. 在 “添加单词过滤器” 页面上,执行以下操作:

    1. 选择 “筛选亵渎内容” 以屏蔽提示和回复中的亵渎内容。亵渎性内容清单是基于传统定义制定的,并且会不断更新。

    2. 在 “添加自定义单词和短语” 中,选择如何添加要屏蔽的单词和短语。如果您上传单词文件,则文件中的每行应包含一个单词或一个最多包含三个单词的短语。不要添加标题。您有以下选项:

      选项 说明
      手动添加单词和短语 查看和编辑单词与短语部分直接添加单词和短语。
      从本地文件上传 选择此选项后,选择 “选择文件”,即可上传包含单词和短语的.txt 或.csv 文件
      从 Amazon S3 对象上传 从 S3 存储桶上传对象。
    3. 在 “查看和编辑单词和短语” 部分编辑要屏蔽的单词和短语。您有以下选项:

      • 如果您从本地文件或 Amazon S3 对象上传了单词列表,则此部分将填充您的单词列表。要筛选有错误的项目,请选择显示错误

      • 要向单词列表中添加项目,请选择添加单词或短语。在框中输入一个单词或最多包含三个单词的短语,然后按 Enter 键或选中复选标记图标以确认该项目。

      • 要编辑项目,请选择该项目旁边的“编辑”图标( Edit icon represented by a pencil symbol. )。

      • 要从单词列表中删除项目,请选择“垃圾桶”图标( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ),或者,如果在编辑项目,请选择该项目旁边的“删除”图标( Close or cancel icon represented by an "X" symbol. )。

      • 要删除包含错误的项目,请选择全部删除,然后选择删除所有有错误的行

      • 要删除所有项目,请选择全部删除,然后选择删除所有行

      • 要搜索项目,请在搜索栏中输入表达式。

      • 要仅显示有错误的项目,请选择标有全部显示的下拉菜单,然后选择仅显示错误

      • 要配置表格中每页的大小或表格中显示的列,请选择“设置”图标( Gear icon representing settings or configuration options. )。设置您的首选项,然后选择确认

      • 默认情况下,此部分显示表格编辑器。要切换到可以在每行中输入单词或短语的文本编辑器,请选择文本编辑器文本编辑器提供以下功能:

        • 您可以从其他文本编辑器中复制单词列表并将其粘贴到该编辑器中。

        • 包含错误的项目旁边会出现一个红色 X 图标,错误列表出现在编辑器下方。

    4. 选择 “下一步” 根据需要配置其他策略,或者选择 “跳至查看并创建” 以完成护栏的创建。

    5. 查看护栏的设置。

      1. 在要对其进行更改的任何部分,选择编辑

      2. 配置完策略后,选择 “创建” 以创建护栏。

API

要使用文字策略创建护栏,请发送请求。CreateGuardrail请求的格式如下:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "wordPolicyConfig": { "managedWordListsConfig": [ { "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "PROFANITY" }, ], "wordsConfig": [{ "text": "string", "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }
  • namedescription 字段分别为防护机制指定名称和描述。

  • blockedInputMessagingblockedOutputsMessaging 字段中指定防护机制成功阻止提示或模型响应时显示的消息。

  • wordPolicyConfig对象中配置字词策略:

    • managedWordListsConfig用于配置预定义的亵渎词语列表。

    • 使用wordsConfig数组指定要筛选的自定义单词和短语:

      • text字段中指定要筛选的单词和短语。

      • (可选)指定在使用inputAction或使用响应的提示中检测到单词时要采取的操作outputAction。选择屏蔽内容并替换BLOCK为已屏蔽的消息,或者选择不NONE采取任何措施只返回检测信息。

      • (可选)使用inputEnabledoutputEnabled控制是否为输入和输出启用护栏评估。

  • (可选)向防护机制附加任何标签。有关更多信息,请参阅 标记 Amazon Bedrock 资源

  • (可选)为了安全起见,请在 kmsKeyId 字段中包含 KMS 密钥的 ARN。

  • (可选)要启用跨区域推理,请在对象中指定护栏配置文件。crossRegionConfig

响应的格式如下:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }