本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用单词筛选条件从对话中删除特定的单词和短语
Amazon Bedrock Guardrails 有单词过滤器,你可以用它来屏蔽输入提示和模型响应中的单词和短语(完全匹配)。您可以使用以下单词筛选条件来屏蔽亵渎性内容、冒犯性内容或不当内容,或者提及竞争对手或产品名称的内容。
-
亵渎性内容筛选条件 – 启用这一功能来屏蔽亵渎性字词。亵渎性内容列表基于常规的亵渎性内容定义制定,并且会不断更新。
-
自定义单词过滤器-使用最多三个单词向列表中 AWS Management Console 添加自定义单词和短语。您最多可以向自定义单词筛选条件中添加 10,000 个项目。
您可以通过以下选项使用 Amazon Bedrock AWS Management Console添加单词和短语:
-
在文本编辑器中手动添加。
-
上传 .txt 或 .csv 文件。
-
从 Amazon S3 存储桶上传对象。
注意
您只能使用上传文档和对象 AWS Management Console。API 和 SDK 操作仅支持文本,不支持上传文档和对象。
-
为护栏配置文字政策
您可以使用或 AWS Management Console Amazon Bedrock API 为护栏配置文字政策。
- Console
-
AWS Management Console 使用具有 Amazon Bedrock 权限的 IAM 角色登录,然后通过以下网址打开 Amazon Bedrock 控制台。https://console.aws.amazon.com/bedrock/
-
从左侧导航窗格中选择 Guardrails,然后选择创建护栏。
-
对于提供护栏详细信息页面,请执行以下操作:
-
在防护机制详细信息部分,提供防护机制的名称和(可选的)描述。
-
对于已屏蔽提示的消息,请输入在安装护栏时显示的消息。选中 “对回复应用相同的屏蔽消息” 复选框,以便在对响应应用防护栏时使用相同的消息。
-
(可选)要为护栏启用跨区域推理,请展开跨区域推理,然后为您的护栏选择启用跨区域推理。选择一个护栏配置文件,该配置文件定义了 AWS 区域 可以路由护栏推理请求的目的地。
-
(可选)默认情况下,您的护栏使用加密。 AWS 托管式密钥要使用您自己的客户管理的 KMS 密钥,请展开 KMS 密钥选择并选中 “自定义加密设置(高级)” 复选框。
您可以选择现有 AWS KMS 密钥或选择创建 AWS KMS 密钥来创建新密钥。
-
(可选)要向护栏添加标签,请展开标签,然后为您定义的每个标签选择添加新标签。
有关更多信息,请参阅 标记 Amazon Bedrock 资源。
-
选择下一步。
-
-
在 “添加单词过滤器” 页面上,执行以下操作:
-
选择 “筛选亵渎内容” 以屏蔽提示和回复中的亵渎内容。亵渎性内容清单是基于传统定义制定的,并且会不断更新。
-
在 “添加自定义单词和短语” 中,选择如何添加要屏蔽的单词和短语。如果您上传单词文件,则文件中的每行应包含一个单词或一个最多包含三个单词的短语。不要添加标题。您有以下选项:
选项 说明 手动添加单词和短语 在查看和编辑单词与短语部分直接添加单词和短语。 从本地文件上传 选择此选项后,选择 “选择文件”,即可上传包含单词和短语的.txt 或.csv 文件。 从 Amazon S3 对象上传 从 S3 存储桶上传对象。 -
在 “查看和编辑单词和短语” 部分编辑要屏蔽的单词和短语。您有以下选项:
-
如果您从本地文件或 Amazon S3 对象上传了单词列表,则此部分将填充您的单词列表。要筛选有错误的项目,请选择显示错误。
-
要向单词列表中添加项目,请选择添加单词或短语。在框中输入一个单词或最多包含三个单词的短语,然后按 Enter 键或选中复选标记图标以确认该项目。
-
要编辑项目,请选择该项目旁边的“编辑”图标(
)。
-
要从单词列表中删除项目,请选择“垃圾桶”图标(
),或者,如果在编辑项目,请选择该项目旁边的“删除”图标(
)。
-
要删除包含错误的项目,请选择全部删除,然后选择删除所有有错误的行。
-
要删除所有项目,请选择全部删除,然后选择删除所有行。
-
要搜索项目,请在搜索栏中输入表达式。
-
要仅显示有错误的项目,请选择标有全部显示的下拉菜单,然后选择仅显示错误。
-
要配置表格中每页的大小或表格中显示的列,请选择“设置”图标(
)。设置您的首选项,然后选择确认。
-
默认情况下,此部分显示表格编辑器。要切换到可以在每行中输入单词或短语的文本编辑器,请选择文本编辑器。文本编辑器提供以下功能:
-
您可以从其他文本编辑器中复制单词列表并将其粘贴到该编辑器中。
-
包含错误的项目旁边会出现一个红色 X 图标,错误列表出现在编辑器下方。
-
-
-
选择 “下一步” 根据需要配置其他策略,或者选择 “跳至查看并创建” 以完成护栏的创建。
-
查看护栏的设置。
-
在要对其进行更改的任何部分,选择编辑。
-
配置完策略后,选择 “创建” 以创建护栏。
-
-
- API
-
要使用文字策略创建护栏,请发送请求。CreateGuardrail请求的格式如下:
POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "wordPolicyConfig": { "managedWordListsConfig": [ { "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "PROFANITY" }, ], "wordsConfig": [{ "text": "string", "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }
-
在
name
和description
字段分别为防护机制指定名称和描述。 -
在
blockedInputMessaging
和blockedOutputsMessaging
字段中指定防护机制成功阻止提示或模型响应时显示的消息。 -
在
wordPolicyConfig
对象中配置字词策略:-
managedWordListsConfig
用于配置预定义的亵渎词语列表。 -
使用
wordsConfig
数组指定要筛选的自定义单词和短语:-
在
text
字段中指定要筛选的单词和短语。 -
(可选)指定在使用
inputAction
或使用响应的提示中检测到单词时要采取的操作outputAction
。选择屏蔽内容并替换BLOCK
为已屏蔽的消息,或者选择不NONE
采取任何措施只返回检测信息。 -
(可选)使用
inputEnabled
和outputEnabled
控制是否为输入和输出启用护栏评估。
-
-
-
(可选)向防护机制附加任何标签。有关更多信息,请参阅 标记 Amazon Bedrock 资源。
-
(可选)为了安全起见,请在
kmsKeyId
字段中包含 KMS 密钥的 ARN。 -
(可选)要启用跨区域推理,请在对象中指定护栏配置文件。
crossRegionConfig
响应的格式如下:
HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }
-