本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用单词筛选条件从对话中删除特定的单词和短语
Amazon Bedrock 护栏提供了单词筛选条件,您可以使用这些筛选条件来阻止输入提示和模型响应中的单词和短语(完全匹配)。您可以使用以下单词筛选条件来屏蔽亵渎性内容、冒犯性内容或不当内容,或者提及竞争对手或产品名称的内容。
-
亵渎性内容筛选条件 – 启用这一功能来屏蔽亵渎性字词。亵渎性内容列表基于常规的亵渎性内容定义制定,并且会不断更新。
-
自定义单词过滤器-使用最多三个单词向列表中AWS 管理控制台添加自定义单词和短语。您最多可以向自定义单词筛选条件中添加 10,000 个项目。
您可以通过以下选项,使用 Amazon Bedrock AWS 管理控制台添加单词和短语:
-
在文本编辑器中手动添加。
-
上传 .txt 或 .csv 文件。
-
从 Amazon S3 存储桶上传对象。
注意
您只能使用上传文档和对象AWS 管理控制台。API 和 SDK 操作仅支持文本,不支持上传文档和对象。
-
为护栏配置单词策略
您可以使用或 AWS 管理控制台 Amazon Bedrock API 为护栏配置文字政策。
- Console
-
使用有权使用 Amazon Bedrock 控制台的 IAM 身份登录。AWS 管理控制台然后,在 https://console.aws.amazon.com/
bedrock 上打开 Amazon Bedrock 控制台。 -
从左侧导航栏中,选择护栏,然后选择创建护栏。
-
对于提供护栏详细信息页面,执行以下操作:
-
在护栏详细信息部分,提供护栏的名称和(可选的)描述。
-
对于针对阻止的提示显示的消息,输入一条将在应用护栏时显示的消息。选中对回应应用相同的阻止消息复选框,以便在对响应应用您的护栏时使用相同的消息。
-
(可选)要为护栏启用跨区域推理,请展开跨区域推理,然后选择为护栏启用跨区域推理。选择一个护栏配置文件,该配置文件定义了AWS 区域可以路由护栏推理请求的目的地。
-
(可选)默认情况下,您的护栏使用加密。AWS 托管式密钥要使用您自己的客户自主管理型 KMS 密钥,请展开 KMS 密钥选择,然后选中自定义加密设置(高级)复选框。
您可以选择现有AWS KMS密钥或选择创建AWS KMS密钥来创建新密钥。
-
(可选)要向护栏添加标签,请展开标签,然后为您定义的每个标签选择添加新标签。
有关更多信息,请参阅 标记 Amazon Bedrock 资源。
-
选择下一步。
-
-
在添加单词筛选条件页面上,执行以下操作:
-
选择筛选不雅词以阻止提示和响应中的不雅词。亵渎性内容清单是基于传统定义制定的,并且会不断更新。
-
对于添加自定义单词和短语,选择如何为护栏添加要阻止的单词和短语。如果上传单词文件,则文件中的每一行应包含一个单词或一个由最多三个单词组成的短语。不要添加标题。您有以下选项:
Option 说明 手动添加单词和短语 在查看和编辑单词与短语部分直接添加单词和短语。 从本地文件上传 选择此选项后,通过选择选择文件来上传包含单词和短语的 .txt 或 .csv 文件。 从 Amazon S3 对象上传 从 S3 存储桶上传对象。 -
在查看和编辑单词与短语部分,编辑护栏要阻止的单词和短语。您有以下选项:
-
如果您从本地文件或 Amazon S3 对象上传了单词列表,则此部分将填充您的单词列表。要筛选有错误的项目,请选择显示错误。
-
要向单词列表中添加项目,请选择添加单词或短语。在框中输入一个单词或最多包含三个单词的短语,然后按 Enter 键或选中复选标记图标以确认该项目。
-
要编辑项目,请选择该项目旁边的“编辑”图标(
)。 -
要从单词列表中删除项目,请选择“垃圾桶”图标(
),或者,如果在编辑项目,请选择该项目旁边的“删除”图标(
)。 -
要删除包含错误的项目,请选择全部删除,然后选择删除所有有错误的行。
-
要删除所有项目,请选择全部删除,然后选择删除所有行。
-
要搜索项目,请在搜索栏中输入表达式。
-
要仅显示有错误的项目,请选择标有全部显示的下拉菜单,然后选择仅显示错误。
-
要配置表格中每页的大小或表格中显示的列,请选择“设置”图标(
)。设置您的首选项,然后选择确认。 -
默认情况下,此部分显示表格编辑器。要切换到可以在每行中输入单词或短语的文本编辑器,请选择文本编辑器。文本编辑器提供以下功能:
-
您可以从其他文本编辑器中复制单词列表并将其粘贴到该编辑器中。
-
包含错误的项目旁边会出现一个红色 X 图标,错误列表出现在编辑器下方。
-
-
-
选择下一步可根据需要配置其他策略,或者选择跳至“审查”并创建以完成护栏的创建。
-
查看护栏的设置。
-
在要对其进行更改的任何部分,选择编辑。
-
配置完策略后,选择创建以创建护栏。
-
-
- API
-
要使用文字策略创建护栏,请发送请求。CreateGuardrail请求的格式如下:
POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "wordPolicyConfig": { "managedWordListsConfig": [ { "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "PROFANITY" }, ], "wordsConfig": [{ "text": "string", "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }-
在
name和description字段分别为护栏指定名称和描述。 -
在
blockedInputMessaging和blockedOutputsMessaging字段中指定护栏成功阻止提示或模型响应时显示的消息。 -
在
wordPolicyConfig对象中配置单词策略:-
使用
managedWordListsConfig来配置预定义的不雅词列表。 -
使用
wordsConfig数组来指定要筛选的自定义单词和短语:-
在
text字段中指定要筛选的单词和短语。 -
(可选)使用
inputAction(在提示中)和outputAction(在响应中)指定检测到该单词时要执行的操作。选择BLOCK以阻止内容并替换为被阻止时显示的消息,或选择NONE,不执行任何操作而只返回检测信息。 -
(可选)使用
inputEnabled和outputEnabled控制是否为输入和输出启用护栏评估。
-
-
-
(可选)向护栏附加任何标签。有关更多信息,请参阅 标记 Amazon Bedrock 资源。
-
(可选)为了安全起见,请在
kmsKeyId字段中包含 KMS 密钥的 ARN。 -
(可选)要启用跨区域推理,请在
crossRegionConfig对象中指定护栏配置文件。
响应的格式如下:
HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" } -