为 Amazon Bedrock Guardrails 配置内容筛选器 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

为 Amazon Bedrock Guardrails 配置内容筛选器

借助 Amazon Bedrock Guardrails,您可以配置内容过滤器,以屏蔽包含有害内容的文本和图像的模型提示和自然语言响应。例如,电子商务网站可以在设计其在线助手时避免使用不恰当的语言和/或图片。

筛选条件分类和阻止级别

筛选是根据用户输入和基础模型响应在六个类别中每一个类别中的置信度分类来完成的。所有用户输入和基础模型响应均按四个强度等级进行分类:NONELOWMEDIUMHIGH。例如,如果某一陈述被归类为置信度为 HIGH 的“仇恨”,则说明该陈述代表仇恨内容的可能性很高。单个陈述可以分为置信度各不相同的多个类别。例如,单个陈述可以归类为置信度为 HIGH仇恨、置信度为 LOW侮辱、置信度为 NONE和置信度为 MEDIUM暴力

筛选强度

您可以为每个内容过滤器类别配置过滤器的强度。筛选强度决定了筛选有害内容的灵敏度。随着筛选强度的提高,筛选掉有害内容的可能性就会增加,在应用程序中看到有害内容的可能性也会降低。

您有四个筛选强度等级

  • – 不应用任何内容筛选条件。允许所有用户输入和基础模型生成的输出。

  • – 筛选强度较低。归类为有害且置信度为 HIGH 的内容将被筛选掉。归类为有害且置信度为 NONELOWMEDIUM 的内容将被筛选掉。

  • – 归类为有害且置信度为 HIGHMEDIUM 的内容将被筛选掉。归类为有害且置信度为 NONELOW 的内容将被允许。

  • – 这表示最严格的筛选配置。归类为有害且置信度为 HIGHMEDIUMLOW 的内容将被筛选掉。被视为无害的内容将被允许。

筛选强度 阻止内容的置信度 允许内容的置信度
“无”筛选 无、低、中、高
无、低、中
中、高 无、低
高、中、低