設定 Amazon Bedrock Guardrails 的內容篩選條件 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定 Amazon Bedrock Guardrails 的內容篩選條件

使用 Amazon Bedrock Guardrails,您可以設定內容篩選條件,針對包含有害內容的文字和影像,以自然語言封鎖模型提示和回應。例如,電子商務網站可以設計其線上助理,以避免使用不適當的語言和/或映像。

篩選分類和封鎖層級

根據六個類別的使用者輸入和 FM 回應的可信度分類進行篩選。所有使用者輸入和 FM 回應都分為四個強度等級:NONEMEDIUMLOWHIGH。例如,如果陳述式可HIGH信地分類為仇恨,則代表仇恨內容的陳述式的可能性很高。單一陳述式可以分類為具有不同可信度層級的多個類別。例如,單一陳述式可以分類為具有HIGH可信度仇恨、具有LOW可信度侮辱、具有 的NONE,以及具有MEDIUM可信度的暴力

篩選條件強度

您可以為每個內容篩選條件類別設定篩選條件的強度。篩選強度決定篩選有害內容的敏感度。隨著篩選強度的增加,篩選有害內容的可能性會增加,而且在應用程式中查看有害內容的可能性也會降低。

您有四個層級的篩選強度

  • — 未套用內容篩選條件。允許所有使用者輸入和 FM 產生的輸出。

  • — 篩選條件的強度很低。分類為有害且具有HIGH可信度的內容將被篩選掉。允許使用 NONELOWMEDIUM可信度分類為有害的內容。

  • — 分類為有害的內容HIGH,且將篩選掉可MEDIUM信度。允許分類為有害且具有 NONELOW 可信度的內容。

  • — 代表最嚴格的篩選組態。分類為有害的內容與 HIGH,將篩選出MEDIUMLOW可信度。將允許視為無害的內容。

篩選條件強度 封鎖的內容可信度 允許的內容可信度
無篩選 無、低、中、高
無、低、中
高、中 無、低
高、中、低