用於處理 Amazon Bedrock Guardrails 偵測到之有害內容的選項 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

用於處理 Amazon Bedrock Guardrails 偵測到之有害內容的選項

您可以設定 Amazon Bedrock 護欄在提示 (inputAction) 和回應 () 中偵測到有害內容時,在執行時間採取的動作outputAction

在模型輸入和回應中偵測到有害內容時,護欄篩選政策支援下列動作:

  • 封鎖 – 封鎖內容,並以封鎖的訊息取代內容。

  • 遮罩 – 匿名化內容,並將其取代為識別符標籤 (例如 {NAME}{EMAIL})。

    此選項僅適用於敏感資訊篩選條件。如需詳細資訊,請參閱使用敏感資訊篩選條件從對話中移除 PII

  • Detect – 不採取任何動作,但傳回護欄在追蹤回應中偵測到的內容。使用此選項稱為偵測模式,以協助評估護欄是否如預期般運作。

使用偵測模式的護欄評估

Amazon Bedrock Guardrails 政策支援偵測模式,可讓您評估護欄的效能,而無需套用任何動作 (例如封鎖內容)。

使用偵測模式可提供下列優點:

  • 測試護欄政策的不同組合和優勢,而不會影響客戶體驗。

  • 分析任何誤報或誤報,並相應地調整您的政策組態。

  • 只有在確認護欄如預期般運作後,才能部署護欄。

範例:使用偵測模式評估內容篩選條件

例如,假設您設定的內容篩選強度為 的政策HIGH。根據此設定,您的護欄將封鎖內容,即使它傳回對其評估LOW的可信度。

若要了解此行為 (並確保您的應用程式不會封鎖您不預期的內容),您可以將政策動作設定為 NONE。追蹤回應可能如下所示:

{ "assessments": [{ "contentPolicy": { "filters": [{ "action": "NONE", "confidence": "LOW", "detected": true, "filterStrength": "HIGH", "type": "VIOLENCE" }] } }] }

這可讓您預覽護欄評估,並查看VIOLENCE偵測到的 (true),但因為您將 設定為 而未採取任何動作NONE

如果您不想封鎖該文字,您可以將篩選條件強度調整為 MEDIUMLOW,然後重做評估。取得您要尋找的結果後,您可以將政策動作更新為 BLOCKANONYMIZE