本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
用於處理 Amazon Bedrock Guardrails 偵測到之有害內容的選項
您可以設定 Amazon Bedrock 護欄在提示 (inputAction
) 和回應 () 中偵測到有害內容時,在執行時間採取的動作outputAction
。
在模型輸入和回應中偵測到有害內容時,護欄篩選政策支援下列動作:
-
封鎖 – 封鎖內容,並以封鎖的訊息取代內容。
-
遮罩 – 匿名化內容,並將其取代為識別符標籤 (例如
{NAME}
或{EMAIL}
)。此選項僅適用於敏感資訊篩選條件。如需詳細資訊,請參閱使用敏感資訊篩選條件從對話中移除 PII。
-
Detect – 不採取任何動作,但傳回護欄在追蹤回應中偵測到的內容。使用此選項稱為偵測模式,以協助評估護欄是否如預期般運作。
使用偵測模式的護欄評估
Amazon Bedrock Guardrails 政策支援偵測模式,可讓您評估護欄的效能,而無需套用任何動作 (例如封鎖內容)。
使用偵測模式可提供下列優點:
-
測試護欄政策的不同組合和優勢,而不會影響客戶體驗。
-
分析任何誤報或誤報,並相應地調整您的政策組態。
-
只有在確認護欄如預期般運作後,才能部署護欄。
範例:使用偵測模式評估內容篩選條件
例如,假設您設定的內容篩選強度為 的政策HIGH
。根據此設定,您的護欄將封鎖內容,即使它傳回對其評估LOW
的可信度。
若要了解此行為 (並確保您的應用程式不會封鎖您不預期的內容),您可以將政策動作設定為 NONE
。追蹤回應可能如下所示:
{ "assessments": [{ "contentPolicy": { "filters": [{ "action": "NONE", "confidence": "LOW", "detected": true, "filterStrength": "HIGH", "type": "VIOLENCE" }] } }] }
這可讓您預覽護欄評估,並查看VIOLENCE
偵測到的 (true
),但因為您將 設定為 而未採取任何動作NONE
。
如果您不想封鎖該文字,您可以將篩選條件強度調整為 MEDIUM
或 LOW
,然後重做評估。取得您要尋找的結果後,您可以將政策動作更新為 BLOCK
或 ANONYMIZE
。