用於處理 Amazon Bedrock 防護機制偵測到之有害內容的選項 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

用於處理 Amazon Bedrock 防護機制偵測到之有害內容的選項

您可以設定 Amazon Bedrock 防護機制在提示 (inputAction) 和回應 (outputAction) 中偵測到有害內容時,在執行時期採取的動作。

在模型輸入和回應中偵測到有害內容時,防護機制篩選政策支援下列動作:

  • 封鎖 – 封鎖內容,並以封鎖的訊息取代內容。

  • 遮罩 – 匿名化內容,並將其取代為識別符標籤 (例如 {NAME}{EMAIL})。

    此選項僅適用於敏感資訊篩選條件。如需詳細資訊,請參閱使用敏感資訊篩選條件從對話中移除 PII

  • 偵測 – 不採取任何動作,但傳回防護機制在追蹤回應中偵測到的內容。使用此選項 (稱為偵測模式),以協助評估防護機制是否如預期般運作。

使用偵測模式的防護機制評估

Amazon Bedrock 防護機制政策支援偵測模式,可讓您在不套用任何動作 (例如封鎖內容) 的情況下,評估防護機制的效能。

使用偵測模式可提供下列優點:

  • 測試防護機制政策的不同組合和優勢,而不會影響客戶體驗。

  • 分析任何誤判或誤報,並相應地調整您的政策組態。

  • 僅在確認防護機制如預期般運作後,才能部署防護機制。

範例:使用偵測模式評估內容篩選條件

例如,假設您設定的內容篩選強度為 HIGH 的政策。根據此設定,您的防護機制將封鎖內容,即使其傳回對其評估的 LOW 可信度。

若要了解此行為 (並確保您的應用程式不會封鎖您未預期的內容),您可以將政策動作設定為 NONE。追蹤回應可能如下所示:

{ "assessments": [{ "contentPolicy": { "filters": [{ "action": "NONE", "confidence": "LOW", "detected": true, "filterStrength": "HIGH", "type": "VIOLENCE" }] } }] }

這可讓您預覽防護機制評估,並查看偵測到的 VIOLENCE (true),但因為您將其設定為 NONE 而未採取任何動作。

如果您不想封鎖該文字,可將篩選條件強度調整為 MEDIUMLOW,然後重做評估。取得您要尋找的結果後,您可以將政策動作更新為 BLOCKANONYMIZE