從具有字詞篩選條件的對話中移除特定字詞和片語清單 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

從具有字詞篩選條件的對話中移除特定字詞和片語清單

Amazon Bedrock Guardrails 具有單字篩選條件,可用於在輸入提示和模型回應中封鎖單字和片語 (完全相符)。您可以使用下列單字篩選條件來封鎖褻瀆、令人反感或不適當的內容,或是競爭對手或產品名稱的內容。

  • 褻瀆篩選條件 – 開啟 以封鎖褻瀆文字。褻瀆清單是以褻瀆的傳統定義為基礎,並且會持續更新。

  • 自訂單字篩選條件 – 使用最多三個單字 AWS Management Console 的 將自訂單字和片語新增至清單。您最多可以將 10,000 個項目新增至自訂文字篩選條件。

    您可以使用 Amazon Bedrock 新增單字和片語 AWS Management Console:

    • 在文字編輯器中手動新增 。

    • 上傳 .txt 或 .csv 檔案。

    • 從 Amazon S3 儲存貯體上傳物件。

    注意

    您只能使用 上傳文件和物件 AWS Management Console。API 和 SDK 操作僅支援文字,不包含上傳文件和物件。

為您的護欄設定單字政策

您可以使用 AWS Management Console 或 Amazon Bedrock API,為您的護欄設定單字政策。

Console
  1. AWS Management Console 使用具有 Amazon Bedrock 許可的 IAM 角色登入 ,然後開啟位於 https://https://console.aws.amazon.com/bedrock/ 的 Amazon Bedrock 主控台。

  2. 從左側導覽窗格中,選擇護欄,然後選擇建立護欄

  3. 針對提供護欄詳細資訊頁面,執行下列動作:

    1. 護欄詳細資訊區段中,提供護欄的名稱和選用的描述

    2. 針對封鎖提示的訊息,輸入套用護欄時顯示的訊息。選取為回應套用相同的封鎖訊息核取方塊,以在將護欄套用至回應時使用相同的訊息。

    3. (選用) 若要為您的護欄啟用跨區域推論,請展開跨區域推論,然後選取為您的護欄啟用跨區域推論。選擇護欄設定檔,定義可路由護欄推論請求 AWS 區域 的目的地。

    4. (選用) 根據預設,您的護欄會使用 加密 AWS 受管金鑰。若要使用您自己的客戶受管 KMS 金鑰,請展開 KMS 金鑰選擇,然後選取自訂加密設定 (進階) 核取方塊。

      您可以選取現有的 AWS KMS 金鑰,或選取建立金鑰以建立新的 AWS KMS 金鑰

    5. (選用) 若要將標籤新增至護欄,請展開標籤,然後為您定義的每個標籤選取新增標籤。

      如需詳細資訊,請參閱標記 Amazon Bedrock 資源

    6. 選擇下一步

  4. 新增字詞篩選條件頁面上,執行下列動作:

    1. 選取篩選褻瀆性以封鎖提示和回應中的褻瀆性。褻瀆清單以傳統定義為基礎,並持續更新。

    2. 對於新增自訂單字和片語,選取要封鎖護欄的新增單字和片語。如果您上傳單字檔案,檔案中的每一行都應包含一個單字或最多三個單字的片語。請勿包含 標頭。您有下列選項:

      選項 指示
      手動新增單字和片語 檢視和編輯單字和片語區段中直接新增單字和片語
      從本機檔案上傳 選取此選項後,選取選擇檔案,以上傳包含單字和片語的 .txt 或 .csv 檔案
      從 Amazon S3 物件上傳 從 S3 儲存貯體上傳物件。
    3. 檢視和編輯單字和片語區段中,編輯要封鎖的護欄單字和片語。您有下列選項:

      • 如果您從本機檔案或 Amazon S3 物件上傳字詞清單,此區段將填入您的字詞清單。若要篩選具有錯誤的項目,請選取顯示錯誤

      • 若要將項目新增至字詞清單,請選取新增字詞或片語。在方塊中輸入最多三個單字的單字或片語,然後按 Enter 或選取核取記號圖示以確認項目。

      • 若要編輯項目,請選取項目旁的編輯圖示 ( Edit icon represented by a pencil symbol. )。

      • 若要從文字清單中刪除項目,請選取垃圾桶圖示 ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ),或者,如果您要編輯項目,請選取項目旁邊的刪除圖示 ( Close or cancel icon represented by an "X" symbol. )。

      • 若要刪除包含錯誤的項目,請選取全部刪除,然後選取刪除發生錯誤的所有資料列

      • 若要刪除所有項目,請選取全部刪除,然後選取刪除所有資料列

      • 若要搜尋項目,請在搜尋列中輸入表達式。

      • 若要僅顯示有錯誤的項目,請選取標記為顯示全部的下拉式功能表,然後選取僅顯示錯誤

      • 若要設定資料表中每個頁面的大小或資料表中的資料欄顯示,請選取設定圖示 ( Gear icon representing settings or configuration options. )。設定您的偏好設定,然後選取確認

      • 根據預設,本節會顯示資料表編輯器。若要切換到文字編輯器,您可以在其中在每個行中輸入單字或片語,請選取文字編輯器文字編輯器提供下列功能:

        • 您可以從另一個文字編輯器複製字詞清單,並將其貼到此編輯器中。

        • 包含錯誤的項目旁會出現紅色 X 圖示,而錯誤清單會顯示在編輯器下方。

    4. 選擇下一步以視需要設定其他政策,或跳至檢閱並建立以完成建立護欄。

    5. 檢閱護欄的設定。

      1. 在您要進行變更的任何區段中選取編輯

      2. 設定政策完成後,請選取建立以建立護欄。

API

若要使用單字政策建立護欄,請傳送 CreateGuardrail 請求。請求格式如下:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "wordPolicyConfig": { "managedWordListsConfig": [ { "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "PROFANITY" }, ], "wordsConfig": [{ "text": "string", "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }
  • description 為護欄指定 name和 。

  • 指定當護欄成功封鎖 blockedInputMessagingblockedOutputsMessaging欄位中的提示或模型回應時的訊息。

  • wordPolicyConfig 物件中設定單字政策:

    • 使用 managedWordListsConfig來設定預先定義的褻瀆字詞清單。

    • 使用wordsConfig陣列來指定要篩選的自訂單字和片語:

      • text 欄位中指定要篩選的單字和片語。

      • (選用) 在提示中使用 inputAction或 回應中使用 偵測到字詞時,指定要採取的動作outputAction。選擇BLOCK封鎖內容並以封鎖的訊息取代,或選擇不NONE採取任何動作,但傳回偵測資訊。

      • (選用) 使用 inputEnabledoutputEnabled來控制是否針對輸入和輸出啟用護欄評估。

  • (選用) 將任何標籤連接到護欄。如需詳細資訊,請參閱標記 Amazon Bedrock 資源

  • (選用) 為了安全起見,請在 kmsKeyId 欄位中包含 KMS 金鑰的 ARN。

  • (選用) 若要啟用跨區域推論,請在 crossRegionConfig 物件中指定護欄設定檔。

回應格式如下:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }