ワードフィルターを使用して特定の単語やフレーズを会話から削除する

Amazon Bedrock ガードレールには、入力プロンプトとモデルレスポンスの単語とフレーズをブロック (完全一致) するために使用できる単語フィルターがあります。次のワードフィルターを使用して、冒涜的、攻撃的、不適切なコンテンツや、競合相手や製品の名前を含むコンテンツをブロックできます。

冒涜的な表現フィルター - 冒涜的な単語をブロックする場合は、このフィルターを有効にします。冒涜的な表現のリストは、冒涜的な表現についての従来の定義に基づいており、継続的に更新されています。
カスタム単語フィルター – 最大 3 つの単語 AWS マネジメントコンソールのを使用してカスタム単語とフレーズをリストに追加します。カスタムのワードフィルターには最大 10,000 個の項目を追加できます。

Amazon Bedrock を使用して単語やフレーズを追加するには、次のオプションがあります AWS マネジメントコンソール。
- テキストエディタで手動で追加する。
- .txt ファイルまたは .csv ファイルをアップロードする。
- Amazon S3 バケットからオブジェクトをアップロードする。
注記
を使用してのみ、ドキュメントとオブジェクトをアップロードできます AWS マネジメントコンソール。API や SDK のオペレーションはテキストにのみ対応していて、ドキュメントやオブジェクトはアップロードできません。

ガードレールの単語ポリシーを設定する

AWS マネジメントコンソールまたは Amazon Bedrock API を使用して、ガードレールの単語ポリシーを設定できます。

Console

Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソールを使用してにサインインします。次に、https://console.aws.amazon.com/bedrock で Amazon Bedrock コンソールを開きます。
左側のナビゲーションペインからガードレールを選択し、ガードレールの作成を選択します。
ガードレールの詳細を指定するページでは、次の操作を行います。
1. [ガードレールの詳細] セクションで、ガードレールの [名前] とオプションの [説明] に入力します。
2. ブロックされたプロンプトのメッセージングには、ガードレールが適用されたときに表示されるメッセージを入力します。レスポンスに同じブロックメッセージを適用するチェックボックスをオンにして、ガードレールがレスポンスに適用されたときに同じメッセージを使用します。
3. (オプション) ガードレールのクロスリージョン推論を有効にするには、クロスリージョン推論を展開し、ガードレールのクロスリージョン推論を有効にするを選択します。ガードレール推論リクエストをルーティングできる送信先を定義する AWS リージョンガードレールプロファイルを選択します。
4. (オプション) デフォルトでは、ガードレールはで暗号化されます AWS マネージドキー。独自のカスタマーマネージド KMS キーを使用するには、KMS キーの選択を展開し、暗号化設定をカスタマイズ (詳細) チェックボックスを選択します。
  
  既存の AWS KMS キーを選択するか、キーの作成を選択して新しい AWS KMS キーを作成できます。
5. (オプション) ガードレールにタグを追加するには、タグを展開してから、定義したタグごとに新しいタグを追加するを選択します。
  
  詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。
6. [Next] (次へ) を選択します。

単語フィルターの追加ページで、次の操作を行います。

プロンプトとレスポンスの冒涜をブロックするには、冒涜をフィルタリングを選択します。冒涜的な表現のリストは、従来の定義に基づいており、継続的に更新されています。

カスタム語句を追加する で、ブロックするガードレールの語句を追加する方法を選択します。単語のファイルをアップロードする場合、ファイル内の各行には 1 つの単語または最大 3 つの単語のフレーズを含める必要があります。ヘッダーは含めないでください。次のオプションがあります。

オプション	指示
単語やフレーズを手動で追加	[単語やフレーズを表示および編集] セクションに単語とフレーズを直接追加します。
ローカルファイルからアップロード	このオプションを選択した後、ファイルの選択を選択して、単語とフレーズを含む .txt または .csv ファイルをアップロードします。
Amazon S3 オブジェクトからアップロード	S3 バケットからオブジェクトをアップロードします。

単語とフレーズの表示と編集セクションでブロックするガードレールの単語とフレーズを編集します。次のオプションがあります。
- ローカルファイルまたは Amazon S3 オブジェクトから単語リストをアップロードした場合、このセクションには単語リストが入力されます。エラーのある項目をフィルタリングするには、[エラーを表示] を選択します。
- 単語リストに項目を追加するには、[単語やフレーズを追加] を選択します。ボックス内に単語または最大 3 つの単語のフレーズを入力し、Enter キーを押すか、チェックマークアイコンを選択して項目を確認します。
- 項目を編集するには、項目の横にある編集アイコン ( ) を選択します。
- 単語リストから項目を削除するには、ごみ箱アイコン ( ) を選択するか、項目を編集する場合は、項目の横にある削除アイコン ( ) を選択します。
- エラーを含む項目を削除するには、すべて削除を選択し、エラーのあるすべての行を削除を選択します。
- すべての項目を削除するには、すべて削除を選択し、すべての行を削除を選択します。
- 項目を検索するには、検索バーに式を入力します。
- エラーが含まれている項目のみを表示するには、[すべて表示] というラベルが付いたドロップダウンメニューを選択し、[エラーのみ表示] を選択します。
- テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン ( ) を選択します。設定を行い、[確認] を選択します。
- デフォルトでは、このセクションに [テーブル] エディタが表示されます。各行に単語またはフレーズを入力できるテキストエディタに切り替えるには、[テキストエディタ] を選択します。[テキストエディタ] には、次の機能があります。
  - 別のテキストエディタから単語リストをコピーして、このエディタに貼り付けることができます。
  - エラーが含まれている項目の横に赤い X アイコンが表示され、エディタの下部にエラーのリストが表示されます。
次へを選択して必要に応じて他のポリシーを設定するか、スキップして確認して作成し、ガードレールの作成を完了します。
ガードレールの設定を確認します。
1. 変更するセクションで [編集] を選択します。
2. ポリシーの設定が完了したら、作成を選択してガードレールを作成します。

API

ワードポリシーを使用してガードレールを作成するには、CreateGuardrail リクエストを送信します。リクエストの形式は次のとおりです。


POST /guardrails HTTP/1.1
Content-type: application/json

{
    "blockedInputMessaging": "string",
    "blockedOutputsMessaging": "string",
    "wordPolicyConfig": {
        "managedWordListsConfig": [
            {
                "inputAction": "BLOCK | NONE",
                "inputEnabled": true,
                "outputAction": "BLOCK | NONE",
                "outputEnabled": true,
                "type": "PROFANITY"
            },
        ],
        "wordsConfig": [{
            "text": "string",
            "inputAction": "BLOCK | NONE",
            "inputEnabled": true,
            "outputAction": "BLOCK | NONE",
            "outputEnabled": true
        }]
    },
    "description": "string",
    "kmsKeyId": "string",
    "name": "string",
    "tags": [{
        "key": "string",
        "value": "string"
    }],
    "crossRegionConfig": {
        "guardrailProfileIdentifier": "string"
    }
}

ガードレールの nameと description を指定します。
blockedInputMessaging および blockedOutputsMessaging フィールドでプロンプトまたはモデルレスポンスをガードレールが正常にブロックしたときのメッセージを指定します。
wordPolicyConfig オブジェクトで単語ポリシーを設定します。
- managedWordListsConfig を使用して、冒涜的な単語の事前定義されたリストを設定します。
- wordsConfig 配列を使用して、フィルタリングするカスタム語句を指定します。
  - text フィールドでフィルタリングする単語とフレーズを指定します。
  - (オプション) inputActionまたはを使用したレスポンスを使用して、プロンプトで単語が検出されたときに実行するアクションを指定しますoutputAction。コンテンツをBLOCKブロックしてブロックされたメッセージングに置き換えるか、アクションを実行せずに検出情報を返すNONEかを選択します。
  - (オプション) inputEnabledと outputEnabledを使用して、入力と出力でガードレール評価が有効になっているかどうかを制御します。
(オプション) ガードレールにタグをアタッチします。詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。
(オプション) セキュリティのために、kmsKeyId フィールドに KMS キーの ARN を含めます。
(オプション) クロスリージョン推論を有効にするには、 crossRegionConfig オブジェクトでガードレールプロファイルを指定します。

レスポンスの形式は次のとおりです。


HTTP/1.1 202
Content-type: application/json

{
    "createdAt": "string",
    "guardrailArn": "string",
    "guardrailId": "string",
    "version": "string"
}

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

拒否されたトピックを追加する

機密情報フィルターを追加する

ワードフィルターを使用して特定の単語やフレーズを会話から削除する

注記

ガードレールの単語ポリシーを設定する