ワードフィルターを使用して特定の単語やフレーズを会話から削除する - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ワードフィルターを使用して特定の単語やフレーズを会話から削除する

Amazon Bedrock ガードレールには、入力プロンプトとモデルレスポンスの単語とフレーズをブロック (完全一致) するために使用できる単語フィルターがあります。次のワードフィルターを使用して、冒涜的、攻撃的、不適切なコンテンツや、競合相手や製品の名前を含むコンテンツをブロックできます。

  • 冒涜的な表現フィルター - 冒涜的な単語をブロックする場合は、このフィルターを有効にします。冒涜的な表現のリストは、冒涜的な表現についての従来の定義に基づいており、継続的に更新されています。

  • カスタム単語フィルター – 最大 3 つの単語 AWS Management Console の を使用してカスタム単語とフレーズをリストに追加します。カスタムのワードフィルターには最大 10,000 個の項目を追加できます。

    Amazon Bedrock を使用して単語やフレーズを追加するには、次のオプションがあります AWS Management Console。

    • テキストエディタで手動で追加する。

    • .txt ファイルまたは .csv ファイルをアップロードする。

    • Amazon S3 バケットからオブジェクトをアップロードする。

    注記

    を使用してのみドキュメントとオブジェクトをアップロードできます AWS Management Console。API や SDK のオペレーションはテキストにのみ対応していて、ドキュメントやオブジェクトはアップロードできません。

ガードレールの単語ポリシーを設定する

AWS Management Console または Amazon Bedrock API を使用して、ガードレールの単語ポリシーを設定できます。

Console
  1. Amazon Bedrock アクセス許可を持つ IAM ロール AWS Management Console を使用して にサインインし、https://console.aws.amazon.com/bedrock/ で Amazon Bedrock コンソールを開きます。

  2. 左側のナビゲーションペインからガードレールを選択し、ガードレールの作成を選択します。

  3. ガードレールの詳細を指定するページでは、次の操作を行います。

    1. [ガードレールの詳細] セクションで、ガードレールの [名前] とオプションの [説明] に入力します。

    2. ブロックされたプロンプトのメッセージングには、ガードレールが適用されたときに表示されるメッセージを入力します。レスポンスに同じブロックメッセージを適用するチェックボックスをオンにして、ガードレールがレスポンスに適用されるときに同じメッセージを使用します。

    3. (オプション) ガードレールのクロスリージョン推論を有効にするには、クロスリージョン推論を展開し、ガードレールのクロスリージョン推論を有効にするを選択します。ガードレール推論リクエストをルーティングできる送信先を定義する AWS リージョン ガードレールプロファイルを選択します。

    4. (オプション) デフォルトでは、ガードレールは で暗号化されます AWS マネージドキー。独自のカスタマーマネージド KMS キーを使用するには、KMS キーの選択を展開し、暗号化設定をカスタマイズ (アドバンスド) チェックボックスを選択します。

      既存の AWS KMS キーを選択するか、キーの作成を選択して新しい AWS KMS キーを作成できます。

    5. (オプション) ガードレールにタグを追加するには、タグを展開してから、定義したタグごとに新しいタグを追加するを選択します。

      詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。

    6. [Next] (次へ) を選択します。

  4. 単語フィルターの追加ページで、次の操作を行います。

    1. Filter profanity を選択して、プロンプトとレスポンスの冒涜をブロックします。冒涜的な表現のリストは、従来の定義に基づいており、継続的に更新されています。

    2. カスタム語句を追加する で、ブロックするガードレールの語句を追加する方法を選択します。単語のファイルをアップロードする場合、ファイル内の各行には 1 つの単語または最大 3 つの単語のフレーズを含める必要があります。ヘッダーは含めないでください。次のオプションがあります。

      オプション 指示
      単語やフレーズを手動で追加 [単語やフレーズを表示および編集] セクションに単語とフレーズを直接追加します。
      ローカルファイルからアップロード このオプションを選択した後、ファイルの選択を選択して、単語とフレーズを含む .txt または .csv ファイルをアップロードします。
      Amazon S3 オブジェクトからアップロード S3 バケットからオブジェクトをアップロードします。
    3. 単語とフレーズの表示と編集セクションでブロックするガードレールの単語とフレーズを編集します。次のオプションがあります。

      • ローカルファイルまたは Amazon S3 オブジェクトから単語リストをアップロードした場合、このセクションには単語リストが入力されます。エラーのある項目をフィルタリングするには、[エラーを表示] を選択します。

      • 単語リストに項目を追加するには、[単語やフレーズを追加] を選択します。ボックス内に単語または最大 3 つの単語のフレーズを入力し、Enter キーを押すか、チェックマークアイコンを選択して項目を確認します。

      • 項目を編集するには、項目の横にある編集アイコン ( ) を選択します。

      • 単語リストから項目を削除するには、ごみ箱アイコン ( ) を選択するか、項目を編集する場合は、項目の横にある削除アイコン ( ) を選択します。

      • エラーを含む項目を削除するには、すべて削除を選択し、エラーのあるすべての行を削除を選択します。

      • すべての項目を削除するには、すべて削除を選択し、すべての行を削除を選択します。

      • 項目を検索するには、検索バーに式を入力します。

      • エラーが含まれている項目のみを表示するには、[すべて表示] というラベルが付いたドロップダウンメニューを選択し、[エラーのみ表示] を選択します。

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン ( ) を選択します。設定を行い、[確認] を選択します。

      • デフォルトでは、このセクションに [テーブル] エディタが表示されます。各行に単語またはフレーズを入力できるテキストエディタに切り替えるには、[テキストエディタ] を選択します。[テキストエディタ] には、次の機能があります。

        • 別のテキストエディタから単語リストをコピーして、このエディタに貼り付けることができます。

        • エラーが含まれている項目の横に赤い X アイコンが表示され、エディタの下部にエラーのリストが表示されます。

    4. 次へ を選択して必要に応じて他のポリシーを設定するか、スキップして確認して作成し、ガードレールの作成を完了します。

    5. ガードレールの設定を確認します。

      1. 変更するセクションで [編集] を選択します。

      2. ポリシーの設定が完了したら、作成を選択してガードレールを作成します。

API

ワードポリシーを使用してガードレールを作成するには、CreateGuardrail リクエストを送信します。リクエストの形式は次のとおりです。

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "wordPolicyConfig": { "managedWordListsConfig": [ { "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "PROFANITY" }, ], "wordsConfig": [{ "text": "string", "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }
  • ガードレールの namedescription を指定します。

  • blockedInputMessaging および blockedOutputsMessaging フィールドでプロンプトまたはモデルレスポンスをガードレールが正常にブロックしたときのメッセージを指定します。

  • wordPolicyConfig オブジェクトで単語ポリシーを設定します。

    • managedWordListsConfig を使用して、冒涜的な単語の事前定義されたリストを設定します。

    • wordsConfig 配列を使用して、フィルタリングするカスタム語句を指定します。

      • text フィールドでフィルタリングする単語とフレーズを指定します。

      • (オプション) inputActionまたは を使用したレスポンスを使用して、プロンプトで単語が検出されたときに実行するアクションを指定しますoutputAction。コンテンツをBLOCKブロックしてブロックされたメッセージングに置き換えるか、アクションを実行せずに検出情報を返すNONEかを選択します。

      • (オプション) inputEnabledoutputEnabledを使用して、入力と出力でガードレール評価を有効にするかどうかを制御します。

  • (オプション) ガードレールにタグをアタッチします。詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。

  • (オプション) セキュリティのために、kmsKeyId フィールドに KMS キーの ARN を含めます。

  • (オプション) クロスリージョン推論を有効にするには、 crossRegionConfig オブジェクトでガードレールプロファイルを指定します。

レスポンスの形式は次のとおりです。

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }