翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
拒否トピックをブロックして有害コンテンツの除去に役立てる
生成 AI アプリケーションのコンテキストでは望ましくない一連の拒否トピックをガードレールで指定できます。たとえば、銀行は AI アシスタントが投資アドバイスや暗号通貨に関連する会話を避けたい場合があります。
自然言語のモデルプロンプトとレスポンスは、ガードレールの各拒否トピックに対して評価されます。拒否されたトピックのいずれかが検出されると、ガードレールはブロックされたメッセージを返します。
次のパラメータを使用して拒否トピックを作成します。このパラメータを使用して、ガードレールはプロンプトまたはレスポンスがトピックに属しているかどうかを検出します。
-
名前 – トピックの名前。名前は名詞またはフレーズで指定してください。名前でトピックについて説明しないでください。例:
-
定義 – トピックの内容をまとめた最大 200 文字。トピックの内容とそのサブトピックについて説明してください。
例えば、次のようなトピック定義を指定できます。
Investment advice is inquiries, guidance, or recommendations
about the management or allocation of funds or assets with the goal of
generating returns or achieving specific financial objectives.
-
サンプルフレーズ (オプション) – トピックを参照する最大 5 つのサンプルフレーズのリスト。各フレーズの最大長は 100 文字です。サンプルは、除外対象とするコンテンツの種類を示すプロンプトまたはその続きです。例:
拒否されたトピックを作成するためのベストプラクティス
トピックは簡潔かつ正確に定義します。明確で一義的にトピックを定義することで、トピックの検出精度が向上します。例えば、暗号通貨に関する質問や記述を検出するトピックは、Question or information associated with investing, selling,
transacting, or procuring cryptocurrencies
として定義できます。
トピック定義に例や手順を含めないでください。例えば、Block
all contents associated to cryptocurrency
は指示内容であり、トピックの定義ではありません。このような指示は、トピック定義に含めないでください。
否定的なトピックや例外を定義しないでください。例えば、All contents except
medical information
または Contents not containing
medical information
は、トピックを否定的に定義しています。こうした表現は使用しないでください。
拒否されたトピックを使用してエンティティや単語をキャプチャしないでください。例えば、Statement or
questions containing the name of a person "X"
、Statements with a competitor name Y
です。トピック定義では、テーマや主題を表します。ガードレールは入力内容を文脈に応じて評価します。トピックのフィルタリングは、個々の単語やエンティティの種類を検出する目的では使いません。詳細については、機密情報フィルターを使用して会話から PII を削除する「」またはワードフィルターを使用して特定の単語やフレーズを会話から削除する「」を参照してください。
AWS Management Console または Amazon Bedrock API を使用して、最大 30 個の拒否されたトピックをガードレールに追加できます。
- Console
-
Amazon Bedrock アクセス許可を持つ IAM ロール AWS Management Console を使用して にサインインし、https://console.aws.amazon.com/bedrock/ で Amazon Bedrock コンソールを開きます。
-
左側のナビゲーションペインからガードレールを選択し、ガードレールの作成を選択します。
-
ガードレールの詳細を指定するページでは、次の操作を行います。
-
[ガードレールの詳細] セクションで、ガードレールの [名前] とオプションの [説明] に入力します。
-
ブロックされたプロンプトのメッセージングには、ガードレールが適用されたときに表示されるメッセージを入力します。レスポンスに同じブロックメッセージを適用するチェックボックスをオンにして、ガードレールがレスポンスに適用されるときに同じメッセージを使用します。
-
(オプション) ガードレールのクロスリージョン推論を有効にするには、クロスリージョン推論を展開し、ガードレールのクロスリージョン推論を有効にするを選択します。ガードレール推論リクエストをルーティングできる送信先を定義する AWS リージョン ガードレールプロファイルを選択します。
-
(オプション) デフォルトでは、ガードレールは で暗号化されます AWS マネージドキー。独自のカスタマーマネージド KMS キーを使用するには、KMS キーの選択を展開し、暗号化設定をカスタマイズ (アドバンスド) チェックボックスを選択します。
既存の AWS KMS キーを選択するか、キーの作成を選択して新しい AWS KMS キーを作成できます。
-
(オプション) ガードレールにタグを追加するには、タグを展開してから、定義したタグごとに新しいタグを追加するを選択します。
詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。
-
[Next] (次へ) を選択します。
-
「拒否されたトピックの追加」ページに移動したら、「拒否されたトピックの追加」を選択し、次の操作を行います。
-
トピックの名前を入力します。
-
定義 で、 トピックを定義します。拒否されたトピックを定義する方法のガイドラインについては、「拒否トピックをブロックして有害コンテンツの除去に役立てる」を参照してください。
-
(オプション) Input で、モデルプロンプトでガードレール評価を有効にするかどうかを指定します。有効になっている場合は、ガードレールを使用するアクションを選択します。ブロックはデフォルトで有効になっています。詳細については、「Amazon Bedrock ガードレールによって検出された有害なコンテンツを処理するためのオプション」を参照してください。
-
(オプション) Output で、モデルレスポンスに対してガードレール評価を有効にするかどうかを指定します。有効にした場合、ガードレールがレスポンスに対して実行するアクションを選択します。ブロックはデフォルトで有効になっています。詳細については、「Amazon Bedrock ガードレールによって検出された有害なコンテンツを処理するためのオプション」を参照してください。
-
(オプション) 展開 サンプルフレーズを追加し、このトピックに関連するプロンプトまたはレスポンスを表すフレーズを入力します。最大 5 つのフレーズを入力できます。含めるフレーズごとに、フレーズの追加を選択します。
-
拒否されたトピック階層で、プロンプトとレスポンスのトピックをブロックするためにガードレールで使用する保護階層を選択します。詳細については、「ガードレールポリシーの保護階層」を参照してください。
-
拒否されたトピックの設定が完了したら、[確認] を選択します。
-
前のステップを繰り返して、追加の拒否トピックを作成します。
-
次へ を選択して必要に応じて他のポリシーを設定するか、スキップして確認して作成し、ガードレールの作成を完了します。
-
ガードレールの設定を確認します。
-
変更するセクションで [編集] を選択します。
-
ポリシーの設定が完了したら、作成を選択してガードレールを作成します。
- API
-
CreateGuardrail リクエストを送信して、拒否されたトピックをガードレールに追加します。リクエスト形式は次のとおりです。
POST /guardrails HTTP/1.1
Content-type: application/json
{
"blockedInputMessaging": "string",
"blockedOutputsMessaging": "string",
"topicPolicyConfig": {
"topicsConfig": [
{
"definition": "string",
"examples": [ "string" ],
"inputAction": "BLOCK | NONE",
"inputEnabled": true,
"name": "string",
"outputAction": "BLOCK | NONE",
"outputEnabled": true,
"type": "DENY"
},
"tierConfig": {
"tierName": "CLASSIC | STANDARD"
},
]
},
"crossRegionConfig": {
"guardrailProfileIdentifier": "string"
},
"description": "string",
"name": "string"
}
-
blockedInputMessaging
および blockedOutputsMessaging
フィールドでプロンプトまたはモデルレスポンスをガードレールが正常にブロックしたときのメッセージを指定します。
-
topicPolicyConfig
オブジェクトで拒否するガードレールのトピックを指定します。topicsConfig
リスト内の各項目は 1 つのトピックに関連しています。
-
拒否するトピックdefinition
の name
と を指定します。
-
type
フィールドで DENY
を指定します。
-
を使用するプロンプトinputAction
または を使用するレスポンスでトピックが検出されたときに実行するアクションを指定しますoutputAction
。コンテンツをBLOCK
ブロックしてブロックされたメッセージングに置き換えるか、アクションを実行せずに検出情報を返すNONE
かを選択します。詳細については、「Amazon Bedrock ガードレールによって検出された有害なコンテンツを処理するためのオプション」を参照してください。
-
モデルプロンプトinputEnabled
とレスポンスに対してガードレール評価を有効にするかどうかを制御するoutputEnabled
には、 と を設定します。
-
(オプション) examples
リストで、このトピックに関連するプロンプトまたはレスポンスを表す最大 5 つのサンプルフレーズを指定します。
-
(オプション) tierConfig
オブジェクトでガードレールの保護階層を指定します。オプションには、 STANDARD
および CLASSIC
階層が含まれます。
詳細については、「ガードレールポリシーの保護階層」を参照してください。
-
(オプション) クロスリージョン推論を有効にするには、 crossRegionConfig
オブジェクトでガードレールプロファイルを指定します。これはSTANDARD
、 階層を使用する場合に必要です。
-
ガードレールの name
と description
を指定します。
レスポンス形式は次のようになります。
HTTP/1.1 202
Content-type: application/json
{
"createdAt": "string",
"guardrailArn": "string",
"guardrailId": "string",
"version": "string"
}