翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Bedrock ガードレールのコンテンツフィルターを設定する
Amazon Bedrock ガードレールを使用すると、有害なコンテンツを含むテキストやイメージのモデルプロンプトやレスポンスを自然言語でブロックするようにコンテンツフィルターを設定できます。たとえば、e コマースサイトは、不適切な言語やイメージを使用しないようにオンラインアシスタントを設計できます。
フィルターの分類とブロックレベル
フィルタリングは、6 つの各カテゴリにわたるユーザー入力と FM レスポンスの信頼度分類に基づいて行われます。すべてのユーザー入力と FM レスポンスは、NONE
、LOW
、MEDIUM
、HIGH
の 4 つの強度レベルに分類されます。例えば、ステートメントが HIGH
信頼度で [憎悪] に分類される場合、そのステートメントは憎悪的なコンテンツを表す可能性は高くなります。1 つのステートメントを、さまざまな信頼レベルを持つ複数のカテゴリに分類できます。例えば、1 つのステートメントを、HIGH
信頼度で [憎悪]、LOW
信頼度で [侮辱]、NONE
信頼度で [性的]、MEDIUM
信頼度で [暴力] に分類できます。
フィルターの強度
コンテンツフィルターカテゴリごとにフィルターの強度を設定できます。フィルターの強度は、有害なコンテンツをフィルタリングする感度を決定します。フィルターの強度が高くなると、有害なコンテンツをフィルタリングする確率が高くなり、アプリケーションに有害なコンテンツが表示される可能性が低くなります。
フィルター強度には 4 つのレベルがあります。
-
なし — コンテンツフィルターが適用されません。すべてのユーザー入力と FM 生成出力が許可されます。
-
低 — フィルターの強度が低く設定されます。
HIGH
信頼度で有害と分類されたコンテンツは確実に除外されます。NONE
、LOW
、またはMEDIUM
信頼度で有害と分類されたコンテンツは許可されます。 -
中 -
HIGH
およびMEDIUM
信頼度で有害と分類されたコンテンツは除外されます。NONE
またはLOW
信頼度で有害と分類されたコンテンツは許可されます。 -
高 — これは最も厳しいフィルタリング設定を表します。
HIGH
、MEDIUM
、およびLOW
信頼度で有害と分類されたコンテンツは確実に除外されます。無害と見なされるコンテンツは許可されます。
フィルターの強度 | ブロックされたコンテンツの信頼度 | コンテンツの信頼度 |
---|---|---|
なし | フィルタリングなし | [なし]、[低]、[中]、[高] |
低 | 高 | [なし]、[低]、[中] |
Medium | [高]、[中] | [なし]、[低] |
高 | [高]、[中]、[低] | [なし] |