翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
設定、結果、スコアの例
次のブロックは、スコアの例を含め、各チェックのリクエスト設定と返される結果を示しています。
コンテンツフィルター
コンテンツフィルターは、リクエストされたカテゴリごとに 1 つのエントリを返します。各エントリは 0.0~1.0 severityScoreです。スコアが高いほど、そのカテゴリにより一致することを示します。違反としてカウントされるしきい値を選択します。コンテンツをブロックするために制限の厳しいエクスペリエンスが必要な場合は、下限にしきい値を設定します。
// config "contentFilter": { "categories": [ { "category": "VIOLENCE" }, { "category": "HATE" } ] } // result "contentFilter": { "results": [ { "category": "VIOLENCE", "severityScore": 0.8 }, { "category": "HATE", "severityScore": 0.2 } ] }
プロンプト攻撃
プロンプト攻撃は、リクエストされたカテゴリごとに 1 つのエントリを で返しますseverityScore。
// config "promptAttack": { "categories": [ { "category": "JAILBREAK" }, { "category": "PROMPT_LEAKAGE" } ] } // result "promptAttack": { "results": [ { "category": "JAILBREAK", "severityScore": 0.6 }, { "category": "PROMPT_LEAKAGE", "severityScore": 0.2 } ] }
機密情報
機密情報は、検出されたエンティティインスタンスごとに 1 つのエントリを返します。各エントリにはconfidenceScore、、contentIndex、messageIndexそれが表示された 、およびそのブロック内の開始/終了文字のオフセットがあり、クライアント側のマスキングや秘匿化に十分です。結果はサービス定義の最大数に制限されます。上限よりも多くのエンティティが存在する場合、 truncatedは ですtrue。
// config "sensitiveInformation": { "entities": [ { "type": "EMAIL" }, { "type": "US_SOCIAL_SECURITY_NUMBER" }, { "type": "CREDIT_DEBIT_CARD_NUMBER" } ] } // result "sensitiveInformation": { "results": [ { "type": "EMAIL", "confidenceScore": 0.8, "messageIndex": 0, "contentIndex": 0, "beginOffset": 12, "endOffset": 28 } ], "truncated": false }
他のチェックとは異なり、機密情報の検出結果はコンテンツに合わせてスケールされます。結果は、サービス定義の最大 1000 エンティティに制限されます。上限よりも多くのエンティティが存在する場合、 truncatedは ですtrue。非常に長いコンテンツを完全にマスキングするには、小さいセグメントでチェックを実行します。