Inhaltsfilter für Amazon Bedrock Guardrails konfigurieren - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Inhaltsfilter für Amazon Bedrock Guardrails konfigurieren

Mit Amazon Bedrock Guardrails können Sie Inhaltsfilter so konfigurieren, dass Modellaufforderungen und -antworten in natürlicher Sprache für Text und Bilder mit schädlichen Inhalten blockiert werden. Beispielsweise kann eine E-Commerce-Website ihren Online-Assistenten so gestalten, dass keine unangemessene Sprache und/oder Bilder verwendet werden.

Filtern Sie die Klassifizierungs- und Blockierungsstufen

Die Filterung erfolgt auf der Grundlage der Vertrauensklassifizierung von Benutzereingaben und FM-Antworten in jeder der sechs Kategorien. Alle Benutzereingaben und FM-Antworten werden nach vier Stärkestufen klassifiziert: NONELOW,MEDIUM, undHIGH. Wenn eine Aussage beispielsweise mit HIGH Zuversicht als Hass eingestuft wird, ist die Wahrscheinlichkeit hoch, dass diese Aussage hasserfüllte Inhalte enthält. Eine einzelne Aussage kann in mehrere Kategorien mit unterschiedlichem Konfidenzniveau eingeteilt werden. Beispielsweise kann eine einzelne Aussage als selbstbewusster Hass, HIGH selbstbewusst beleidigend, LOW Sexuell mit und NONE selbstbewusster Gewalt klassifiziert werden. MEDIUM

Stärke des Filters

Sie können die Stärke der Filter für jede Inhaltsfilterkategorie konfigurieren. Die Filterstärke bestimmt die Empfindlichkeit beim Filtern schädlicher Inhalte. Mit zunehmender Filterstärke steigt die Wahrscheinlichkeit, dass schädliche Inhalte gefiltert werden, und die Wahrscheinlichkeit, dass schädliche Inhalte in Ihrer Anwendung entdeckt werden, sinkt.

Sie haben vier Stufen der Filterstärke

  • Keine — Es wurden keine Inhaltsfilter angewendet. Alle Benutzereingaben und FM-generierten Ausgaben sind zulässig.

  • Niedrig — Die Stärke des Filters ist gering. Inhalte, die mit HIGH Sicherheit als schädlich eingestuft wurden, werden herausgefiltert. InhalteNONE, die MEDIUM vertrauensvoll als schädlich eingestuft wurdenLOW, sind zulässig.

  • Medium — Inhalte, die MEDIUM vertrauensvoll als schädlich eingestuft wurden, werden herausgefiltert. HIGH Inhalte, die LOW vertrauensvoll als schädlich eingestuft wurden, sind zulässig. NONE

  • Hoch — Dies stellt die strengste Filterkonfiguration dar. Inhalte, die als schädlich mit MEDIUM und LOW vertraulich eingestuft wurdenHIGH, werden herausgefiltert. Als harmlos eingestufte Inhalte sind zulässig.

Stärke des Filters Vertrauenswürdigkeit von Inhalten blockiert Vertrauenswürdige Inhalte sind zulässig
Keine Keine Filterung Keine, Niedrig, Mittel, Hoch
Niedrig Hoch Keine, Niedrig, Mittel
Mittelschwer Hoch, Mittel Keine, Niedrig
Hoch Hoch, Mittel, Niedrig Keine