Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Inhaltsfilter für Amazon Bedrock Guardrails konfigurieren
Mit Amazon Bedrock Guardrails können Sie Inhaltsfilter so konfigurieren, dass Modellaufforderungen und -antworten in natürlicher Sprache für Text und Bilder mit schädlichen Inhalten blockiert werden. Beispielsweise kann eine E-Commerce-Website ihren Online-Assistenten so gestalten, dass keine unangemessene Sprache und/oder Bilder verwendet werden.
Filtern Sie die Klassifizierungs- und Blockierungsstufen
Die Filterung erfolgt auf der Grundlage der Vertrauensklassifizierung von Benutzereingaben und FM-Antworten in jeder der sechs Kategorien. Alle Benutzereingaben und FM-Antworten werden nach vier Stärkestufen klassifiziert: NONE
LOW
,MEDIUM
, undHIGH
. Wenn eine Aussage beispielsweise mit HIGH
Zuversicht als Hass eingestuft wird, ist die Wahrscheinlichkeit hoch, dass diese Aussage hasserfüllte Inhalte enthält. Eine einzelne Aussage kann in mehrere Kategorien mit unterschiedlichem Konfidenzniveau eingeteilt werden. Beispielsweise kann eine einzelne Aussage als selbstbewusster Hass, HIGH
selbstbewusst beleidigend, LOW
Sexuell mit und NONE
selbstbewusster Gewalt klassifiziert werden. MEDIUM
Stärke des Filters
Sie können die Stärke der Filter für jede Inhaltsfilterkategorie konfigurieren. Die Filterstärke bestimmt die Empfindlichkeit beim Filtern schädlicher Inhalte. Mit zunehmender Filterstärke steigt die Wahrscheinlichkeit, dass schädliche Inhalte gefiltert werden, und die Wahrscheinlichkeit, dass schädliche Inhalte in Ihrer Anwendung entdeckt werden, sinkt.
Sie haben vier Stufen der Filterstärke
-
Keine — Es wurden keine Inhaltsfilter angewendet. Alle Benutzereingaben und FM-generierten Ausgaben sind zulässig.
-
Niedrig — Die Stärke des Filters ist gering. Inhalte, die mit
HIGH
Sicherheit als schädlich eingestuft wurden, werden herausgefiltert. InhalteNONE
, dieMEDIUM
vertrauensvoll als schädlich eingestuft wurdenLOW
, sind zulässig. -
Medium — Inhalte, die
MEDIUM
vertrauensvoll als schädlich eingestuft wurden, werden herausgefiltert.HIGH
Inhalte, dieLOW
vertrauensvoll als schädlich eingestuft wurden, sind zulässig.NONE
-
Hoch — Dies stellt die strengste Filterkonfiguration dar. Inhalte, die als schädlich mit
MEDIUM
undLOW
vertraulich eingestuft wurdenHIGH
, werden herausgefiltert. Als harmlos eingestufte Inhalte sind zulässig.
Stärke des Filters | Vertrauenswürdigkeit von Inhalten blockiert | Vertrauenswürdige Inhalte sind zulässig |
---|---|---|
Keine | Keine Filterung | Keine, Niedrig, Mittel, Hoch |
Niedrig | Hoch | Keine, Niedrig, Mittel |
Mittelschwer | Hoch, Mittel | Keine, Niedrig |
Hoch | Hoch, Mittel, Niedrig | Keine |