Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
So erstellen Sie Ihren Integritätsschutz
Integritätsschutz für Amazon Bedrock besteht aus einer Sammlung verschiedener Filterrichtlinien, die Sie konfigurieren können, um unerwünschte und schädliche Inhalte zu vermeiden sowie sensible Informationen zum Schutz der Privatsphäre zu entfernen oder zu maskieren.
Sie können die folgenden Richtlinien in einem Integritätsschutz konfigurieren:
-
Inhaltsfilter — Erkennen und filtern Sie schädliche Text- oder Bildinhalte in Eingabeaufforderungen oder Modellantworten. Die Filterung erfolgt auf Grundlage der Erkennung bestimmter vordefinierter Kategorien für schädliche Inhalte: Hass, Beleidigung, Sexualität, Gewalt, Fehlverhalten und Prompt-Angriffe. Sie können die Filterstärke für jede dieser Kategorien anpassen. Bei der Stufe „Standard“ erstrecken sich Inhaltsfilter auch auf Inhalte, die sich auf den Code beziehen.
-
Prompt-Angriffe – Diese Richtlinie kann Ihnen helfen, Promptangriffe und Promptinjektion zu erkennen und zu auszufiltern. Sie hilft bei der Erkennung von Prompts, die darauf abzielen, die Moderation zu umgehen, Anweisungen außer Kraft zu setzen oder schädliche Inhalte zu generieren.
-
Abgelehnte Themen – Hiermit können Sie eine Reihe von Themen definieren, die Sie in Ihrer generativen KI-Anwendung vermeiden möchten. Beispielsweise kann eine Bankassistenzanwendung so konzipiert werden, dass Themen im Zusammenhang mit illegaler Anlageberatung vermieden werden. Bei der Stufe „Standard“ erstrecken sich Inhaltsfilter auf den codebezogenen Inhalt.
-
Wortfilter – Sie können eine Reihe von benutzerdefinierten Wörtern oder Ausdrücken (exakte Übereinstimmung) konfigurieren, die Sie bei der Interaktion zwischen Ihren Benutzern und generativen KI-Anwendungen erkennen und blockieren möchten. Beispielsweise können Sie Profanität sowie spezifische benutzerdefinierte Wörter, wie Namen Ihrer Konkurrenten oder andere unpassende Wörter, erkennen und blockieren.
-
Filter für sensible Informationen – Dieser Filter kann Ihnen helfen, sensible Inhalte wie persönlich identifizierbare Informationen (PII) in Standardformaten oder benutzerdefinierten Regex-Entitäten in Benutzereingaben und FM-Antworten zu erkennen. Je nach Anwendungsfall können Sie Eingaben, die sensible Informationen enthalten, ablehnen oder in FM-Antworten unkenntlich machen. Sie können beispielsweise die persönlichen Daten der Benutzer redigieren, und gleichzeitig Zusammenfassungen aus Gesprächsprotokollen von Kunden und Agenten erstellen.
-
Kontextuelle Begründungsprüfungen – Helfen dabei, Halluzinationen in Modellantworten zu erkennen und zu filtern, wenn diese nicht in den Quellinformationen begründet sind (sachlich falsch sind oder neue Informationen hinzufügen) oder für die Anfrage des Benutzers irrelevant sind. Sie können beispielsweise Antworten in RAG-Anwendungen (Retrieval-Augmented Generation) blockieren oder kennzeichnen, wenn die Modellantworten von den Informationen in den abgerufenen Passagen abweichen oder sie die Frage des Benutzers nicht beantworten.
-
Automated-Reasoning-Prüfungen – Mithilfe dieser Funktion können Sie überprüfen, ob die Modellantworten den von Ihnen definierten logischen Regeln und Richtlinien entsprechen. Sie können Richtlinien in natürlicher Sprache erstellen, die die Anforderungen an die Argumentation spezifizieren. Anhand des Integritätsschutzes wird dann bewertet, ob die Modellausgaben diesen logischen Einschränkungen entsprechen. Sie können beispielsweise sicherstellen, dass ein Kundenservice-Chatbot nur Produkte empfiehlt, die tatsächlich auf Lager sind, oder verifizieren, dass eine Finanzberatung den gesetzlichen Vorschriften entspricht.
Anmerkung
Alle blockierten Inhalte aus den oben genannten Richtlinien werden als Klartext in den Amazon Bedrock Model Invocation Logs (Aufrufprotokolle der Modelle in Amazon Bedrock) angezeigt, sofern Sie diese aktiviert haben. Sie können Amazon-Bedrock-Aufrufprotokolle deaktivieren, wenn Sie nicht möchten, dass Ihre blockierten Inhalte als Klartext in den Protokollen erscheinen.
Ein Integritätsschutz muss mindestens einen Filter und eine Meldung für den Fall enthalten, dass Prompts und Benutzerantworten blockiert werden. Sie können sich hierbei für die Verwendung der Standardnachrichten entscheiden. Sie können Filter hinzufügen und Ihren Integritätsschutz später iterieren, indem Sie die Schritte unter So modifizieren Sie Ihren Integritätsschutz befolgen.