Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de una barrera de protección
Las barreras de protección de Amazon Bedrock son un conjunto de políticas de filtrado diferentes que puede configurar para evitar el contenido no deseado y dañino y eliminar o enmascarar información confidencial para proteger la privacidad.
Puede configurar las siguientes políticas en una barrera de protección:
-
Filtros de contenido: detectan y filtran contenido de texto o imagen dañino en las solicitudes de entrada o en las respuestas del modelo. El filtrado se realiza en función de la detección de determinadas categorías de contenido dañino predefinidas: odio, insultos, contenido sexual, violencia, mala conducta y ataque de peticiones. También puede ajustar la intensidad del filtro para cada una de estas categorías. Con el nivel estándar, los filtros de contenido se extienden al contenido relacionado con el código.
-
Ataques de peticiones: pueden ayudarlo a detectar y filtrar los ataques de peticiones y las inyecciones de peticiones. Ayuda a detectar las peticiones que pretenden eludir la moderación, anular instrucciones o generar contenido dañino.
-
Temas denegados: puede definir un conjunto de temas a evitar en la aplicación de IA generativa. Por ejemplo, se puede diseñar una aplicación de asistente bancario para evitar temas relacionados con el asesoramiento sobre inversiones ilegales. Con el nivel estándar, los filtros de contenido se extienden al contenido relacionado con el código.
-
Filtros de palabras: puede configurar un conjunto de palabras o frases personalizadas (coincidencia exacta) que desee detectar y bloquear en la interacción entre sus usuarios y las aplicaciones de IA generativa. Por ejemplo, puede detectar y bloquear palabras soeces, así como palabras personalizadas específicas, como los nombres de la competencia u otras palabras ofensivas.
-
Filtros de información confidencial: pueden ayudarlo a detectar contenido confidencial, como información de identificación personal (PII) en formatos estándar o expresiones regulares personalizadas en las entradas de los usuarios y en las respuestas del FM. Según el caso de uso, puede rechazar las entradas que contengan información confidencial o redactarlas en las respuestas del FM. Por ejemplo, puede redactar información personal de los usuarios y, al mismo tiempo, generar resúmenes a partir de las transcripciones de las conversaciones entre clientes y agentes.
-
Verificaciones de fundamento contextual: puede ayudarlo a detectar y filtrar las alucinaciones en las respuestas del modelo si no se basan en la información original (son inexactas desde el punto de vista fáctico o añaden nueva información) o si son irrelevantes para la consulta del usuario. Por ejemplo, puede bloquear o marcar las respuestas en las aplicaciones RAG (generación aumentada por recuperación) si las respuestas del modelo se desvían de la información de los pasajes obtenidos o no responden a la pregunta del usuario.
-
Verificaciones de razonamiento automatizado: pueden ayudarlo a validar que las respuestas del modelo cumplen las reglas y políticas lógicas que usted defina. Puede crear políticas utilizando lenguaje natural que especifiquen los requisitos de razonamiento, y la barrera de protección evaluará si las salidas del modelo cumplen estas restricciones lógicas. Por ejemplo, puedes asegurarte de que un chatbot de servicio al cliente solo recomiende productos que estén realmente disponibles en el inventario, o comprobar que el asesoramiento financiero observe las normas de cumplimiento.
nota
Todo el contenido bloqueado de las políticas anteriores aparecerá como texto sin formato en los registros de invocación del modelo de Amazon Bedrock, si los ha activado. Puede deshabilitar los registros de invocación de Amazon Bedrock si no desea que el contenido bloqueado aparezca como texto sin formato en los registros.
Una barrera de protección debe contener al menos un filtro y mensajes para cuando se bloqueen las peticiones y las respuestas de los usuarios. Puede optar por utilizar los mensajes predeterminados. Para añadir filtros e iterarlos en la barrera de protección más adelante, siga los pasos que se indican en Modificación de la barrera de protección.
Temas
Configuración de filtros de contenido de Barreras de protección para Amazon Bedrock
Bloqueo de los temas denegados para ayudar a eliminar el contenido dañino
Eliminación de la PII de las conversaciones con filtros de información confidencial
Uso de la verificación de fundamento contextual para filtrar las alucinaciones en las respuestas
Opciones para tratar contenido dañino detectado por Barreras de protección para Amazon Bedrock