Crea tu barandilla - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crea tu barandilla

Las barreras de protección de Amazon Bedrock son un conjunto de políticas de filtrado diferentes que puede configurar para evitar el contenido no deseado y dañino y eliminar o enmascarar información confidencial para proteger la privacidad.

Puede configurar las siguientes políticas en una barrera de protección:

  • Filtros de contenido: puede configurar umbrales para bloquear las solicitudes de entrada o modelar las respuestas en lenguaje natural para el texto y, por separado, para las imágenes que contengan contenido dañino, como odio, insultos, contenido sexual, violencia, mala conducta (incluida la actividad delictiva) y ataques rápidos (inyección inmediata y escapadas de la cárcel). Por ejemplo, un sitio de comercio electrónico puede diseñar su asistente en línea para evitar el uso de and/or imágenes en un lenguaje inapropiado, como el odio o la violencia.

  • Ataques rápidos: puede ayudarle a detectar y filtrar los ataques rápidos y las inyecciones rápidas. Ayuda a detectar mensajes que pretenden eludir la moderación, anular instrucciones o generar contenido dañino.

  • Temas denegados: puede definir un conjunto de temas a evitar en la aplicación de IA generativa. Por ejemplo, se puede diseñar una aplicación de asistente bancario para evitar temas relacionados con el asesoramiento sobre inversiones ilegales.

  • Filtros de palabras: puede configurar un conjunto de palabras o frases personalizadas (coincidencias exactas) que desee detectar y bloquear en la interacción entre sus usuarios y las aplicaciones de IA generativa. Por ejemplo, puede detectar y bloquear palabras soeces, así como palabras personalizadas específicas, como los nombres de la competencia u otras palabras ofensivas.

  • Filtros de información confidencial: pueden ayudarte a detectar contenido confidencial, como información de identificación personal (PII) en formatos estándar o entidades de expresiones regulares personalizadas en las entradas de los usuarios y en las respuestas de FM. Según el caso de uso, puede rechazar las entradas que contengan información confidencial o redactarlas en las respuestas del FM. Por ejemplo, puede redactar información personal de los usuarios y, al mismo tiempo, generar resúmenes a partir de las transcripciones de las conversaciones entre clientes y agentes.

  • Verificación de fundamento contextual: puede ayudarle a detectar y filtrar las alucinaciones en las respuestas del modelo si no se basan en la información original (son inexactas desde el punto de vista fáctico o añaden nueva información) o si son irrelevantes para la consulta del usuario. Por ejemplo, puede bloquear o marcar las respuestas en las aplicaciones RAG (generación aumentada por recuperación) si las respuestas del modelo se desvían de la información de los pasajes obtenidos o no responden a la pregunta del usuario.

nota

Todo el contenido bloqueado de las políticas anteriores aparecerá como texto sin formato en los registros de invocación del modelo Amazon Bedrock, si los ha activado. Puede deshabilitar los registros de invocación de Amazon Bedrock si no desea que el contenido bloqueado aparezca como texto sin formato en los registros.

Una barrera de protección debe contener al menos un filtro y mensajes para cuando se bloqueen las peticiones y las respuestas de los usuarios. Puede optar por utilizar los mensajes predeterminados. Puede añadir filtros e iterarlos en su barandilla más adelante siguiendo los pasos que se indican en. Modifica tu barandilla