Bloqueo de los temas denegados para ayudar a eliminar el contenido dañino - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Bloqueo de los temas denegados para ayudar a eliminar el contenido dañino

Puede especificar un conjunto de temas rechazados en una barrera que no sean deseables en el contexto de su aplicación de IA generativa. Por ejemplo, es posible que un banco quiera que su asistente de inteligencia artificial evite las conversaciones relacionadas con consejos de inversión o con criptomonedas.

Las indicaciones y respuestas de los modelos en lenguaje natural se evalúan en función de cada tema rechazado en la barandilla. Si se detecta uno de los temas rechazados, la barandilla devuelve un mensaje bloqueado.

Crea un tema denegado con los siguientes parámetros, que la barandilla utilizará para detectar si un mensaje o una respuesta pertenecen al tema:

  • Nombre: el nombre del tema. El nombre debe ser un sustantivo o una frase. No describa el tema en el nombre. Por ejemplo:

    • Investment Advice

  • Definición: hasta 200 caracteres que resumen el contenido del tema. La definición debe describir el contenido del tema y sus subtemas.

    A continuación se muestra un ejemplo de definición de tema que puede proporcionar:

    Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.

  • Frases de muestra (opcional): una lista de hasta cinco frases de muestra que hacen referencia al tema. Cada frase puede tener hasta 100 caracteres. Un ejemplo es una petición o continuación que muestra qué tipo de contenido debe filtrarse. Por ejemplo:

    • Is investing in the stocks better than bonds?

    • Should I invest in gold?

Prácticas recomendadas para crear temas rechazados

  • Defina el tema de una manera nítida y precisa. Una definición clara e inequívoca del tema puede mejorar la precisión a la hora de detectar el tema. Por ejemplo, un tema para detectar consultas o afirmaciones asociadas a las criptomonedas se puede definir como Question or information associated with investing, selling, transacting, or procuring cryptocurrencies.

  • No incluyas ejemplos ni instrucciones en la definición del tema. Por ejemplo, Block all contents associated to cryptocurrency es una instrucción y no una definición del tema. Estas instrucciones no deben usarse como parte de las definiciones del tema.

  • No definas temas negativos ni excepciones. Por ejemplo, All contents except medical information o Contents not containing medical information son definiciones negativas de un tema y no deben usarse.

  • No utilices temas rechazados para captar entidades o palabras. Por ejemplo, Statement or questions containing the name of a person "X" o Statements with a competitor name Y. Las definiciones de los temas representan un tema o un asunto y las barreras de protección evalúan una entrada dentro del contexto. Los filtros de temas no deben usarse para capturar palabras individuales o tipos de entidades. Para obtener más informaciónEliminación de la PII de las conversaciones con filtros de información confidencial, consulte o Eliminación de una lista específica de palabras y frases de las conversaciones con filtros de palabras para conocer estos casos de uso.

Añada temas rechazados a su barandilla

Puede añadir hasta 30 temas rechazados a su barandilla mediante la API o AWS Management Console Amazon Bedrock.

Console
  1. Inicie sesión en el rol de AWS Management Console uso de IAM con los permisos de Amazon Bedrock y abra la consola de Amazon Bedrock en. https://console.aws.amazon.com/bedrock/

  2. En el panel de navegación izquierdo, selecciona Guardrails y, a continuación, selecciona Create guardrail.

  3. En la página de detalles de proporcionar barandillas, haga lo siguiente:

    1. En la sección Detalles de la barrera de protección, proporcione un Nombre y, si lo desea, una Descripción para la barrera de protección.

    2. En Mensajes para mensajes bloqueados, introduzca un mensaje que aparezca cuando la barandilla esté colocada. Selecciona la casilla Aplicar el mismo mensaje bloqueado a las respuestas para usar el mismo mensaje cuando la barrera esté colocada en la respuesta.

    3. (Opcional) Para habilitar la inferencia entre regiones para la barandilla, expanda la inferencia entre regiones y, a continuación, seleccione Habilitar la inferencia entre regiones para la barandilla. Elija un perfil de barandilla que defina el destino al que se pueden enrutar las solicitudes de inferencia de barandillas. Regiones de AWS

    4. (Opcional) De forma predeterminada, la barandilla está cifrada con un. Clave administrada de AWS Para usar su propia clave de KMS administrada por el cliente, amplíe la selección de claves de KMS y seleccione la casilla de verificación Personalizar la configuración de cifrado (avanzada).

      Puede seleccionar una AWS KMS clave existente o seleccionar Crear una AWS KMS clave para crear una nueva.

    5. (Opcional) Para añadir etiquetas a la barandilla, expanda Etiquetas y, a continuación, seleccione Añadir nueva etiqueta para cada etiqueta que defina.

      Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.

    6. Elija Siguiente.

  4. Cuando llegues a la página Añadir temas rechazados, selecciona Añadir tema denegado y haz lo siguiente:

    1. Ingrese un nombre para el nuevo tema.

    2. En Definición, defina el tema. Para obtener instrucciones sobre cómo definir un tema denegado, consulte Bloqueo de los temas denegados para ayudar a eliminar el contenido dañino.

    3. (Opcional) En Entrada, especifique si la evaluación de barandas está habilitada para las indicaciones del modelo. Si está habilitada, elija la acción que desee para su barandilla. El bloqueo está activado de forma predeterminada. Para obtener más información, consulte Opciones para gestionar el contenido dañino detectado por Amazon Bedrock Guardrails.

    4. (Opcional) En la opción de salida, especifique si la evaluación mediante barandillas está habilitada para las respuestas del modelo. Si está habilitada, elige qué acción quieres que tome tu barandilla con las respuestas. El bloqueo está activado de forma predeterminada. Para obtener más información, consulte Opciones para gestionar el contenido dañino detectado por Amazon Bedrock Guardrails.

    5. (Opcional) Amplíe Añadir ejemplos de frases e introduzca una frase que sea representativa de las preguntas o respuestas relacionadas con este tema. Puedes introducir hasta cinco frases. Para cada frase que incluyas, selecciona Añadir frase.

    6. En el nivel de temas denegados, elige el nivel de protección que quieres que utilice tu barandilla para bloquear los temas en las preguntas y respuestas. Para obtener más información, consulte Proteja los niveles para las políticas de barandas.

    7. Cuando haya terminado de configurar el tema denegado, seleccione Confirmar.

    8. Repite los pasos anteriores para crear más temas rechazados.

    9. Seleccione Siguiente para configurar otras políticas según sea necesario o Saltar a revisar y crear para terminar de crear la barandilla.

  5. Revisa la configuración de tu barandilla.

    1. Seleccione Editar en cualquier sección en la que desee realizar cambios.

    2. Cuando haya terminado de configurar las políticas, seleccione Crear para crear la barandilla.

API

Agrega los temas rechazados a tu barandilla enviando una solicitud. CreateGuardrail Así es como se ve el formato de la solicitud:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "inputAction": "BLOCK | NONE", "inputEnabled": true, "name": "string", "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "DENY" }, "tierConfig": { "tierName": "CLASSIC | STANDARD" }, ] }, "crossRegionConfig": { "guardrailProfileIdentifier": "string" }, "description": "string", "name": "string" }
  • Especifique los mensajes para cuando la barrera de protección bloquee correctamente una petición o una respuesta del modelo en los campos blockedInputMessaging y blockedOutputsMessaging.

  • Especifique los temas para que la barrera de protección los rechace en el objeto topicPolicyConfig. Cada elemento de la lista topicsConfig pertenece a un tema.

    • Especifica un name y definition para el tema que se debe denegar.

    • Especifique DENY en el campo type.

    • Especifique la acción que se debe realizar cuando se detecte el tema en las solicitudes que se utilizan inputAction o en las respuestas que se utilizanoutputAction. Elija BLOCK bloquear el contenido y sustituirlo por mensajes bloqueados, o bien no NONE realizar ninguna acción y devolver la información de detección. Para obtener más información, consulte Opciones para gestionar el contenido dañino detectado por Amazon Bedrock Guardrails.

    • Configure inputEnabled y outputEnabled controle si la evaluación de barandas está habilitada para las solicitudes y respuestas del modelo.

    • (Opcional) En la examples lista, especifique hasta cinco ejemplos de frases que representen las preguntas o respuestas relacionadas con este tema.

  • (Opcional) Especifique un nivel de protección para la barandilla del objeto. tierConfig Las opciones incluyen niveles STANDARD y niveles. CLASSIC

    Para obtener más información, consulte Proteja los niveles para las políticas de barandas.

  • (Opcional) Para habilitar la inferencia entre regiones, especifique un perfil de barandilla en el objeto. crossRegionConfig Esto es obligatorio cuando se utiliza el nivel. STANDARD

  • Especifique un name y una description para la barrera de protección.

El formato de respuesta tiene el siguiente aspecto:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }