Bloqueo de los temas denegados para ayudar a eliminar el contenido dañino

Puede especificar un conjunto de temas denegados en una barrera de protección no deseables en el contexto de la aplicación de IA generativa. Por ejemplo, un banco puede querer que su asistente de IA evite cualquier conversación relacionada con consejos sobre inversiones o criptomonedas.

Las solicitudes y respuestas del modelo en lenguaje natural, así como el contenido relacionado con el código en el nivel Estándar, se evalúan en función de cada tema rechazado en su barandilla. Si se detecta uno de los temas denegados, la barrera de protección devuelve un mensaje bloqueado.

Cree un tema denegado con los siguientes parámetros, que la barrera de protección utilizará para detectar si una petición o una respuesta pertenecen al tema:

Nombre: el nombre del tema. El nombre debe ser un sustantivo o una frase. No describa el tema en el nombre. Por ejemplo:
- Investment Advice
Definición: hasta 200 caracteres que resumen el contenido del tema. La definición debe describir el contenido del tema y sus subtemas.

A continuación se muestra un ejemplo de definición de tema que puede proporcionar:

Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.
Frases de ejemplo (opcional): lista de hasta cinco frases de ejemplo que hacen referencia al tema. Cada frase puede tener hasta 100 caracteres. Un ejemplo es una petición o continuación que muestra qué tipo de contenido debe filtrarse. Por ejemplo:
- Is investing in the stocks better than bonds?
- Should I invest in gold?

Prácticas recomendadas para crear temas denegados

Defina el tema de una manera nítida y precisa. Una definición clara e inequívoca del tema puede mejorar la precisión a la hora de detectar el tema. Por ejemplo, un tema para detectar consultas o afirmaciones asociadas a las criptomonedas se puede definir como Question or information associated with investing, selling, transacting, or procuring cryptocurrencies.
No incluya ejemplos ni instrucciones en la definición del tema. Por ejemplo, Block all contents associated to cryptocurrency es una instrucción y no una definición del tema. Estas instrucciones no deben usarse como parte de las definiciones del tema.
No defina temas negativos ni excepciones. Por ejemplo, All contents except medical information o Contents not containing medical information son definiciones negativas de un tema y no deben usarse.
No utilice temas denegados para capturar entidades o palabras. Por ejemplo, Statement or questions containing the name of a person "X" o Statements with a competitor name Y. Las definiciones de los temas representan un tema o un asunto y las barreras de protección evalúan una entrada dentro del contexto. Los filtros de temas no deben usarse para capturar palabras individuales o tipos de entidades. Para obtener más información, consulte Eliminación de la PII de las conversaciones con filtros de información confidencial o Eliminación de una lista específica de palabras y frases de las conversaciones con filtros de palabras para estos casos de uso.

Adición de temas denegados a su barrera de protección

Puede añadir hasta 30 temas rechazados a su barandilla mediante la API o Consola de administración de AWS Amazon Bedrock.

Console

Inicie sesión Consola de administración de AWS con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola Amazon Bedrock en https://console.aws.amazon.com/bedrock.
En el panel de navegación izquierdo, elija Barreras de protección y, a continuación, elija Crear barrera de protección.
En la página Proporcione los detalles de la barrera de protección, haga lo siguiente:
1. En la sección Detalles de la barrera de protección, proporcione un Nombre y, si lo desea, una Descripción para la barrera de protección.
2. En Mensajes para peticiones bloqueadas, escriba un mensaje que muestre cuándo se aplica la barrera de protección. Seleccione la casilla de verificación para Aplicar el mismo mensaje bloqueado para las respuestas para usar el mismo mensaje cuando se aplique la barrera de protección en la respuesta.
3. (Opcional) Para habilitar la inferencia entre regiones para su barandilla, amplíe la inferencia y, a continuación, seleccione Habilitar Cross-Region la inferencia entre regiones para su barandilla. Elija un perfil de barandilla que defina el destino al que se pueden enrutar las solicitudes de inferencia de barandillas. Regiones de AWS
4. (Opcional) De forma predeterminada, la barandilla está cifrada con un. Clave administrada de AWS Para usar su propia clave de KMS administrada por el cliente, expanda Selección de clave de KMS y seleccione la casilla de verificación Personalizar configuración de cifrado (avanzado).
  
  Puede seleccionar una AWS KMS clave existente o seleccionar Crear una AWS KMS clave para crear una nueva.
5. (Opcional) Para añadir etiquetas a la barrera de protección, expanda Etiquetas y, a continuación, seleccione Agregar nueva etiqueta para cada etiqueta que defina.
  
  Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.
6. Elija Siguiente.
Cuando acceda a la página Agregar temas denegados, seleccione Agregar tema denegado y haga lo siguiente:
1. Ingrese un nombre para el nuevo tema.
2. En Definición, defina el tema. Para obtener instrucciones sobre cómo definir un tema denegado, consulte Bloqueo de los temas denegados para ayudar a eliminar el contenido dañino.
3. (Opcional) En Entrada, especifique si la evaluación de barreras de protección está habilitada para las peticiones del modelo. Si está activada, elija la acción que desee que realice la barrera de protección. Bloquear está habilitado de forma predeterminada. Para obtener más información, consulte Opciones para tratar contenido dañino detectado por Barreras de protección para Amazon Bedrock.
4. (Opcional) En Salida, especifique si la evaluación de barreras de protección está habilitada para las respuestas del modelo. Si está activada, elija la acción que desee que realice la barrera de protección en las respuestas. Bloquear está habilitado de forma predeterminada. Para obtener más información, consulte Opciones para tratar contenido dañino detectado por Barreras de protección para Amazon Bedrock.
5. (Opcional) Expanda Agregar frases de ejemplo e introduzca una frase que sea representativa de las peticiones o respuestas relacionadas con este tema. Puede introducir hasta cinco frases. Para cada frase que incluya, seleccione Agregar frase.
6. En el Nivel de temas denegados, elija el nivel de protección que quiere que utilice su barrera de protección para bloquear los temas en las peticiones y respuestas. Para obtener más información, consulte Niveles de protección para las políticas de barreras de protección.
7. Cuando haya terminado de configurar el tema denegado, seleccione Confirmar.
8. Para crear temas denegados adicionales, repita los pasos anteriores.
9. Elija Siguiente para configurar otras políticas según sea necesario u Omitir para revisar y crear para terminar de crear su barrera de protección.
Revise la configuración de la barrera de protección.
1. Seleccione Editar en cualquier sección en la que desee realizar cambios.
2. Cuando haya terminado de configurar las políticas, seleccione Crear para crear la barrera de protección.

API

Añade los temas rechazados a tu barandilla enviando una CreateGuardrailsolicitud. A continuación se muestra el formato de la solicitud:


POST /guardrails HTTP/1.1
Content-type: application/json

{
   "blockedInputMessaging": "string",
   "blockedOutputsMessaging": "string",
   "topicPolicyConfig": {
      "topicsConfig": [ 
         { 
            "definition": "string",
            "examples": [ "string" ],
            "inputAction": "BLOCK | NONE",
            "inputEnabled": true,
            "name": "string",
            "outputAction": "BLOCK | NONE",
            "outputEnabled": true,
            "type": "DENY"
         },
      "tierConfig": { 
         "tierName": "CLASSIC | STANDARD"
      },
      ]
   },
   "crossRegionConfig": { 
      "guardrailProfileIdentifier": "string"
   },
   "description": "string",
   "name": "string"
}

Especifique los mensajes para cuando la barrera de protección bloquee correctamente una petición o una respuesta del modelo en los campos blockedInputMessaging y blockedOutputsMessaging.
Especifique los temas para que la barrera de protección los rechace en el objeto topicPolicyConfig. Cada elemento de la lista topicsConfig pertenece a un tema.
- Especifique un name y definition para el tema que debe denegarse.
- Especifique DENY en el campo type.
- Especifique la acción que se debe realizar cuando se detecte el tema en las peticiones que utilizan inputAction o en las respuestas que utilizan outputAction. Elija BLOCK para bloquear el contenido y sustituirlo por mensajes bloqueados o bien NONE para no realizar ninguna acción, pero devolver la información de detección. Para obtener más información, consulte Opciones para tratar contenido dañino detectado por Barreras de protección para Amazon Bedrock.
- Configure inputEnabled y outputEnabled para controlar si la evaluación de barreras de protección está habilitada para las peticiones y respuestas del modelo.
- (Opcional) En la lista examples, especifique hasta cinco ejemplos de frases que representen las peticiones o respuestas relacionadas con este tema.
(Opcional) Especifique un nivel de protección para la barrera de protección en el objeto tierConfig. Las opciones incluyen los niveles STANDARD y CLASSIC.

Para obtener más información, consulte Niveles de protección para las políticas de barreras de protección.
(Opcional) Para habilitar la inferencia entre regiones, especifique un perfil de barrera de protección en el objeto crossRegionConfig. Esto es obligatorio cuando se utiliza el nivel STANDARD.
Especifique un name y una description para la barrera de protección.

El formato de la respuesta tiene un aspecto similar al siguiente:


HTTP/1.1 202
Content-type: application/json

{
   "createdAt": "string",
   "guardrailArn": "string",
   "guardrailId": "string",
   "version": "string"
}

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Ataques de peticiones

Adición de filtros de palabras