Eliminación de la PII de las conversaciones con filtros de información confidencial - Amazon Bedrock

Eliminación de la PII de las conversaciones con filtros de información confidencial

Barreras de protección para Amazon Bedrock ayuda a detectar información confidencial, como la información de identificación personal (PII), en las peticiones de entrada o en las respuestas de los modelos. También puede configurar la información confidencial específica de su caso de uso u organización. Para ello, defina dicha información con expresiones regulares.

Puede configurar los siguientes modos de gestión de la información confidencial que detecta la barrera de protección:

  • Bloquear: las políticas de filtrado de información confidencial pueden bloquear las solicitudes o respuestas que incluyen información confidencial. Algunos ejemplos de este tipo de aplicaciones pueden ser aplicaciones generales de preguntas y respuestas basadas en documentos públicos. Si se detecta información confidencial en la petición o en la respuesta, la barrera de protección bloquea todo el contenido y devuelve un mensaje que ha configurado usted previamente.

  • Enmascarar: las políticas de filtrado de información confidencial pueden enmascarar o censurar información de las respuestas del modelo. Por ejemplo, las barreras de protección enmascaran la PII y generan resúmenes de las conversaciones entre los usuarios y los agentes del servicio de atención al cliente. Si se detecta información confidencial en la solicitud o respuesta del modelo, la barrera de protección la oculta y la sustituye con el tipo PII (por ejemplo, {NAME} o{EMAIL}).

Barreras de protección para Amazon Bedrock ofrece la posibilidad de bloquear o anonimizar la PII:

  • General

    • ADDRESS

      Una dirección física, como, por ejemplo: “100 Main Street, Anytown, USA” or “Suite n.º 12, Building 123”. Una dirección puede incluir información como la calle, el edificio, la ubicación, la ciudad, el estado, el país, el condado, el código postal, el distrito y el barrio.

    • AGE

      La edad de una persona, incluidas la cantidad y la unidad de tiempo. Por ejemplo, en la frase “Tengo 40 años”, las barreras de protección de Amazon Bedrock reconocen “40 años” como la edad.

    • NAME

      Se trata del nombre de una persona. Este tipo de entidad no incluye títulos como Dr., Sr., Sra. o Srta. Las barreras de protección de Amazon Bedrock no aplican este tipo de entidad a los nombres que forman parte de organizaciones o direcciones. Por ejemplo, las barreras de protección reconocen la “Organización John Doe” como una organización y la “calle Jane Doe” como una dirección.

    • EMAIL

      Una dirección de correo electrónico, como marymajor@email.com.

    • PHONE

      Un número de teléfono. Este tipo de entidad también incluye números de fax y buscapersonas.

    • USERNAME

      Se trata de nombre de usuario que identifica una cuenta, como un nombre de inicio de sesión, un nombre de usuario, un apodo o un identificador.

    • PASSWORD

      Se trata de una cadena alfanumérica que se utiliza como contraseña, como, por ejemplo: “*seña#20muyespecial*”.

    • DRIVER_ID

      Se trata del número asignado a la licencia de conducir, que es un documento oficial que permite a una persona conducir uno o más vehículos motorizados en una vía pública. El número de licencia de conducir se compone de caracteres alfanuméricos.

    • LICENSE_PLATE

      La matrícula de un vehículo es emitida por el estado o el país donde está registrado el vehículo. El formato de matrículas de los vehículos de pasajeros suele ser de cinco a ocho dígitos y consta de letras mayúsculas y números. El formato varía según la ubicación del estado o país emisor.

    • VEHICLE_IDENTIFICATION_NUMBER

      Un número de identificación de vehículo (VIN) identifica de manera única a un vehículo. El contenido y el formato del VIN se definen en la especificación ISO 3779. Cada país tiene códigos y formatos específicos para los VIN.

  • Finanzas

    • CREDIT_DEBIT_CARD_CVV

      Se trata de un código de verificación de tarjeta (CVV) de tres dígitos que está presente en las tarjetas de crédito y débito VISA, MasterCard y Discover. En el caso de las tarjetas de crédito o débito American Express, el CVV es un código numérico de cuatro dígitos.

    • CREDIT_DEBIT_CARD_EXPIRY

      Se trata de la fecha de caducidad de la tarjeta de crédito o débito. Este número suele tener cuatro dígitos y, por lo general, tiene el formato de mes/año o MM/AA. Las barreras de protección de Amazon Bedrock reconocen fechas de caducidad, como 01/21, 01/2021 y enero de 2021.

    • CREDIT_DEBIT_CARD_NUMBER

      Se trata del número de una tarjeta de crédito o débito. La longitud de estos números puede oscilar entre 13 y 16 dígitos. Sin embargo, Amazon Bedrock también reconoce los números de las tarjetas de crédito o débito cuando solo están presentes los últimos cuatro dígitos.

    • PIN

      Se trata de un número de identificación personal (PIN) de cuatro dígitos con el que puede acceder a su cuenta bancaria.

    • INTERNATIONAL_BANK_ACCOUNT_NUMBER

      Un número de cuenta bancaria internacional tiene formatos específicos en cada país. Para obtener más información, visite www.iban.com/structure.

    • SWIFT_CODE

      Un código SWIFT es un formato estándar del código de identificación bancaria (BIC) que se utiliza para especificar un banco o sucursal en particular. Los bancos utilizan estos códigos para las transferencias de dinero, como las transferencias bancarias internacionales.

      Los códigos SWIFT constan de 8 u 11 caracteres. Los códigos de 11 dígitos se refieren a sucursales específicas, mientras que los códigos de 8 dígitos (o los códigos de 11 dígitos que terminan en “XXX”) se refieren a la oficina central o principal.

  • TI

    • IP_ADDRESS

      Se trata de una dirección IPv4, como 198.51.100.0.

    • MAC_ADDRESS

      Una dirección de control de acceso al medio (MAC) es un identificador único asignado a un controlador de interfaz de red (NIC).

    • URL de

      Una dirección web, como www.ejemplo.com.

    • AWS_ACCESS_KEY

      Se trata de un identificador único que está asociado a una clave de acceso secreta. El ID de la clave de acceso y la clave de acceso secreta se utilizan para firmar criptográficamente las solicitudes programáticas de AWS.

    • AWS_SECRET_KEY

      Se trata de un identificador único que está asociado a una clave de acceso. El ID de clave de acceso y la clave de acceso secreta se utiliza para firmar criptográficamente las solicitudes programáticas de AWS.

  • Específico de Estados Unidos

    • US_BANK_ACCOUNT_NUMBER

      Se trata de un número de cuenta bancaria de EE. UU., que suele tener entre 10 y 12 dígitos.

    • US_BANK_ROUTING_NUMBER

      número de ruta de la cuenta bancaria en EE. UU Suelen tener nueve dígitos.

    • US_INDIVIDUAL_TAX_IDENTIFICATION_NUMBER

      El número de identificación fiscal individual (ITIN) de los EE. UU. es un número de nueve dígitos que comienza con un “9” y contiene un “7” u “8” como cuarto dígito. Se puede formatear un ITIN con un espacio o un guion después del tercer y cuarto dígitos.

    • US_PASSPORT_NUMBER

      Número de pasaporte de EE. UU. Los números de pasaporte oscilan entre seis y nueve caracteres alfanuméricos.

    • US_SOCIAL_SECURITY_NUMBER

      Un número de seguridad social (SSN) de los EE. UU. es un número de nueve dígitos que se emite a los ciudadanos estadounidenses, los residentes permanentes y los residentes que trabajan temporalmente.

  • Específico de Canadá

    • CA_HEALTH_NUMBER

      El número del Servicio de Salud de Canadá es un identificador único de 10 dígitos que se requiere para que las personas accedan a los beneficios de atención médica.

    • CA_SOCIAL_INSURANCE_NUMBER

      El número de seguridad social canadiense (SIN) es un identificador único de nueve dígitos que las personas necesitan para acceder a los programas y beneficios del Gobierno.

      El SIN sigue un formato de tres grupos de tres dígitos, como 123-456-789. Se puede validar un SIN mediante un sencillo proceso de verificación de dígitos denominado algoritmo de Luhn.

  • Específico del Reino Unido

    • UK_NATIONAL_HEALTH_SERVICE_NUMBER

      Un número del Servicio Nacional de Salud del Reino Unido es un número de 10 a 17 dígitos, como 485 777 3456. El sistema actual formatea el número de 10 dígitos con espacios después del tercer y el sexto dígito. El último dígito es una suma de comprobación que detecta errores.

    • UK_NATIONAL_INSURANCE_NUMBER

      Un número de seguridad social del Reino Unido (NINO) proporciona a las personas acceso a las prestaciones del National Insurance (seguridad social). También se utiliza para algunos fines en el sistema tributario del Reino Unido.

      El número tiene nueve dígitos y comienza con dos letras, seguidas de seis números y una letra. Se puede formatear un NINO con un espacio o un guion después de las dos letras y después del segundo, cuarto y sexto dígitos.

    • UK_UNIQUE_TAXPAYER_REFERENCE_NUMBER

      Una referencia tributaria única (UTR) del Reino Unido es un número de 10 dígitos que identifica a un contribuyente o a una empresa.

  • Personalizada

    • Filtro de expresiones regulares

      Puede usar expresiones regulares para definir patrones que una barrera de protección pueda reconocer y sobre los que actuar, como el número de serie y el ID de reserva.

nota

El modelo PII funciona de manera más eficaz cuando se le proporciona contexto suficiente. Para mejorar su precisión, incluya más información contextual y evite enviar palabras sueltas o frases cortas al modelo. Dado que la PII puede depender del contexto (por ejemplo, una cadena de dígitos puede representar una AWS KMS key o un ID de usuario en función de la información que la rodea), proporcionar el contexto completo es crucial para una identificación precisa.

nota

Un filtro de expresiones regulares personalizado de filtros de información confidencial no admite la búsqueda retrospectiva de coincidencias en la expresión.

Configuración de una política de información confidencial para su barrera de protección

Puede configurar políticas de información confidencial para su barrera de protección mediante la Consola de administración de AWS o la API de Amazon Bedrock.

Console
  1. Inicie sesión en la Consola de administración de AWS con una identidad de IAM que tenga permisos para usar la consola de Amazon Bedrock. A continuación, abra la consola de Amazon Bedrock en https://console.aws.amazon.com/bedrock/.

  2. En el panel de navegación izquierdo, elija Barreras de protección y, a continuación, elija Crear barrera de protección.

  3. En la página Proporcione los detalles de la barrera de protección, haga lo siguiente:

    1. En la sección Detalles de la barrera de protección, proporcione un Nombre y, si lo desea, una Descripción para la barrera de protección.

    2. En Mensajes para peticiones bloqueadas, escriba un mensaje que muestre cuándo se aplica la barrera de protección. Seleccione la casilla de verificación para Aplicar el mismo mensaje bloqueado para las respuestas para usar el mismo mensaje cuando se aplique la barrera de protección en la respuesta.

    3. (Opcional) Para habilitar la inferencia entre regiones para su barrera de protección, expanda Inferencia entre regiones y, a continuación, seleccione Habilitar la inferencia entre regiones para su barrera de protección. Elija un perfil de barrera de protección que defina las Regiones de AWS de destino a las que se pueden enrutar las solicitudes de inferencia de barreras de protección.

    4. (Opcional) De forma predeterminada, la barrera de protección está cifrada con una Clave administrada de AWS. Para usar su propia clave de KMS administrada por el cliente, expanda Selección de clave de KMS y seleccione la casilla de verificación Personalizar configuración de cifrado (avanzado).

      Puede seleccionar una clave de AWS KMS existente o seleccionar Crear una clave de AWS KMS nueva.

    5. (Opcional) Para añadir etiquetas a la barrera de protección, expanda Etiquetas y, a continuación, seleccione Agregar nueva etiqueta para cada etiqueta que defina.

      Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.

    6. Elija Siguiente.

  4. En la página Agregar filtros de información confidencial, haga lo siguiente para configurar filtros para bloquear o enmascarar la información confidencial:

    1. En la sección Tipos de PII, configure las categorías de información de identificación personal (PII) para bloquearlas, enmascararlas o no realizar ninguna acción (modo de detección). Dispone de las opciones siguientes:

      • Para añadir todos los tipos de PII, seleccione la flecha desplegable situada junto a Añadir tipo de PII. A continuación, seleccione el comportamiento de la barrera de protección que desee aplicarles.

        aviso

        Si especifica un comportamiento, se sobrescribirá cualquier comportamiento existente que haya configurado para los tipos de PII.

      • Para eliminar un tipo de PII, seleccione el icono de la papelera ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ).

      • Para eliminar las filas que contienen errores, seleccione Eliminar todo y, a continuación, Eliminar todas las filas con errores.

      • Para eliminar todos los tipos de PII, seleccione Eliminar todo y, a continuación, Eliminar todas las filas.

      • Para buscar una fila, introduzca una expresión en la barra de búsqueda.

      • Para mostrar solo las filas con errores, seleccione el menú desplegable denominado Mostrar todo y Mostrar solo errores.

      • Para configurar el tamaño de cada página de la tabla o la visualización de las columnas de la tabla, seleccione el icono de configuración ( Gear icon representing settings or configuration options. ). Defina sus preferencias y, a continuación, seleccione Confirmar.

    2. En la sección Patrones de expresiones regulares, use expresiones regulares para definir los patrones que debe filtrar la barrera de protección. Dispone de las opciones siguientes:

      • Para añadir un patrón, seleccione Agregar patrón de expresión regular. Configure los siguientes campos:

        Campo Descripción
        Nombre Nombre para el patrón
        Patrón de expresiones regulares Expresión regular que define el patrón de registro
        Input Elija si desea bloquear el contenido que contiene el patrón o enmascararlo con un identificador. Para no realizar ninguna acción, seleccione Detectar (sin acción).
        Output
        Agregación de una descripción (Opcional) Escriba una descripción del patrón
      • Para editar un patrón, seleccione el icono de los tres puntos en la misma fila que el tema en la columna Acciones. Luego, seleccione Editar. Cuando haya terminado de editar, seleccione Confirmar.

      • Para eliminar uno o varios patrones, seleccione las casillas de verificación de los patrones que desee eliminar. Seleccione Eliminar y, a continuación, Eliminar el elemento seleccionado.

      • Para eliminar todos los patrones, seleccione Eliminar y, a continuación, Eliminar todo.

      • Para buscar un patrón, introduzca una expresión en la barra de búsqueda.

      • Para configurar el tamaño de cada página de la tabla o la visualización de las columnas de la tabla, seleccione el icono de configuración ( Gear icon representing settings or configuration options. ). Defina sus preferencias y, a continuación, seleccione Confirmar.

    3. Cuando termine de configurar los filtros de información confidencial, seleccione Siguiente o Saltar a Revisar y crear.

API

Para crear una barrera de protección con políticas de información confidencial, envíe una solicitud CreateGuardrail. El formato de la solicitud es el siguiente:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [{ "type": "ADDRESS | EMAIL | PHONE | NAME | SSN | ...", "action": "BLOCK | ANONYMIZE | NONE", "inputAction": "BLOCK | ANONYMIZE | NONE", "inputEnabled": true, "outputAction": "BLOCK | ANONYMIZE | NONE", "outputEnabled": true }], "regexesConfig": [{ "name": "string", "pattern": "string", "action": "BLOCK | ANONYMIZE | NONE", "description": "string", "inputAction": "BLOCK | ANONYMIZE | NONE", "inputEnabled": true, "outputAction": "BLOCK | ANONYMIZE | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }
  • Especifique un name y una description para la barrera de protección.

  • Especifique los mensajes para cuando la barrera de protección bloquee correctamente una petición o una respuesta del modelo en los campos blockedInputMessaging y blockedOutputsMessaging.

  • Configure las políticas de información confidencial en el objeto sensitiveInformationPolicyConfig:

    • Utilice la matriz piiEntitiesConfig para configurar los tipos de entidades de PII predefinidos:

      • Especifique el tipo de entidad de PII en el campo type. Los valores válidos incluyen ADDRESS, EMAIL, PHONE, NAME y US_SOCIAL_SECURITY_NUMBER, entre otros.

      • Especifique la acción que se debe realizar cuando se detecte la entidad PII en el campo action. Elija BLOCK para bloquear el contenido, ANONYMIZE para enmascararlo o NONE para no realizar ninguna acción excepto devolver la información de detección.

      • (Opcional) Utilice inputAction, inputEnabled, outputAction y outputEnabled para configurar diferentes comportamientos para las peticiones y las respuestas.

    • Utilice la matriz regexesConfig para definir los patrones personalizados que se deben detectar:

      • Especifique un name para el patrón de expresiones regulares (de 1 a 100 caracteres).

      • Defina el pattern de la expresión regular que se va a detectar (de 1 a 500 caracteres).

      • Especifique la action que se debe realizar cuando se detecte el patrón. Elija BLOCK para bloquear el contenido, ANONYMIZE para enmascararlo o NONE para no realizar ninguna acción excepto devolver la información de detección.

      • (Opcional) Proporcione una description para el patrón de expresiones regulares (de 1 a 1000 caracteres).

      • (Opcional) Utilice inputAction, inputEnabled, outputAction y outputEnabled para configurar diferentes comportamientos para las peticiones y las respuestas.

  • (Opcional) Asocie las etiquetas que quiera a la barrera de protección. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.

  • (Opcional) Por motivos de seguridad, incluya el ARN de una clave de KMS en el campo kmsKeyId.

  • (Opcional) Para habilitar la inferencia entre regiones, especifique un perfil de barrera de protección en el objeto crossRegionConfig.

El formato de la respuesta es el siguiente:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }