Remova as PII das conversas usando filtros de informações confidenciais - Amazon Bedrock

Remova as PII das conversas usando filtros de informações confidenciais

As Barreiras de Proteção do Amazon Bedrock ajudam a detectar informações sensíveis, como informações de identificação pessoal (PII) em formato padrão em prompts de entrada ou respostas de modelo. Você também pode configurar informações confidenciais específicas para seu caso de uso ou organização definindo-as com expressões regulares (regex).

Você pode configurar os seguintes modos para lidar com informações sensíveis detectadas pelas barreiras de proteção:

  • Bloquear: as políticas de filtro de informações sensíveis podem bloquear solicitações ou respostas que incluam informações sensíveis. Exemplos de tais aplicações podem incluir aplicações gerais de perguntas e respostas baseadas em documentos públicos. Se informações confidenciais forem detectadas no prompt ou na resposta, a barreira de proteção bloqueará todo o conteúdo e retornará uma mensagem que você configura.

  • Máscara: as políticas de filtro de informações sensíveis podem mascarar ou omitir informações das respostas do modelo. Por exemplo, as barreiras de proteção mascaram PIIs ao gerar resumos de conversas entre usuários e atendentes do serviço ao cliente. Se forem detectadas informações sensíveis na solicitação ou resposta do modelo, a barreira de proteção aplicará uma máscara e as substituirá pelo tipo de PII (por exemplo, {NAME} ou {EMAIL}).

As Barreiras de Proteção do Amazon Bedrock permitem bloquear ou anonimizar as seguintes PIIs:

  • Geral

    • ADDRESS

      Um endereço físico, como “100 Main Street, Anytown, EUA” ou “Suíte #12, Edifício 123”. Um endereço pode incluir informações como rua, prédio, localização, cidade, estado, país, condado, código postal, distrito e bairro.

    • AGE

      A idade de uma pessoa, incluindo a quantidade e a unidade de tempo. Por exemplo, na frase “Tenho 40 anos”, o Amazon Bedrock Guardrails reconhece “40 anos” como a idade.

    • NAME

      O nome de uma pessoa. Esse tipo de entidade não inclui títulos, como Dr., Sr., Sra. ou Senhorita. O Amazon Bedrock Guardrails não aplica esse tipo de entidade a nomes que fazem parte de organizações ou endereços. Por exemplo, as barreiras de proteção reconhecem a “Organização John Doe” como uma organização e reconhecem a “Rua Jane Doe” como um endereço.

    • EMAIL

      Um endereço de e-mail, como marymajor@email.com.

    • PHONE

      Um número de telefone. Esse tipo de entidade também inclui números de fax e de pager.

    • USERNAME

      Um nome de usuário que identifica uma conta, como um nome de login, nome de tela, apelido ou identificador.

    • PASSWORD

      Uma string alfanumérica usada como senha, como “*very20special#pass*”.

    • DRIVER_ID

      O número atribuído a uma carteira de motorista, que é um documento oficial que permite que uma pessoa opere um ou mais veículos motorizados em uma via pública. O número da carteira de motorista consiste em caracteres alfanuméricos.

    • LICENSE_PLATE

      A placa de um veículo emitida pelo estado ou país em que o veículo está registrado. O formato para veículos de passageiros normalmente tem de cinco a oito dígitos, consistindo em letras maiúsculas e números. O formato varia de acordo com a localização do estado ou do país emissor.

    • VEHICLE_IDENTIFICATION_NUMBER

      Um Número de identificação de veículo (VIN) identifica um veículo de forma exclusiva. O conteúdo e o formato do VIN são definidos na especificação ISO 3779. Cada país tem códigos e formatos específicos para VINs.

  • Finanças

    • CREDIT_DEBIT_CARD_CVV

      Um código de verificação de cartão (CVV) de três dígitos presente nos cartões de crédito e de débito VISA, MasterCard e Discover. Para cartões de crédito ou de débito American Express, o CVV é um código numérico de quatro dígitos.

    • CREDIT_DEBIT_CARD_EXPIRY

      A data de validade do cartão de crédito ou de débito. Esse número geralmente tem quatro dígitos e é formatado como mês/ano ou MM/AA. O Amazon Bedrock Guardrails reconhece datas de expiração como 01/21, 01/2021 e Jan 2021.

    • CREDIT_DEBIT_CARD_NUMBER

      O número de um cartão de crédito ou de débito. Esses números podem variar de 13 a 16 dígitos. No entanto, o Amazon Bedrock também reconhece números de cartão de crédito ou de débito quando somente os últimos quatro dígitos estão presentes.

    • PIN

      Um número de identificação pessoal (PIN) de quatro dígitos com o qual é possível acessar a sua conta bancária.

    • INTERNATIONAL_BANK_ACCOUNT_NUMBER

      Um número de conta bancária internacional tem formatos específicos em cada país. Para obter mais informações, consulte www.iban.com/structure.

    • SWIFT_CODE

      Um código SWIFT é um formato padrão do Código identificador bancário (BIC) usado para especificar um determinado banco ou agência. Os bancos usam esses códigos para transferências de dinheiro, como transferências eletrônicas internacionais.

      Os códigos SWIFT consistem em oito ou 11 caracteres. Os códigos de 11 dígitos se referem a filiais específicas, enquanto os códigos de oito dígitos (ou códigos de 11 dígitos terminados em 'XXX') se referem à sede ou ao escritório principal.

  • IT

    • IP_ADDRESS

      Um endereço IPv4, como 198.51.100.0.

    • MAC_ADDRESS

      Um endereço de controle de acesso à mídia (MAC) é um identificador exclusivo atribuído a um controlador de interface de rede (NIC).

    • URL do

      Um endereço da web, como www.example.com.

    • AWS_ACCESS_KEY

      Um identificador exclusivo que é associado a uma chave de acesso secreta; você usa o ID da chave de acesso e a chave de acesso secreta para assinar solicitações programáticas da AWS de forma criptográfica.

    • AWS_SECRET_KEY

      Um identificador exclusivo associado a uma chave de acesso. Você usa o ID da chave de acesso e a chave de acesso secreta para assinar solicitações programáticas da AWS de forma criptográfica.

  • Específico dos EUA

    • US_BANK_ACCOUNT_NUMBER

      Um número de conta bancária dos EUA, que normalmente tem de 10 a 12 dígitos.

    • US_BANK_ROUTING_NUMBER

      Um número de roteamento de conta bancária dos EUA. Normalmente, tem nove dígitos,

    • US_INDIVIDUAL_TAX_IDENTIFICATION_NUMBER

      Um Número de Identificação Fiscal Individual (ITIN) dos EUA é um número de nove dígitos que começa com um “9” e contém um “7” ou “8” como o quarto dígito. Um ITIN pode ser formatado com um espaço ou um traço após o terceiro e o quarto dígitos.

    • US_PASSPORT_NUMBER

      Um número de passaporte dos EUA. Os números de passaportes variam de seis a nove caracteres alfanuméricos.

    • US_SOCIAL_SECURITY_NUMBER

      O Social Security Number (SSN: Número de seguro social) dos EUA é um número de nove dígitos emitido para cidadãos dos EUA, residentes permanentes e residentes que trabalham temporariamente nos EUA.

  • Específico do Canadá

    • CA_HEALTH_NUMBER

      O Canadian Health Service Number (Número do serviço de saúde canadense) é um identificador exclusivo de 10 dígitos, necessário para que as pessoas tenham acesso aos benefícios de saúde.

    • CA_SOCIAL_INSURANCE_NUMBER

      O Canadian Social Insurance Number (SIN: Número do seguro social canadense) é um identificador exclusivo de nove dígitos, necessário para que as pessoas acessem programas e benefícios governamentais.

      O SIN é formatado como três grupos de três dígitos, como 123-456-789. Um SIN pode ser validado por meio de um processo simples de verificação de dígitos chamado algoritmo de Luhn.

  • Específico do Reino Unido

    • UK_NATIONAL_HEALTH_SERVICE_NUMBER

      Um UK National Health Service Number (Número do Serviço Nacional de Saúde do Reino Unido) é um número de 10 a 17 dígitos, como 485 777 3456. O sistema atual formata o número de 10 dígitos com espaços após o terceiro e o sexto dígitos. O dígito final é uma soma de verificação que detecta erros.

    • UK_NATIONAL_INSURANCE_NUMBER

      Um UK National Insurance Number (NINO: Número de seguro nacional do Reino Unido) que fornece às pessoas acesso aos benefícios do Seguro Nacional (previdência social). Também é usado para alguns fins no sistema tributário do Reino Unido.

      O número tem nove dígitos e começa com duas letras, seguidas por seis números e uma letra. Um NINO pode ser formatado com um espaço ou um traço após as duas letras e depois do segundo, quarto e sexto dígitos.

    • UK_UNIQUE_TAXPAYER_REFERENCE_NUMBER

      Uma UK Unique Taxpayer Reference (UTR: Referência única de contribuinte do Reino Unido) é um número de 10 dígitos que identifica um contribuinte ou uma empresa.

  • Personalizado

    • Filtro de expressão regular

      É possível usar expressões regulares (regex) para definir padrões para uma barreira de proteção reconhecer e agir de acordo com eles, como número de série ou ID de reserva.

nota

O modelo de PII tem um desempenho mais eficaz quando é fornecido com contexto suficiente. Para aumentar a precisão, inclua mais informações contextuais e evite enviar palavras únicas ou frases curtas ao modelo. Como as PII podem depender do contexto (por exemplo, uma string de dígitos pode representar uma AWS KMS key ou um ID de usuário, dependendo das informações ao redor), fornecer contexto abrangente é crucial para uma identificação precisa.

nota

Com um filtro de regex personalizado de informações sensíveis, não é possível encontrar correspondência lookaround de regex.

Configurar uma política de informações sensíveis para a barreira de proteção

Você pode configurar políticas de informações sensíveis para a barreira de proteção usando o Console de gerenciamento da AWS ou a API do Amazon Bedrock.

Console
  1. Faça login no Console de gerenciamento da AWS com uma identidade do IAM que tenha permissões para usar o console do Amazon Bedrock. Em seguida, abra o console do Amazon Bedrock em https://console.aws.amazon.com/bedrock/.

  2. No painel de navegação à esquerda, escolha Barreiras de proteção e selecione Criar uma barreira de proteção.

  3. Na página Fornecer detalhes da barreira de proteção, faça o seguinte:

    1. Na seção Detalhes da barreira de proteção, forneça um Nome e uma Descrição opcional para a barreira de proteção.

    2. Em Mensagens para prompts bloqueados, insira uma mensagem que exibida quando a barreira de proteção é aplicada. Marque a caixa de seleção Aplicar a mesma mensagem bloqueada para respostas para usar a mesma mensagem quando a barreira de proteção for aplicada na resposta.

    3. (Opcional) Para habilitar a inferência entre regiões para a barreira de proteção, expanda Inferência entre regiões e selecione Habilitar inferência entre regiões para sua barreira de proteção. Escolha um perfil de barreira de proteção que defina as Regiões da AWS de destino para as quais as solicitações de inferência de barreira de proteção podem ser roteadas.

    4. (Opcional) Por padrão, a barreira de proteção é criptografada com uma Chave gerenciada pela AWS. Para usar sua própria chave do KMS gerenciada pelo cliente, expanda Seleção da chave do KMS e marque a caixa de seleção Personalizar configurações de criptografia (avançadas).

      É possível selecionar uma chave do AWS KMS existente ou selecionar Criar uma chave do AWS KMS para criar uma chave.

    5. (Opcional) Para adicionar tags à barreira de proteção, expanda Tags e selecione Adicionar nova tag para cada tag que você definir.

      Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.

    6. Escolha Próximo.

  4. Na página Adicionar filtros de informações confidenciais, faça o seguinte para configurar filtros para bloquear ou mascarar informações sensíveis:

    1. Na seção Tipos de PII, configure as categorias de informações de identificação pessoal (PII) a serem bloqueadas, ou mascaradas ou que não exigem nenhuma ação (modo de detecção). Você tem as seguintes opções:

      • Para adicionar todos os tipos de PII, selecione a seta suspensa ao lado de Adicionar um tipo de PII. Selecione o comportamento da barreira de proteção a ser aplicado a eles.

        Atenção

        Se você especificar um comportamento, qualquer comportamento existente que tenha configurado para tipos de PII será substituído.

      • Para excluir um tipo de PII, selecione o ícone da lixeira ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ).

      • Para excluir linhas que contêm erros, selecione Excluir tudo e selecione Excluir todas as linhas com erro

      • Para excluir todos os tipos de PII, selecione Excluir tudo e Excluir todas as linhas

      • Para pesquisar uma linha, insira uma expressão na barra de pesquisa.

      • Para mostrar somente linhas com erros, selecione o menu suspenso Mostrar tudo e selecione Mostrar somente erros.

      • Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( Gear icon representing settings or configuration options. ). Defina suas preferências e selecione Confirmar.

    2. Na seção Padrões Regex, use expressões regulares para definir padrões para a barreira de proteção filtrar. Você tem as seguintes opções:

      • Para adicionar um padrão, selecione Adicionar padrão regex. Configure os campos a seguir.

        Campo Descrição
        Nome Um nome para o padrão
        Padrão Regex Uma expressão regular que define o padrão
        Entrada Escolha se deseja bloquear conteúdo que contém o padrão ou mascarar o conteúdo com um identificador. Para não realizar nenhuma ação, selecione Detectar (nenhuma ação).
        Resultado
        Adicionar descrição (Opcional) Escrever uma descrição para o padrão
      • Para editar um padrão, selecione o ícone de três pontos na mesma linha do tópico na coluna Ações. Selecione Editar. Ao concluir a edição, selecione Confirmar.

      • Para excluir um padrão ou padrões, marque as caixas de seleção dos padrões a serem excluídos. Selecione Excluir e Sim, excluir.

      • Para excluir todos os padrões, selecione Excluir e Excluir tudo.

      • Para pesquisar um padrão, insira uma expressão na barra de pesquisa.

      • Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( Gear icon representing settings or configuration options. ). Defina suas preferências e selecione Confirmar.

    3. Ao concluir a configuração dos filtros de informações confidenciais, selecione Próximo ou Ir para analisar e criar.

API

Para criar uma barreira de proteção com políticas de informações sensíveis, envie uma solicitação CreateGuardrail. O formato da solicitação é o seguinte:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [{ "type": "ADDRESS | EMAIL | PHONE | NAME | SSN | ...", "action": "BLOCK | ANONYMIZE | NONE", "inputAction": "BLOCK | ANONYMIZE | NONE", "inputEnabled": true, "outputAction": "BLOCK | ANONYMIZE | NONE", "outputEnabled": true }], "regexesConfig": [{ "name": "string", "pattern": "string", "action": "BLOCK | ANONYMIZE | NONE", "description": "string", "inputAction": "BLOCK | ANONYMIZE | NONE", "inputEnabled": true, "outputAction": "BLOCK | ANONYMIZE | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }
  • Especifique um name e uma description para a barreira de proteção.

  • Especifique mensagens para quando a barreira de proteção bloquear um prompt ou uma resposta do modelo com sucesso nos campos blockedInputMessaging e blockedOutputsMessaging.

  • Configure políticas de informações sensíveis no objeto sensitiveInformationPolicyConfig:

    • Use a matriz piiEntitiesConfig para configurar tipos de entidade de PII predefinidos:

      • Especifique o tipo de entidade PII no campo type. Os valores válidos incluem ADDRESS, EMAIL, PHONE, NAME, US_SOCIAL_SECURITY_NUMBER, entre outros.

      • No campo action, especifique a ação a ser executada quando a entidade PII for detectada. Escolha BLOCK para bloquear conteúdo, ANONYMIZE para mascarar o conteúdo ou NONE para não realizar nenhuma ação mas exibir informações de detecção.

      • (Opcional) Use inputAction, inputEnabled, outputAction e outputEnabled para configurar comportamentos diferentes para prompts e respostas.

    • Use a matriz regexesConfig para definir padrões personalizados para detecção:

      • Especifique um name para o padrão de regex (1-100 caracteres).

      • Defina a expressão regular pattern a ser detectada (de 1 a 500 caracteres).

      • Especifique a action a ser realizada quando o padrão for detectado. Escolha BLOCK para bloquear conteúdo, ANONYMIZE para mascarar o conteúdo ou NONE para não realizar nenhuma ação mas exibir informações de detecção.

      • (Opcional) Forneça uma description para o padrão de regex (1-1.000 caracteres).

      • (Opcional) Use inputAction, inputEnabled, outputAction e outputEnabled para configurar comportamentos diferentes para prompts e respostas.

  • (Opcional) Anexe todas as tags à barreira de proteção. Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.

  • (Opcional) Por segurança, inclua o ARN de uma chave do KMS no campo. kmsKeyId.

  • (Opcional) Para habilitar a inferência entre regiões, especifique um perfil de barreira de proteção no objeto crossRegionConfig.

O formato da resposta é o seguinte:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }