Configurar uma política de informações sensíveis para a barreira de proteção

Remova as PII das conversas usando filtros de informações confidenciais

O Amazon Bedrock Guardrails ajuda a detectar informações confidenciais, como informações de identificação pessoal (PII), em solicitações de entrada ou modelar respostas usando filtros de informações confidenciais. Esse filtro suporta somente saída de texto e não detectará informações de PII quando os modelos responderem com parâmetros de saída tool_use (chamada de função) por meio de APIs compatíveis. Esse filtro é uma solução probabilística baseada em aprendizado de máquina (ML) que depende do contexto e detecta informações confidenciais com base no contexto nas solicitações de entrada ou nas respostas do modelo. Você pode configurar selecionando um conjunto de PIIs incorporadas oferecidas pelo Amazon Bedrock Guardrails específicas para seu caso de uso ou organização, definindo-as junto com expressões regulares (regex personalizada) que funcionam com base na correspondência de padrões para bloquear ou mascarar dados de PII.

A detecção de informações confidenciais funciona tanto em linguagem natural quanto em domínios de código, incluindo sintaxe de código, comentários, caracteres literais e conteúdo híbrido. Isso ajuda a identificar PII incorporadas em elementos de código, como nomes de variáveis, credenciais codificadas ou documentação de código.

Você pode configurar os seguintes modos para lidar com informações sensíveis detectadas pelas barreiras de proteção:

Bloquear: as políticas de filtro de informações sensíveis podem bloquear solicitações ou respostas que incluam informações sensíveis. Exemplos de tais aplicativos podem incluir perguntas e respostas gerais com base em documentos públicos. Se informações confidenciais forem detectadas no prompt ou na resposta, a barreira de proteção bloqueará todo o conteúdo e retornará uma mensagem que você configura.
Máscara: as políticas de filtro de informações sensíveis podem mascarar ou omitir informações das respostas do modelo. Por exemplo, as barreiras de proteção mascaram PIIs ao gerar resumos de conversas entre usuários e atendentes do serviço ao cliente. Se forem detectadas informações sensíveis na solicitação ou resposta do modelo, a barreira de proteção aplicará uma máscara e as substituirá pelo tipo de PII (por exemplo, {NAME} ou {EMAIL}).

As Barreiras de Proteção do Amazon Bedrock permitem bloquear ou anonimizar as seguintes PIIs:

Geral
- ADDRESS
  
  Um endereço físico, como “100 Main Street, Anytown, EUA” ou “Suíte #12, Edifício 123”. Um endereço pode incluir informações como rua, prédio, localização, cidade, estado, país, condado, código postal, distrito e bairro.
- AGE
  
  A idade de uma pessoa, incluindo a quantidade e a unidade de tempo. Por exemplo, na frase “Tenho 40 anos”, o Amazon Bedrock Guardrails reconhece “40 anos” como a idade.
- NAME
  
  O nome de uma pessoa. Esse tipo de entidade não inclui títulos, como Dr., Sr., Sra. ou Senhorita. O Amazon Bedrock Guardrails não aplica esse tipo de entidade a nomes que fazem parte de organizações ou endereços. Por exemplo, as barreiras de proteção reconhecem a “Organização John Doe” como uma organização e reconhecem a “Rua Jane Doe” como um endereço.
- EMAIL
  
  Um endereço de e-mail, como marymajor@email.com.
- PHONE
  
  Um número de telefone. Esse tipo de entidade também inclui números de fax e de pager.
- USERNAME
  
  Um nome de usuário que identifica uma conta, como um nome de login, nome de tela, apelido ou identificador.
- PASSWORD
  
  Uma string alfanumérica usada como senha, como “*very20special#pass*”.
- DRIVER_ID
  
  O número atribuído a uma carteira de motorista, que é um documento oficial que permite que uma pessoa opere um ou mais veículos motorizados em uma via pública. O número da carteira de motorista consiste em caracteres alfanuméricos.
- LICENSE_PLATE
  
  A placa de um veículo emitida pelo estado ou país em que o veículo está registrado. O formato para veículos de passageiros normalmente tem de cinco a oito dígitos, consistindo em letras maiúsculas e números. O formato varia de acordo com a localização do estado ou do país emissor.
- VEHICLE_IDENTIFICATION_NUMBER
  
  Um Número de identificação de veículo (VIN) identifica um veículo de forma exclusiva. O conteúdo e o formato do VIN são definidos na especificação ISO 3779. Cada país tem códigos e formatos específicos para VINs.
Finanças
- CREDIT_DEBIT_CARD_CVV
  
  Um código de verificação de cartão (CVV) de três dígitos que está presente nos cartões de crédito e débito VISA e Discover. MasterCard Para cartões de crédito ou de débito American Express, o CVV é um código numérico de quatro dígitos.
- CREDIT_DEBIT_CARD_EXPIRY
  
  A data de validade do cartão de crédito ou de débito. Esse número geralmente tem quatro dígitos e geralmente é formatado como month/yearou. MM/YY O Amazon Bedrock Guardrails reconhece datas de expiração como 01/2101/2021, e janeiro de 2021.
- CREDIT_DEBIT_CARD_NUMBER
  
  O número de um cartão de crédito ou de débito. Esses números podem variar de 13 a 16 dígitos. No entanto, o Amazon Bedrock também reconhece números de cartão de crédito ou de débito quando somente os últimos quatro dígitos estão presentes.
- PIN
  
  Um número de identificação pessoal (PIN) de quatro dígitos com o qual é possível acessar a sua conta bancária.
- INTERNATIONAL_BANK_ACCOUNT_NUMBER
  
  Um número de conta bancária internacional tem formatos específicos em cada país. Para obter mais informações, consulte www.iban. com/structure.
- SWIFT_CODE
  
  Um código SWIFT é um formato padrão do Código identificador bancário (BIC) usado para especificar um determinado banco ou agência. Os bancos usam esses códigos para transferências de dinheiro, como transferências eletrônicas internacionais.
  
  Os códigos SWIFT consistem em oito ou 11 caracteres. Os códigos de 11 dígitos se referem a filiais específicas, enquanto os códigos de oito dígitos (ou códigos de 11 dígitos terminados em 'XXX') se referem à sede ou ao escritório principal.
IT
- IP_ADDRESS
  
  Um endereço IPv4, como 198.51.100.0.
- MAC_ADDRESS
  
  Um endereço de controle de acesso à mídia (MAC) é um identificador exclusivo atribuído a um controlador de interface de rede (NIC).
- URL
  
  Um endereço da web, como www.example.com.
- AWS_ACCESS_KEY
  
  Um identificador exclusivo que é associado a uma chave de acesso secreta; você usa o ID da chave de acesso e a chave de acesso secreta para assinar solicitações programáticas da AWS de forma criptográfica.
- AWS_SECRET_KEY
  
  Um identificador exclusivo associado a uma chave de acesso. Você usa o ID da chave de acesso e a chave de acesso secreta para assinar AWS solicitações programáticas criptograficamente.
Específico dos EUA
- US_BANK_ACCOUNT_NUMBER
  
  Um número de conta bancária dos EUA, que normalmente tem de 10 a 12 dígitos.
- US_BANK_ROUTING_NUMBER
  
  Um número de roteamento de conta bancária dos EUA. Normalmente, tem nove dígitos,
- US_INDIVIDUAL_TAX_IDENTIFICATION_NUMBER
  
  Um Número de Identificação Fiscal Individual (ITIN) dos EUA é um número de nove dígitos que começa com um “9” e contém um “7” ou “8” como o quarto dígito. Um ITIN pode ser formatado com um espaço ou um traço após o terceiro e o quarto dígitos.
- US_PASSPORT_NUMBER
  
  Um número de passaporte dos EUA. Os números de passaportes variam de seis a nove caracteres alfanuméricos.
- US_SOCIAL_SECURITY_NUMBER
  
  O Social Security Number (SSN: Número de seguro social) dos EUA é um número de nove dígitos emitido para cidadãos dos EUA, residentes permanentes e residentes que trabalham temporariamente nos EUA.
Específico do Canadá
- CA_HEALTH_NUMBER
  
  O Canadian Health Service Number (Número do serviço de saúde canadense) é um identificador exclusivo de 10 dígitos, necessário para que as pessoas tenham acesso aos benefícios de saúde.
- CA_SOCIAL_INSURANCE_NUMBER
  
  O Canadian Social Insurance Number (SIN: Número do seguro social canadense) é um identificador exclusivo de nove dígitos, necessário para que as pessoas acessem programas e benefícios governamentais.
  
  O SIN é formatado como três grupos de três dígitos, como 123-456-789. Um SIN pode ser validado por meio de um processo simples de verificação de dígitos chamado algoritmo de Luhn.
Específico do Reino Unido
- UK_NATIONAL_HEALTH_SERVICE_NUMBER
  
  Um UK National Health Service Number (Número do Serviço Nacional de Saúde do Reino Unido) é um número de 10 a 17 dígitos, como 485 777 3456. O sistema atual formata o número de 10 dígitos com espaços após o terceiro e o sexto dígitos. O dígito final é uma soma de verificação que detecta erros.
- UK_NATIONAL_INSURANCE_NUMBER
  
  Um UK National Insurance Number (NINO: Número de seguro nacional do Reino Unido) que fornece às pessoas acesso aos benefícios do Seguro Nacional (previdência social). Também é usado para alguns fins no sistema tributário do Reino Unido.
  
  O número tem nove dígitos e começa com duas letras, seguidas por seis números e uma letra. Um NINO pode ser formatado com um espaço ou um traço após as duas letras e depois do segundo, quarto e sexto dígitos.
- UK_UNIQUE_TAXPAYER_REFERENCE_NUMBER
  
  Uma UK Unique Taxpayer Reference (UTR: Referência única de contribuinte do Reino Unido) é um número de 10 dígitos que identifica um contribuinte ou uma empresa.
Personalizado
- Filtro de expressão regular
  
  Você pode usar expressões regulares para definir padrões para uma grade de proteção reconhecer e agir de acordo com eles, como número de série, ID de reserva ou outros padrões personalizados.

nota

O modelo de PII tem um desempenho mais eficaz quando é fornecido com contexto suficiente. Para aumentar a precisão, inclua mais informações contextuais e evite enviar palavras únicas ou frases curtas ao modelo. Como as PII podem depender do contexto (por exemplo, uma string de dígitos pode representar uma AWS KMS key ou um ID de usuário, dependendo das informações ao redor), fornecer contexto abrangente é crucial para uma identificação precisa.

nota

O mascaramento de PII se aplica somente ao conteúdo enviado ao modelo de inferência (solicitações de entrada) e ao conteúdo retornado do modelo de inferência (respostas do modelo). Não se aplica ao seguinte:

Registros de invocação do modelo — Se você habilitouMonitore a invocação do modelo usando CloudWatch Logs e Amazon S3, o input campo no Amazon CloudWatch Logs sempre conterá a solicitação original e não modificada, independentemente da intervenção do guardrail. Para proteger informações confidenciais em seus registros, use a proteção de dados de CloudWatch log da Amazon.
Saída de rastreamento do Guardrails — O match campo retornado nas respostas da API (como o trace objeto da API Converse) contém o valor original da PII, não a saída mascarada. GuardrailPiiEntityFilter Esse comportamento é intencional para que seu aplicativo possa usar o resultado da detecção para sua própria lógica.

nota

Com um filtro de regex personalizado de informações sensíveis, não é possível encontrar correspondência lookaround de regex.

Configurar uma política de informações sensíveis para a barreira de proteção

Você pode configurar políticas de informações sensíveis para a barreira de proteção usando o Console de gerenciamento da AWS ou a API do Amazon Bedrock.

Console

Faça login no Console de gerenciamento da AWS com uma identidade do IAM que tenha permissões para usar o console Amazon Bedrock. Em seguida, abra o console Amazon Bedrock em https://console.aws.amazon.com/bedrock.
No painel de navegação à esquerda, escolha Barreiras de proteção e selecione Criar uma barreira de proteção.
Na página Fornecer detalhes da barreira de proteção, faça o seguinte:
1. Na seção Detalhes da barreira de proteção, forneça um Nome e uma Descrição opcional para a barreira de proteção.
2. Em Mensagens para prompts bloqueados, insira uma mensagem que exibida quando a barreira de proteção é aplicada. Marque a caixa de seleção Aplicar a mesma mensagem bloqueada para respostas para usar a mesma mensagem quando a barreira de proteção for aplicada na resposta.
3. (Opcional) Para ativar a inferência entre regiões para sua grade de proteção, expanda a inferência e selecione Ativar Cross-Region inferência entre regiões para sua grade de proteção. Escolha um perfil de guardrail que defina o destino para Regiões da AWS onde as solicitações de inferência de guardrail podem ser roteadas.
4. (Opcional) Por padrão, sua grade de proteção é criptografada com um. Chave gerenciada pela AWS Para usar sua própria chave do KMS gerenciada pelo cliente, expanda Seleção da chave do KMS e marque a caixa de seleção Personalizar configurações de criptografia (avançadas).
  
  Você pode selecionar uma AWS KMS chave existente ou selecionar Criar uma AWS KMS chave para criar uma nova.
5. (Opcional) Para adicionar tags à barreira de proteção, expanda Tags e selecione Adicionar nova tag para cada tag que você definir.
  
  Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.
6. Escolha Próximo.

Na página Adicionar filtros de informações confidenciais, faça o seguinte para configurar filtros para bloquear ou mascarar informações sensíveis:

Na seção Tipos de PII, configure as categorias de informações de identificação pessoal (PII) a serem bloqueadas, ou mascaradas ou que não exigem nenhuma ação (modo de detecção). Você tem as seguintes opções:
- Para adicionar todos os tipos de PII, selecione a seta suspensa ao lado de Adicionar um tipo de PII. Selecione o comportamento da barreira de proteção a ser aplicado a eles.
  
  Atenção
  Se você especificar um comportamento, qualquer comportamento existente que tenha configurado para tipos de PII será substituído.
- Para excluir um tipo de PII, selecione o ícone da lixeira ( ).
- Para excluir linhas que contêm erros, selecione Excluir tudo e selecione Excluir todas as linhas com erro
- Para excluir todos os tipos de PII, selecione Excluir tudo e Excluir todas as linhas
- Para pesquisar uma linha, insira uma expressão na barra de pesquisa.
- Para mostrar somente linhas com erros, selecione o menu suspenso Mostrar tudo e selecione Mostrar somente erros.
- Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( ). Defina suas preferências e selecione Confirmar.

Na seção Padrões Regex, use expressões regulares para definir padrões para a barreira de proteção filtrar. Você tem as seguintes opções:

Para adicionar um padrão, selecione Adicionar padrão regex. Configure os campos a seguir.

Campo	Description
Nome	Um nome para o padrão
Padrão Regex	Uma expressão regular que define o padrão
Input	Escolha se deseja bloquear conteúdo que contém o padrão ou mascarar o conteúdo com um identificador. Para não realizar nenhuma ação, selecione Detectar (nenhuma ação).
Output
Adicionar descrição	(Opcional) Escrever uma descrição para o padrão

Para editar um padrão, selecione o ícone de três pontos na mesma linha do tópico na coluna Ações. Selecione Editar. Ao concluir a edição, selecione Confirmar.
Para excluir um padrão ou padrões, marque as caixas de seleção dos padrões a serem excluídos. Selecione Excluir e Sim, excluir.
Para excluir todos os padrões, selecione Excluir e Excluir tudo.
Para pesquisar um padrão, insira uma expressão na barra de pesquisa.
Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( ). Defina suas preferências e selecione Confirmar.

Ao concluir a configuração dos filtros de informações confidenciais, selecione Próximo ou Ir para analisar e criar.

API

Para criar uma grade de proteção com políticas de informações confidenciais, envie uma CreateGuardrailsolicitação. O formato da solicitação é o seguinte:


POST /guardrails HTTP/1.1
Content-type: application/json

{
    "blockedInputMessaging": "string",
    "blockedOutputsMessaging": "string",
    "sensitiveInformationPolicyConfig": {
        "piiEntitiesConfig": [{
            "type": "ADDRESS | EMAIL | PHONE | NAME | SSN | ...",
            "action": "BLOCK | ANONYMIZE | NONE",
            "inputAction": "BLOCK | ANONYMIZE | NONE",
            "inputEnabled": true,
            "outputAction": "BLOCK | ANONYMIZE | NONE",
            "outputEnabled": true
        }],
        "regexesConfig": [{
            "name": "string",
            "pattern": "string",
            "action": "BLOCK | ANONYMIZE | NONE",
            "description": "string",
            "inputAction": "BLOCK | ANONYMIZE | NONE",
            "inputEnabled": true,
            "outputAction": "BLOCK | ANONYMIZE | NONE",
            "outputEnabled": true
        }]
    },
    "description": "string",
    "kmsKeyId": "string",
    "name": "string",
    "tags": [{
        "key": "string",
        "value": "string"
    }],
    "crossRegionConfig": {
        "guardrailProfileIdentifier": "string"
    }
}

Especifique um name e uma description para a barreira de proteção.
Especifique mensagens para quando a barreira de proteção bloquear um prompt ou uma resposta do modelo com sucesso nos campos blockedInputMessaging e blockedOutputsMessaging.
Configure políticas de informações sensíveis no objeto sensitiveInformationPolicyConfig:
- Use a matriz piiEntitiesConfig para configurar tipos de entidade de PII predefinidos:
  - Especifique o tipo de entidade PII no campo type. Os valores válidos incluem ADDRESS, EMAIL, PHONE, NAME, US_SOCIAL_SECURITY_NUMBER, entre outros.
  - No campo action, especifique a ação a ser executada quando a entidade PII for detectada. Escolha BLOCK para bloquear conteúdo, ANONYMIZE para mascarar o conteúdo ou NONE para não realizar nenhuma ação mas exibir informações de detecção.
  - (Opcional) Use inputAction, inputEnabled, outputAction e outputEnabled para configurar comportamentos diferentes para prompts e respostas.
- Use a matriz regexesConfig para definir padrões personalizados para detecção:
  - Especifique um name para o padrão de regex (1-100 caracteres).
  - Defina a expressão regular pattern a ser detectada (de 1 a 500 caracteres).
  - Especifique a action a ser realizada quando o padrão for detectado. Escolha BLOCK para bloquear conteúdo, ANONYMIZE para mascarar o conteúdo ou NONE para não realizar nenhuma ação mas exibir informações de detecção.
  - (Opcional) Forneça uma description para o padrão de regex (1-1.000 caracteres).
  - (Opcional) Use inputAction, inputEnabled, outputAction e outputEnabled para configurar comportamentos diferentes para prompts e respostas.
(Opcional) Anexe todas as tags à barreira de proteção. Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.
(Opcional) Por segurança, inclua o ARN de uma chave do KMS no campo. kmsKeyId.
(Opcional) Para habilitar a inferência entre regiões, especifique um perfil de barreira de proteção no objeto crossRegionConfig.

O formato da resposta é o seguinte:


HTTP/1.1 202
Content-type: application/json

{
    "createdAt": "string",
    "guardrailArn": "string",
    "guardrailId": "string",
    "version": "string"
}

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Adicionar filtros de palavras

Adicionar verificações de base contextual