Bloquear tópicos negados para ajudar a remover conteúdo prejudicial - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Bloquear tópicos negados para ajudar a remover conteúdo prejudicial

Você pode especificar um conjunto de tópicos negados em uma grade de proteção que não sejam desejáveis no contexto de seu aplicativo generativo de IA. Por exemplo, um banco pode querer que seu assistente de IA evite conversas relacionadas a consultoria de investimento ou criptomoedas.

As solicitações e respostas do modelo em linguagem natural são avaliadas em relação a cada tópico negado em sua grade de proteção. Se um dos tópicos negados for detectado, sua grade de proteção retornará uma mensagem bloqueada.

Crie um tópico negado com os seguintes parâmetros, que sua grade de proteção usa para detectar se uma solicitação ou resposta pertence ao tópico:

  • Nome — O nome do tópico. O nome deve ser um substantivo ou uma frase. Não descreva o tópico no nome. Por exemplo:

    • Investment Advice

  • Definição — Até 200 caracteres resumindo o conteúdo do tópico. A definição deve descrever o conteúdo do tópico e seus subtópicos.

    Veja a seguir um exemplo de definição de tópico.

    Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.

  • Exemplos de frases (opcional) — Uma lista de até cinco exemplos de frases que se referem ao tópico. Cada frase pode ter até 100 caracteres. Um exemplo é um prompt ou uma continuação que mostra que tipo de conteúdo deve ser filtrado. Por exemplo:

    • Is investing in the stocks better than bonds?

    • Should I invest in gold?

Práticas recomendadas para criar tópicos negados

  • Defina o tópico de forma nítida e precisa. Uma definição de tópico clara e inequívoca pode melhorar a precisão da detecção do tópico. Por exemplo, um tópico para detectar consultas ou declarações associadas a criptomoedas pode ser definido como Question or information associated with investing, selling, transacting, or procuring cryptocurrencies.

  • Não inclua exemplos ou instruções na definição do tópico. Por exemplo, Block all contents associated to cryptocurrency é uma instrução e não uma definição do tópico. Essas instruções não devem ser usadas como parte das definições do tópico.

  • Não defina tópicos negativos ou exceções. Por exemplo, All contents except medical information ou Contents not containing medical information são definições negativas de um tópico e não devem ser usadas.

  • Não use tópicos negados para capturar entidades ou palavras. Por exemplo, Statement or questions containing the name of a person "X" ou Statements with a competitor name Y. As definições do tópico representam um tema ou um assunto e as barreiras de proteção avalizam uma entrada de forma contextual. A filtragem de tópicos não deve ser usada para capturar palavras individuais ou tipos de entidades. Para obter mais informaçõesRemova as PII das conversas usando filtros de informações confidenciais, consulte ou Remover uma lista específica de palavras e frases das conversas com filtros de palavras para esses casos de uso.

Adicione tópicos negados à sua grade de proteção

Você pode adicionar até 30 tópicos negados à sua grade de proteção usando a API Amazon Bedrock ou AWS Management Console Amazon Bedrock.

Console
  1. Faça login no AWS Management Console com uma identidade do IAM que tenha permissões para usar o console Amazon Bedrock. Em seguida, abra o console Amazon Bedrock em https://console.aws.amazon.com/bedrock/.

  2. No painel de navegação esquerdo, escolha Guardrails e, em seguida, escolha Create guardrail.

  3. Na página Fornecer detalhes do guardrail, faça o seguinte:

    1. Na seção Detalhes da barreira de proteção, forneça um Nome e uma Descrição opcional para a barreira de proteção.

    2. Em Mensagens para solicitações bloqueadas, insira uma mensagem que será exibida quando sua grade de proteção for aplicada. Marque a caixa de seleção Aplicar a mesma mensagem bloqueada para respostas para usar a mesma mensagem quando sua grade de proteção for aplicada à resposta.

    3. (Opcional) Para ativar a inferência entre regiões para sua grade de proteção, expanda a inferência entre regiões e selecione Ativar inferência entre regiões para sua grade de proteção. Escolha um perfil de guardrail que defina o destino para Regiões da AWS onde as solicitações de inferência de guardrail podem ser roteadas.

    4. (Opcional) Por padrão, sua grade de proteção é criptografada com um. Chave gerenciada pela AWS Para usar sua própria chave KMS gerenciada pelo cliente, expanda a seleção de chaves KMS e marque a caixa de seleção Personalizar configurações de criptografia (avançadas).

      Você pode selecionar uma AWS KMS chave existente ou selecionar Criar uma AWS KMS chave para criar uma nova.

    5. (Opcional) Para adicionar tags à sua grade de proteção, expanda Tags e selecione Adicionar nova tag para cada tag que você definir.

      Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.

    6. Escolha Próximo.

  4. Ao acessar a página Adicionar tópicos negados, escolha Adicionar tópico negado e faça o seguinte:

    1. Insira um Nome para o tópico.

    2. Em Definição, defina o tópico. Para obter as diretrizes sobre como definir um tópico negado, consulte Bloquear tópicos negados para ajudar a remover conteúdo prejudicial.

    3. (Opcional) Em Entrada, especifique se a avaliação da grade de proteção está habilitada para solicitações do modelo. Se ativado, escolha qual ação você deseja usar na grade de proteção. O bloqueio está ativado por padrão. Para obter mais informações, consulte Opções para lidar com conteúdo nocivo detectado pelo Amazon Bedrock Guardrails.

    4. (Opcional) Em Saída, especifique se a avaliação da grade de proteção está habilitada para respostas do modelo. Se ativado, escolha qual ação você deseja que sua grade de proteção execute nas respostas. O bloqueio está ativado por padrão. Para obter mais informações, consulte Opções para lidar com conteúdo nocivo detectado pelo Amazon Bedrock Guardrails.

    5. (Opcional) Expanda Adicionar exemplos de frases e insira uma frase que represente solicitações ou respostas relacionadas a esse tópico. Você pode inserir até cinco frases. Para cada frase que você incluir, selecione Adicionar frase.

    6. Para o nível de tópicos negados, escolha o nível de proteção que você deseja que sua grade de proteção use para bloquear tópicos em solicitações e respostas. Para obter mais informações, consulte Níveis de proteção para políticas de grades de proteção.

    7. Quando concluir a configuração do tópico negado, selecione Confirmar.

    8. Repita as etapas anteriores para criar tópicos adicionais negados.

    9. Escolha Avançar para configurar outras políticas conforme necessário ou Ir para revisar e criar para concluir a criação de sua grade de proteção.

  5. Revise as configurações do seu guarda-corpo.

    1. Selecione Editar em qualquer seção na qual desejar fazer alterações.

    2. Quando terminar de configurar as políticas, selecione Criar para criar a grade de proteção.

API

Adicione tópicos negados à sua grade de proteção enviando uma CreateGuardrailsolicitação. Veja como é o formato da solicitação:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "inputAction": "BLOCK | NONE", "inputEnabled": true, "name": "string", "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "DENY" }, "tierConfig": { "tierName": "CLASSIC | STANDARD" }, ] }, "crossRegionConfig": { "guardrailProfileIdentifier": "string" }, "description": "string", "name": "string" }
  • Especifique mensagens para quando a barreira de proteção bloquear um prompt ou uma resposta do modelo com sucesso nos campos blockedInputMessaging e blockedOutputsMessaging.

  • Especifique tópicos para a barreira de proteção negar no objeto topicPolicyConfig. Cada item na lista de topicsConfig pertence a um tópico.

    • Especifique um name e definition para o tópico que deve ser negado.

    • Especifique DENY no campo type.

    • Especifique a ação a ser tomada quando o tópico for detectado em prompts usando inputAction ou respostas usandooutputAction. Escolha BLOCK bloquear o conteúdo e substituí-lo por mensagens bloqueadas ou não NONE realizar nenhuma ação além de retornar as informações de detecção. Para obter mais informações, consulte Opções para lidar com conteúdo nocivo detectado pelo Amazon Bedrock Guardrails.

    • outputEnabledDefina inputEnabled e para controlar se a avaliação do guarda-corpo está habilitada para solicitações e respostas do modelo.

    • (Opcional) Na examples lista, especifique até cinco exemplos de frases que você representa de solicitações ou respostas relacionadas a esse tópico.

  • (Opcional) Especifique um nível de proteção para sua grade de proteção no objeto. tierConfig As opções incluem CLASSIC níveis STANDARD e níveis.

    Para obter mais informações, consulte Níveis de proteção para políticas de grades de proteção.

  • (Opcional) Para habilitar a inferência entre regiões, especifique um perfil de proteção no objeto. crossRegionConfig Isso é necessário ao usar o STANDARD nível.

  • Especifique um name e uma description para a barreira de proteção.

O formato da resposta tem a seguinte aparência:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }