Classificação do filtro e níveis de bloqueio Intensidade do filtro

Configurar filtros de conteúdo para Barreiras de Proteção do Amazon Bedrock

Com as Barreiras de Proteção do Amazon Bedrock, você pode configurar filtros de conteúdo para bloquear prompts e respostas do modelo em linguagem natural para textos e imagens que contenham conteúdo nocivo. Por exemplo, um site de comércio eletrônico pode criar um assistente on-line para evitar o uso de linguagem ou imagens impróprias.

Classificação do filtro e níveis de bloqueio

A filtragem é feita com base na classificação de confiança das entradas do usuário e das respostas do FM em cada uma das seis categorias. Todas as entradas do usuário e respostas do FM são classificadas em quatro níveis de resistência: NONE, LOW, MEDIUM e HIGH. Por exemplo, se uma declaração for classificada como Ódio com confiança HIGH, a probabilidade dessa declaração representar conteúdo de ódio é alta. Uma única declaração pode ser classificada em várias categorias com níveis de confiança variados. Por exemplo, uma única declaração pode ser classificada como ódio com confiança HIGH, insulto com confiança LOW, sexual com NONE e violência com confiança MEDIUM.

Intensidade do filtro

É possível configurar a intensidade dos filtros para cada uma das categorias do filtro de conteúdo. A intensidade do filtro determina a sensibilidade da filtragem de conteúdo prejudicial. À medida que a intensidade do filtro aumenta, a probabilidade de filtrar conteúdo prejudicial aumenta, e a probabilidade de ver conteúdo prejudicial na aplicação diminui.

Você tem quatro níveis de intensidade de filtro

Nenhum: não há filtros de conteúdo aplicados. Todas as entradas e saídas do usuário são FM-generated permitidas.
Baixo: a intensidade do filtro é baixa. O conteúdo classificado como prejudicial com confiança HIGH será filtrado. O conteúdo classificado como prejudicial com confiança NONE, LOW ou MEDIUM será permitido.
Médio: o conteúdo classificado como prejudicial com confiança HIGH e MEDIUM será filtrado. O conteúdo classificado como prejudicial com confiança NONE ou LOW será permitido.
Alto: esse representa a configuração de filtragem mais rigorosa. O conteúdo classificado como prejudicial com confiança HIGH, MEDIUM e LOW será filtrado. Conteúdo considerado inofensivo será permitido.

Intensidade do filtro	Confiança de conteúdo bloqueado	Confiança de conteúdo permitido
Nenhum	Sem filtragem	Nenhum, Baixo, Médio, Alto
Baixo	Alto	Nenhum, Baixo, Médio
Médio	Alto, Médio	Nenhum, Baixo
Alto	Alto, Médio, Baixo	Nenhum

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Criar uma barreira de proteção

Filtros de conteúdo (texto)