Configurazione dei filtri di contenuto per Amazon Bedrock Guardrails - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configurazione dei filtri di contenuto per Amazon Bedrock Guardrails

Con Amazon Bedrock Guardrails, puoi configurare filtri di contenuto per bloccare i prompt e le risposte del modello in linguaggio naturale per testo e immagini contenenti contenuti dannosi. Ad esempio, un sito di e-commerce può progettare il proprio assistente online in modo da evitare l'uso di linguaggio e/o immagini inappropriati.

Filtra, classificazione e livelli di blocco

Il filtraggio viene eseguito in base alla classificazione di confidenza degli input degli utenti e delle risposte FM in ciascuna delle sei categorie. Tutti gli input dell'utente e le risposte FM sono classificati in base a quattro livelli di intensità:NONE,LOW, MEDIUM e. HIGH Ad esempio, se un'affermazione è classificata come Odio con HIGH fiducia, la probabilità che tale affermazione rappresenti contenuti incitanti all'odio è elevata. Una singola dichiarazione può essere classificata in più categorie con diversi livelli di confidenza. Ad esempio, una singola affermazione può essere classificata come Odio con HIGH fiducia, Insulti con LOW confidenza, Confidenza sessuale e Violenza con NONE MEDIUM confidenza.

Forza del filtro

Puoi configurare la potenza dei filtri per ciascuna delle categorie di filtri di contenuto. L'intensità del filtro determina la sensibilità del filtraggio dei contenuti nocivi. All'aumentare della potenza del filtro, aumenta la probabilità di filtrare i contenuti dannosi e diminuisce la probabilità di vedere contenuti dannosi nell'applicazione.

Sono disponibili quattro livelli di potenza del filtro

  • Nessuno: non sono stati applicati filtri di contenuto. Sono consentiti tutti gli input utente e le uscite generate da FM.

  • Bassa: la resistenza del filtro è bassa. I contenuti classificati come pericolosi con HIGH sicurezza verranno filtrati. Saranno consentiti i contenuti classificati come LOW nocivi o MEDIUM suscettibili di riservatezza. NONE

  • Medio: i contenuti classificati come pericolosi HIGH e MEDIUM sicuri verranno eliminati. I contenuti classificati come pericolosi NONE o con LOW riservatezza saranno consentiti.

  • Alta: rappresenta la configurazione di filtraggio più rigorosa. I contenuti classificati come pericolosi MEDIUM e LOW sicuri verranno eliminati. HIGH Saranno consentiti contenuti ritenuti innocui.

Resistenza del filtro Confidenza dei contenuti bloccati Confidenza dei contenuti consentita
Nessuno Nessun filtro Nessuno, basso, medio, alto
Bassa Elevata Nessuno, basso, medio
Media Alto, medio Nessuna, bassa
Elevata Alto, medio, basso Nessuno