Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Configurazione dei filtri di contenuto per Amazon Bedrock Guardrails
Con Amazon Bedrock Guardrails, puoi configurare filtri di contenuto per bloccare i prompt e le risposte del modello in linguaggio naturale per testo e immagini contenenti contenuti dannosi. Ad esempio, un sito di e-commerce può progettare il proprio assistente online in modo da evitare l'uso di linguaggio e/o immagini inappropriati.
Filtra, classificazione e livelli di blocco
Il filtraggio viene eseguito in base alla classificazione di confidenza degli input degli utenti e delle risposte FM in ciascuna delle sei categorie. Tutti gli input dell'utente e le risposte FM sono classificati in base a quattro livelli di intensità:NONE,LOW, MEDIUM e. HIGH Ad esempio, se un'affermazione è classificata come Odio con HIGH fiducia, la probabilità che tale affermazione rappresenti contenuti incitanti all'odio è elevata. Una singola dichiarazione può essere classificata in più categorie con diversi livelli di confidenza. Ad esempio, una singola affermazione può essere classificata come Odio con HIGH fiducia, Insulti con LOW confidenza, Confidenza sessuale e Violenza con NONE MEDIUM confidenza.
Forza del filtro
Puoi configurare la potenza dei filtri per ciascuna delle categorie di filtri di contenuto. L'intensità del filtro determina la sensibilità del filtraggio dei contenuti nocivi. All'aumentare della potenza del filtro, aumenta la probabilità di filtrare i contenuti dannosi e diminuisce la probabilità di vedere contenuti dannosi nell'applicazione.
Sono disponibili quattro livelli di potenza del filtro
-
Nessuno: non sono stati applicati filtri di contenuto. Sono consentiti tutti gli input utente e le uscite generate da FM.
-
Bassa: la resistenza del filtro è bassa. I contenuti classificati come pericolosi con
HIGHsicurezza verranno filtrati. Saranno consentiti i contenuti classificati comeLOWnocivi oMEDIUMsuscettibili di riservatezza.NONE -
Medio: i contenuti classificati come pericolosi
HIGHeMEDIUMsicuri verranno eliminati. I contenuti classificati come pericolosiNONEo conLOWriservatezza saranno consentiti. -
Alta: rappresenta la configurazione di filtraggio più rigorosa. I contenuti classificati come pericolosi
MEDIUMeLOWsicuri verranno eliminati.HIGHSaranno consentiti contenuti ritenuti innocui.
| Resistenza del filtro | Confidenza dei contenuti bloccati | Confidenza dei contenuti consentita |
|---|---|---|
| Nessuno | Nessun filtro | Nessuno, basso, medio, alto |
| Bassa | Elevata | Nessuno, basso, medio |
| Media | Alto, medio | Nessuna, bassa |
| Elevata | Alto, medio, basso | Nessuno |