Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Configurazione dei filtri di contenuto per Amazon Bedrock Guardrails
Con Amazon Bedrock Guardrails, puoi configurare filtri di contenuto per bloccare i prompt e le risposte del modello in linguaggio naturale per testo e immagini contenenti contenuti dannosi. Ad esempio, un sito di e-commerce può progettare il proprio assistente online in modo da evitare l'uso di linguaggio e/o immagini inappropriati.
Filtra, classificazione e livelli di blocco
Il filtraggio viene eseguito in base alla classificazione di confidenza degli input degli utenti e delle risposte FM in ciascuna delle sei categorie. Tutti gli input dell'utente e le risposte FM sono classificati in base a quattro livelli di intensità:NONE
,LOW
, MEDIUM
e. HIGH
Ad esempio, se un'affermazione è classificata come Odio con HIGH
fiducia, la probabilità che tale affermazione rappresenti contenuti incitanti all'odio è elevata. Una singola dichiarazione può essere classificata in più categorie con diversi livelli di confidenza. Ad esempio, una singola affermazione può essere classificata come Odio con HIGH
fiducia, Insulti con LOW
confidenza, Confidenza sessuale e Violenza con NONE
MEDIUM
confidenza.
Forza del filtro
Puoi configurare la potenza dei filtri per ciascuna delle categorie di filtri di contenuto. L'intensità del filtro determina la sensibilità del filtraggio dei contenuti nocivi. All'aumentare della potenza del filtro, aumenta la probabilità di filtrare i contenuti dannosi e diminuisce la probabilità di vedere contenuti dannosi nell'applicazione.
Sono disponibili quattro livelli di potenza del filtro
-
Nessuno: non sono stati applicati filtri di contenuto. Sono consentiti tutti gli input utente e le uscite generate da FM.
-
Bassa: la resistenza del filtro è bassa. I contenuti classificati come pericolosi con
HIGH
sicurezza verranno filtrati. Saranno consentiti i contenuti classificati comeLOW
nocivi oMEDIUM
suscettibili di riservatezza.NONE
-
Medio: i contenuti classificati come pericolosi
HIGH
eMEDIUM
sicuri verranno eliminati. I contenuti classificati come pericolosiNONE
o conLOW
riservatezza saranno consentiti. -
Alta: rappresenta la configurazione di filtraggio più rigorosa. I contenuti classificati come pericolosi
MEDIUM
eLOW
sicuri verranno eliminati.HIGH
Saranno consentiti contenuti ritenuti innocui.
Resistenza del filtro | Confidenza dei contenuti bloccati | Confidenza dei contenuti consentita |
---|---|---|
Nessuno | Nessun filtro | Nessuno, basso, medio, alto |
Bassa | Elevata | Nessuno, basso, medio |
Media | Alto, medio | Nessuna, bassa |
Elevata | Alto, medio, basso | Nessuno |