Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Rimuovere le informazioni di identificazione personale dalle conversazioni utilizzando filtri per informazioni sensibili
Amazon Bedrock Guardrails aiuta a rilevare informazioni sensibili, come le informazioni di identificazione personale (PII), nelle richieste di input o nelle risposte dei modelli utilizzando filtri per informazioni sensibili. Questo filtro è una soluzione probabilistica basata sull'apprendimento automatico (ML) che dipende dal contesto e rileva le informazioni sensibili in base al contesto all'interno dei prompt di input o delle risposte del modello. Puoi effettuare la configurazione selezionando tra una serie di funzionalità integrate PIIs offerte da Amazon Bedrock Guardrails specifiche per il tuo caso d'uso o la tua organizzazione, definendole insieme a espressioni regolari (espressioni regolari personalizzate) che funzionano in base alla corrispondenza di modelli per bloccare o mascherare i dati PII.
Il rilevamento delle informazioni sensibili funziona sia nei domini del linguaggio naturale che in quelli di codice, inclusi la sintassi del codice, i commenti, le stringhe letterali e i contenuti ibridi. Ciò consente di identificare le informazioni personali incorporate in elementi di codice come nomi di variabili, credenziali codificate o documentazione di codice.
Per la gestione delle informazioni sensibili rilevate dai guardrail, è possibile configurare le modalità seguenti:
-
Blocco: le policy di filtro delle informazioni sensibili possono bloccare le richieste o le risposte che includono questo tipo di informazioni. Esempi di tali applicazioni potrebbero includere domande e risposte generali basate su documenti pubblici. Se nel prompt o nella risposta vengono rilevate informazioni sensibili, il guardrail blocca tutto il contenuto e restituisce un messaggio configurato dall’utente.
-
Maschera: le policy di filtro delle informazioni sensibili possono rendere anonime o oscurare le informazioni nelle richieste o nelle risposte del modello. Ad esempio, i guardrail si mascherano PIIs mentre generano riepiloghi delle conversazioni tra utenti e agenti del servizio clienti. Se nella richiesta o nella risposta del modello vengono rilevate informazioni sensibili, il guardrail le maschera e le sostituisce con il tipo di informazioni di identificazione personale, ad esempio
{NAME}o{EMAIL}.
Amazon Bedrock Guardrails offre quanto segue PIIs per bloccare o rendere anonimi:
-
Ambito generale
-
INDIRIZZO
Indirizzo fisico, ad esempio “100 Main Street, Anytown, USA” o “Suite 12, Edificio 123”. Un indirizzo può includere una via, un numero civico, una posizione, una città, uno stato, una provincia, una Regione, un CAP, un distretto, un quartiere e altro ancora.
-
ETÀ
Età di un individuo, inclusa la quantità e l’unità di tempo. Ad esempio, nella frase “Ho 40 anni”, Guardrail per Amazon Bedrock riconosce “40 anni” come età.
-
NOME
Nome di una persona. Questo tipo di entità non include titoli, ad esempio Dottore, Dottoressa, Signore o Signora. Guardrail per Amazon Bedrock non applica questo tipo di entità ai nomi che fanno parte di organizzazioni o di indirizzi. Ad esempio, il guardrail riconosce “John Doe Organization” come un’organizzazione e “Via Jane Doe” come indirizzo.
-
EMAIL
Indirizzo e-mail, ad esempio marymajor@email.com.
-
TELEFONO
Numero di telefono. Questo tipo di entità include anche numeri di fax e cercapersone.
-
NOME UTENTE
Nome utente che identifica un account, ad esempio un nome di accesso, un nome utente, un soprannome o un handle.
-
PASSWORD
Stringa alfanumerica utilizzata come password, ad esempio “*very20special#pass*”.
-
ID_DRIVER
Numero assegnato alla patente di guida, ovvero un documento ufficiale che consente a una persona di guidare uno o più veicoli motorizzati su una strada pubblica. Il numero di patente di guida è composto da caratteri alfanumerici.
-
LICENSE_PLATE
La targa di un veicolo viene emessa dal paese in cui il veicolo è immatricolato. Per i veicoli passeggeri sono in genere utilizzate da cinque a otto cifre, con lettere maiuscole e numeri. Il formato varia a seconda dell’ubicazione del paese di emissione.
-
VEHICLE_IDENTIFICATION_NUMBER
Numero di matricola del veicolo che identifica in modo univoco un veicolo. Il contenuto e il formato di tale numero sono definiti nella specifica ISO 3779. Ogni paese ha codici e formati specifici per VINs.
-
-
Ambito finanziario
-
CREDIT_DEBIT_CARD_CVV
Un codice di verifica della carta a tre cifre (CVV) presente sulle carte di credito e debito VISA e Discover. MasterCard Nelle carte di credito o debito American Express, il codice CVV è un codice numerico a 4 cifre.
-
CREDIT_DEBIT_CARD_EXPIRY
Data di scadenza della carta di credito o della carta di debito. Questo numero è in genere composto da 4 cifre con il formato mese/anno o MM/AA. Guardrail per Amazon Bedrock riconosce date di scadenza come 01/21, 01/2021 e Gen 2021.
-
CREDIT_DEBIT_CARD_NUMBER
Numeri di carta di credito o di debito. La lunghezza di questi numeri può variare da 13 a 16 cifre. Tuttavia, Amazon Bedrock riconosce i numeri delle carte di credito o di debito anche quando sono presenti solo le ultime quattro cifre.
-
PIN
Codice di identificazione personale a quattro cifre (PIN) con cui è possibile accedere al proprio conto bancario.
-
INTERNATIONAL_BANK_ACCOUNT_NUMBER
Numero di conto bancario internazionale con formati specifici in ogni paese. Per ulteriori informazioni, consulta www.iban.com/structure
. -
SWIFT_CODE
Un codice SWIFT è un formato standard di codice BIC (Bank Identifier Code) utilizzato per specificare una particolare banca o filiale. Le banche utilizzano questi codici per i trasferimenti di denaro, come i bonifici internazionali.
I codici SWIFT sono composti da 8 o 11 caratteri. I codici a 11 cifre si riferiscono a filiali specifiche, mentre i codici a 8 cifre (o codici a 11 cifre che terminano con “XXX”) si riferiscono alla sede centrale o principale.
-
-
È
-
INDIRIZZO_IP
Un IPv4 indirizzo, ad esempio 198.51.100.0.
-
INDIRIZZO_MAC
Un indirizzo MAC (Media Access Control) è un identificatore univoco assegnato a un controller di interfaccia di rete (NIC).
-
URL
Indirizzo web, ad esempio www.esempio.com.
-
AWS_ACCESS_CHIAVE
Identificatore univoco associato a una chiave di accesso segreta. L’ID della chiave di accesso e la chiave di accesso segreta vengono utilizzati insieme per firmare richieste AWS a livello di codice con crittografia.
-
AWS_SECRET_CHIAVE
Identificatore univoco associato a una chiave di accesso. Si utilizzano l'ID della chiave di accesso e la chiave di accesso segreta per firmare le AWS richieste programmatiche in modo crittografico.
-
-
Ambito specifico per gli Stati Uniti
-
US_BANK_ACCOUNT_NUMBER
Numero di conto bancario statunitense, composto in genere da 10 a 12 cifre.
-
US_BANK_ROUTING_NUMBER
Numero di routing del conto bancario statunitense. In genere la lunghezza è di nove cifre.
-
US_INDIVIDUAL_TAX_IDENTIFICATION_NUMBER
Codice identificativo individuale del contribuente statunitense (ITIN), ovvero un numero di nove cifre che inizia con un “9” e contiene un “7” oppure un “8” come quarta cifra. Un codice ITIN può essere formattato con uno spazio o un trattino dopo la terza e la quarta cifra.
-
US_PASSPORT_NUMBER
Numero di passaporto degli Stati Uniti. I numeri dei passaporti sono composti da sei a nove caratteri alfanumerici.
-
US_SOCIAL_SECURITY_NUMBER
Numero di previdenza sociale (SSN) degli Stati Uniti, ovvero un numero di nove cifre rilasciato ai cittadini statunitensi, ai residenti permanenti e ai lavoratori con residenza temporanea.
-
-
Ambito specifico per il Canada
-
CA_HEALTH_NUMBER
Numero del servizio sanitario canadese, ovvero un identificatore univoco di 10 cifre, necessario per consentire alle persone di accedere alle prestazioni sanitarie.
-
CA_SOCIAL_INSURANCE_NUMBER
Numero di previdenza sociale (SIN) del Canada, ovvero un identificatore univoco a nove cifre, necessario per consentire alle persone di accedere ai programmi e ai benefici governativi.
Il codice SIN è formattato in tre gruppi di cifre, ad esempio 123-456-789. Un codice SIN può essere convalidato tramite un semplice processo a cifra di controllo denominato algoritmo Luhn
.
-
-
Ambito specifico per il Regno Unito
-
UK_NATIONAL_HEALTH_SERVICE_NUMBER
Numero del servizio sanitario del Regno Unito, ovvero un identificatore di 10-17 cifre, ad esempio 485 777 3456. Nel sistema attuale il formato del numero è a 10 cifre con spazi dopo la terza e la sesta cifra. L’ultima cifra è un checksum che rileva gli errori.
-
UK_NATIONAL_INSURANCE_NUMBER
Numero di previdenza sociale (NINO) del Regno Unito, che fornisce alle persone l’accesso alle prestazioni della previdenza sociale. Viene anche utilizzato per alcuni scopi nel sistema fiscale del Regno Unito.
Il numero è composto da nove cifre e inizia con due lettere, seguite da sei numeri e una lettera. Un codice NINO può essere formattato con uno spazio o un trattino dopo le due lettere e dopo la seconda, la quarta e la sesta cifra.
-
UK_UNIQUE_TAXPAYER_REFERENCE_NUMBER
Codice UTR (Unique Taxpayer Reference) del Regno Unito, ovvero un numero di 10 cifre che identifica un contribuente o un’azienda.
-
-
Personalizza
-
Filtro regex
È possibile utilizzare espressioni regolari per definire modelli che un guardrail deve riconoscere e in base a cui agire, ad esempio il numero di serie, l'ID di prenotazione o altri modelli personalizzati.
-
Nota
Il modello per le informazioni di identificazione personale funziona in modo più efficace quando viene fornito con un contesto sufficiente. Per migliorarne la precisione, includi più informazioni contestuali ed evita di inviare al modello singole parole o frasi brevi. Poiché le informazioni di identificazione personale possono dipendere dal contesto (ad esempio, una stringa di cifre potrebbe rappresentare una AWS KMS key o un ID utente a seconda delle informazioni circostanti), la specifica di un contesto completo è fondamentale per un’identificazione accurata.
Nota
Un filtro regex personalizzato di filtri per le informazioni sensibili non supporta una corrispondenza lookaround di tipo regex.
Configurare la policy relativa alle informazioni sensibili per il guardrail
Per configurare policy per le informazioni sensibili per il guardrail, è possibile utilizzare la Console di gestione AWS o l’API Amazon Bedrock.