Rimuovere le informazioni di identificazione personale dalle conversazioni utilizzando filtri per informazioni sensibili
Guardrail per Amazon Bedrock consente di rilevare informazioni sensibili, come informazioni di identificazione personale (PII), in formato standard nei prompt di input o nelle risposte dei modelli. È anche possibile configurare informazioni sensibili specifiche per il proprio caso d’uso o la propria organizzazione definendole con espressioni regolari (regex).
Per la gestione delle informazioni sensibili rilevate dai guardrail, è possibile configurare le modalità seguenti:
Blocco: le policy di filtro delle informazioni sensibili possono bloccare le richieste o le risposte che includono questo tipo di informazioni. Esempi di tali applicazioni possono includere domande e risposte generali basate su documenti pubblici. Se nel prompt o nella risposta vengono rilevate informazioni sensibili, il guardrail blocca tutto il contenuto e restituisce un messaggio configurato dall’utente.
Maschera: le policy di filtro delle informazioni sensibili possono rendere anonime o oscurare le informazioni nelle richieste o nelle risposte del modello. Ad esempio, i guardrail mascherano le informazioni di identificazione personale quando generano i riepiloghi delle conversazioni tra utenti e agenti del servizio clienti. Se nella richiesta o nella risposta del modello vengono rilevate informazioni sensibili, il guardrail le maschera e le sostituisce con il tipo di informazioni di identificazione personale, ad esempio
{NAME}o{EMAIL}.
In Guardrail per Amazon Bedrock possono essere bloccate o rese anonime le seguenti informazioni di identificazione personale:
-
Ambito generale
-
ADDRESS
Indirizzo fisico, ad esempio “100 Main Street, Anytown, USA” o “Suite 12, Edificio 123”. Un indirizzo può includere una via, un numero civico, una posizione, una città, uno stato, una provincia, una Regione, un CAP, un distretto, un quartiere e altro ancora.
-
AGE
Età di un individuo, inclusa la quantità e l’unità di tempo. Ad esempio, nella frase “Ho 40 anni”, Guardrail per Amazon Bedrock riconosce “40 anni” come età.
-
NAME
Nome di una persona. Questo tipo di entità non include titoli, ad esempio Dottore, Dottoressa, Signore o Signora. Guardrail per Amazon Bedrock non applica questo tipo di entità ai nomi che fanno parte di organizzazioni o di indirizzi. Ad esempio, il guardrail riconosce “John Doe Organization” come un’organizzazione e “Via Jane Doe” come indirizzo.
-
EMAIL
Indirizzo e-mail, ad esempio marymajor@email.com.
-
PHONE
Numero di telefono. Questo tipo di entità include anche numeri di fax e cercapersone.
-
USERNAME
Nome utente che identifica un account, ad esempio un nome di accesso, un nome utente, un soprannome o un handle.
-
PASSWORD
Stringa alfanumerica utilizzata come password, ad esempio “*very20special#pass*”.
-
ID_DRIVER
Numero assegnato alla patente di guida, ovvero un documento ufficiale che consente a una persona di guidare uno o più veicoli motorizzati su una strada pubblica. Il numero di patente di guida è composto da caratteri alfanumerici.
-
LICENSE_PLATE
La targa di un veicolo viene emessa dal paese in cui il veicolo è immatricolato. Per i veicoli passeggeri sono in genere utilizzate da cinque a otto cifre, con lettere maiuscole e numeri. Il formato varia a seconda dell’ubicazione del paese di emissione.
-
VEHICLE_IDENTIFICATION_NUMBER
Numero di matricola del veicolo che identifica in modo univoco un veicolo. Il contenuto e il formato di tale numero sono definiti nella specifica ISO 3779. Ogni paese ha codici e formati specifici per i numeri di matricola dei veicoli.
-
-
Ambito finanziario
-
CREDIT_DEBIT_CARD_CVV
Codice di verifica della carta a 3 cifre (CVV) presente sulle carte di credito e debito VISA, MasterCard e Discover. Nelle carte di credito o debito American Express, il codice CVV è un codice numerico a 4 cifre.
-
CREDIT_DEBIT_CARD_EXPIRY
Data di scadenza della carta di credito o della carta di debito. Questo numero è in genere composto da 4 cifre con il formato mese/anno o MM/AA. Guardrail per Amazon Bedrock riconosce date di scadenza come 01/21, 01/2021 e Gen 2021.
-
CREDIT_DEBIT_CARD_NUMBER
Numeri di carta di credito o di debito. La lunghezza di questi numeri può variare da 13 a 16 cifre. Tuttavia, Amazon Bedrock riconosce i numeri delle carte di credito o di debito anche quando sono presenti solo le ultime quattro cifre.
-
PIN
Codice di identificazione personale a quattro cifre (PIN) con cui è possibile accedere al proprio conto bancario.
-
INTERNATIONAL_BANK_ACCOUNT_NUMBER
Numero di conto bancario internazionale con formati specifici in ogni paese. Per ulteriori informazioni, consulta www.iban.com/structure
. -
SWIFT_CODE
Un codice SWIFT è un formato standard di codice BIC (Bank Identifier Code) utilizzato per specificare una particolare banca o filiale. Le banche utilizzano questi codici per i trasferimenti di denaro, come i bonifici internazionali.
I codici SWIFT sono composti da 8 o 11 caratteri. I codici a 11 cifre si riferiscono a filiali specifiche, mentre i codici a 8 cifre (o codici a 11 cifre che terminano con “XXX”) si riferiscono alla sede centrale o principale.
-
-
IT
-
IP_ADDRESS
Indirizzo IPv4, ad esempio 198.51.100.0.
-
MAC_ADDRESS
Un indirizzo MAC (Media Access Control) è un identificatore univoco assegnato a un controller di interfaccia di rete (NIC).
-
URL
Indirizzo web, ad esempio www.esempio.com.
-
AWS_ACCESS_KEY
Identificatore univoco associato a una chiave di accesso segreta. L’ID della chiave di accesso e la chiave di accesso segreta vengono utilizzati insieme per firmare richieste AWS a livello di codice con crittografia.
-
AWS_SECRET_KEY
Identificatore univoco associato a una chiave di accesso. L’ID della chiave di accesso e la chiave di accesso segreta vengono utilizzati per firmare le richieste AWS a livello di codice con crittografia.
-
-
Ambito specifico per gli Stati Uniti
-
US_BANK_ACCOUNT_NUMBER
Numero di conto bancario statunitense, composto in genere da 10 a 12 cifre.
-
US_BANK_ROUTING_NUMBER
Numero di routing del conto bancario statunitense. In genere la lunghezza è di nove cifre.
-
US_INDIVIDUAL_TAX_IDENTIFICATION_NUMBER
Codice identificativo individuale del contribuente statunitense (ITIN), ovvero un numero di nove cifre che inizia con un “9” e contiene un “7” oppure un “8” come quarta cifra. Un codice ITIN può essere formattato con uno spazio o un trattino dopo la terza e la quarta cifra.
-
US_PASSPORT_NUMBER
Numero di passaporto degli Stati Uniti. I numeri dei passaporti sono composti da sei a nove caratteri alfanumerici.
-
US_SOCIAL_SECURITY_NUMBER
Numero di previdenza sociale (SSN) degli Stati Uniti, ovvero un numero di nove cifre rilasciato ai cittadini statunitensi, ai residenti permanenti e ai lavoratori con residenza temporanea.
-
-
Ambito specifico per il Canada
-
CA_HEALTH_NUMBER
Numero del servizio sanitario canadese, ovvero un identificatore univoco di 10 cifre, necessario per consentire alle persone di accedere alle prestazioni sanitarie.
-
CA_SOCIAL_INSURANCE_NUMBER
Numero di previdenza sociale (SIN) del Canada, ovvero un identificatore univoco a nove cifre, necessario per consentire alle persone di accedere ai programmi e ai benefici governativi.
Il codice SIN è formattato in tre gruppi di cifre, ad esempio 123-456-789. Un codice SIN può essere convalidato tramite un semplice processo a cifra di controllo denominato algoritmo Luhn
.
-
-
Ambito specifico per il Regno Unito
-
UK_NATIONAL_HEALTH_SERVICE_NUMBER
Numero del servizio sanitario del Regno Unito, ovvero un identificatore di 10-17 cifre, ad esempio 485 777 3456. Nel sistema attuale il formato del numero è a 10 cifre con spazi dopo la terza e la sesta cifra. L’ultima cifra è un checksum che rileva gli errori.
-
UK_NATIONAL_INSURANCE_NUMBER
Numero di previdenza sociale (NINO) del Regno Unito, che fornisce alle persone l’accesso alle prestazioni della previdenza sociale. Viene anche utilizzato per alcuni scopi nel sistema fiscale del Regno Unito.
Il numero è composto da nove cifre e inizia con due lettere, seguite da sei numeri e una lettera. Un codice NINO può essere formattato con uno spazio o un trattino dopo le due lettere e dopo la seconda, la quarta e la sesta cifra.
-
UK_UNIQUE_TAXPAYER_REFERENCE_NUMBER
Codice UTR (Unique Taxpayer Reference) del Regno Unito, ovvero un numero di 10 cifre che identifica un contribuente o un’azienda.
-
-
Custom
-
Filtro regex
È possibile utilizzare espressioni regolari per definire modelli di riconoscimento da parte di un guardrail, ad esempio il numero di serie o l’ID prenotazione.
-
Nota
Il modello per le informazioni di identificazione personale funziona in modo più efficace quando viene fornito con un contesto sufficiente. Per migliorarne la precisione, includi più informazioni contestuali ed evita di inviare al modello singole parole o frasi brevi. Poiché le informazioni di identificazione personale possono dipendere dal contesto (ad esempio, una stringa di cifre potrebbe rappresentare una AWS KMS key o un ID utente a seconda delle informazioni circostanti), la specifica di un contesto completo è fondamentale per un’identificazione accurata.
Nota
Un filtro regex personalizzato di filtri per le informazioni sensibili non supporta una corrispondenza lookaround di tipo regex.
Configurare la policy relativa alle informazioni sensibili per il guardrail
Per configurare policy per le informazioni sensibili per il guardrail, è possibile utilizzare la Console di gestione AWS o l’API Amazon Bedrock.