Rimuovere le informazioni di identificazione personale dalle conversazioni utilizzando filtri per informazioni sensibili - Amazon Bedrock

Rimuovere le informazioni di identificazione personale dalle conversazioni utilizzando filtri per informazioni sensibili

Guardrail per Amazon Bedrock consente di rilevare informazioni sensibili, come informazioni di identificazione personale (PII), in formato standard nei prompt di input o nelle risposte dei modelli. È anche possibile configurare informazioni sensibili specifiche per il proprio caso d’uso o la propria organizzazione definendole con espressioni regolari (regex).

Per la gestione delle informazioni sensibili rilevate dai guardrail, è possibile configurare le modalità seguenti:

  • Blocco: le policy di filtro delle informazioni sensibili possono bloccare le richieste o le risposte che includono questo tipo di informazioni. Esempi di tali applicazioni possono includere domande e risposte generali basate su documenti pubblici. Se nel prompt o nella risposta vengono rilevate informazioni sensibili, il guardrail blocca tutto il contenuto e restituisce un messaggio configurato dall’utente.

  • Maschera: le policy di filtro delle informazioni sensibili possono rendere anonime o oscurare le informazioni nelle richieste o nelle risposte del modello. Ad esempio, i guardrail mascherano le informazioni di identificazione personale quando generano i riepiloghi delle conversazioni tra utenti e agenti del servizio clienti. Se nella richiesta o nella risposta del modello vengono rilevate informazioni sensibili, il guardrail le maschera e le sostituisce con il tipo di informazioni di identificazione personale, ad esempio {NAME} o {EMAIL}.

In Guardrail per Amazon Bedrock possono essere bloccate o rese anonime le seguenti informazioni di identificazione personale:

  • Ambito generale

    • ADDRESS

      Indirizzo fisico, ad esempio “100 Main Street, Anytown, USA” o “Suite 12, Edificio 123”. Un indirizzo può includere una via, un numero civico, una posizione, una città, uno stato, una provincia, una Regione, un CAP, un distretto, un quartiere e altro ancora.

    • AGE

      Età di un individuo, inclusa la quantità e l’unità di tempo. Ad esempio, nella frase “Ho 40 anni”, Guardrail per Amazon Bedrock riconosce “40 anni” come età.

    • NAME

      Nome di una persona. Questo tipo di entità non include titoli, ad esempio Dottore, Dottoressa, Signore o Signora. Guardrail per Amazon Bedrock non applica questo tipo di entità ai nomi che fanno parte di organizzazioni o di indirizzi. Ad esempio, il guardrail riconosce “John Doe Organization” come un’organizzazione e “Via Jane Doe” come indirizzo.

    • EMAIL

      Indirizzo e-mail, ad esempio marymajor@email.com.

    • PHONE

      Numero di telefono. Questo tipo di entità include anche numeri di fax e cercapersone.

    • USERNAME

      Nome utente che identifica un account, ad esempio un nome di accesso, un nome utente, un soprannome o un handle.

    • PASSWORD

      Stringa alfanumerica utilizzata come password, ad esempio “*very20special#pass*”.

    • ID_DRIVER

      Numero assegnato alla patente di guida, ovvero un documento ufficiale che consente a una persona di guidare uno o più veicoli motorizzati su una strada pubblica. Il numero di patente di guida è composto da caratteri alfanumerici.

    • LICENSE_PLATE

      La targa di un veicolo viene emessa dal paese in cui il veicolo è immatricolato. Per i veicoli passeggeri sono in genere utilizzate da cinque a otto cifre, con lettere maiuscole e numeri. Il formato varia a seconda dell’ubicazione del paese di emissione.

    • VEHICLE_IDENTIFICATION_NUMBER

      Numero di matricola del veicolo che identifica in modo univoco un veicolo. Il contenuto e il formato di tale numero sono definiti nella specifica ISO 3779. Ogni paese ha codici e formati specifici per i numeri di matricola dei veicoli.

  • Ambito finanziario

    • CREDIT_DEBIT_CARD_CVV

      Codice di verifica della carta a 3 cifre (CVV) presente sulle carte di credito e debito VISA, MasterCard e Discover. Nelle carte di credito o debito American Express, il codice CVV è un codice numerico a 4 cifre.

    • CREDIT_DEBIT_CARD_EXPIRY

      Data di scadenza della carta di credito o della carta di debito. Questo numero è in genere composto da 4 cifre con il formato mese/anno o MM/AA. Guardrail per Amazon Bedrock riconosce date di scadenza come 01/21, 01/2021 e Gen 2021.

    • CREDIT_DEBIT_CARD_NUMBER

      Numeri di carta di credito o di debito. La lunghezza di questi numeri può variare da 13 a 16 cifre. Tuttavia, Amazon Bedrock riconosce i numeri delle carte di credito o di debito anche quando sono presenti solo le ultime quattro cifre.

    • PIN

      Codice di identificazione personale a quattro cifre (PIN) con cui è possibile accedere al proprio conto bancario.

    • INTERNATIONAL_BANK_ACCOUNT_NUMBER

      Numero di conto bancario internazionale con formati specifici in ogni paese. Per ulteriori informazioni, consulta www.iban.com/structure.

    • SWIFT_CODE

      Un codice SWIFT è un formato standard di codice BIC (Bank Identifier Code) utilizzato per specificare una particolare banca o filiale. Le banche utilizzano questi codici per i trasferimenti di denaro, come i bonifici internazionali.

      I codici SWIFT sono composti da 8 o 11 caratteri. I codici a 11 cifre si riferiscono a filiali specifiche, mentre i codici a 8 cifre (o codici a 11 cifre che terminano con “XXX”) si riferiscono alla sede centrale o principale.

  • IT

    • IP_ADDRESS

      Indirizzo IPv4, ad esempio 198.51.100.0.

    • MAC_ADDRESS

      Un indirizzo MAC (Media Access Control) è un identificatore univoco assegnato a un controller di interfaccia di rete (NIC).

    • URL

      Indirizzo web, ad esempio www.esempio.com.

    • AWS_ACCESS_KEY

      Identificatore univoco associato a una chiave di accesso segreta. L’ID della chiave di accesso e la chiave di accesso segreta vengono utilizzati insieme per firmare richieste AWS a livello di codice con crittografia.

    • AWS_SECRET_KEY

      Identificatore univoco associato a una chiave di accesso. L’ID della chiave di accesso e la chiave di accesso segreta vengono utilizzati per firmare le richieste AWS a livello di codice con crittografia.

  • Ambito specifico per gli Stati Uniti

    • US_BANK_ACCOUNT_NUMBER

      Numero di conto bancario statunitense, composto in genere da 10 a 12 cifre.

    • US_BANK_ROUTING_NUMBER

      Numero di routing del conto bancario statunitense. In genere la lunghezza è di nove cifre.

    • US_INDIVIDUAL_TAX_IDENTIFICATION_NUMBER

      Codice identificativo individuale del contribuente statunitense (ITIN), ovvero un numero di nove cifre che inizia con un “9” e contiene un “7” oppure un “8” come quarta cifra. Un codice ITIN può essere formattato con uno spazio o un trattino dopo la terza e la quarta cifra.

    • US_PASSPORT_NUMBER

      Numero di passaporto degli Stati Uniti. I numeri dei passaporti sono composti da sei a nove caratteri alfanumerici.

    • US_SOCIAL_SECURITY_NUMBER

      Numero di previdenza sociale (SSN) degli Stati Uniti, ovvero un numero di nove cifre rilasciato ai cittadini statunitensi, ai residenti permanenti e ai lavoratori con residenza temporanea.

  • Ambito specifico per il Canada

    • CA_HEALTH_NUMBER

      Numero del servizio sanitario canadese, ovvero un identificatore univoco di 10 cifre, necessario per consentire alle persone di accedere alle prestazioni sanitarie.

    • CA_SOCIAL_INSURANCE_NUMBER

      Numero di previdenza sociale (SIN) del Canada, ovvero un identificatore univoco a nove cifre, necessario per consentire alle persone di accedere ai programmi e ai benefici governativi.

      Il codice SIN è formattato in tre gruppi di cifre, ad esempio 123-456-789. Un codice SIN può essere convalidato tramite un semplice processo a cifra di controllo denominato algoritmo Luhn.

  • Ambito specifico per il Regno Unito

    • UK_NATIONAL_HEALTH_SERVICE_NUMBER

      Numero del servizio sanitario del Regno Unito, ovvero un identificatore di 10-17 cifre, ad esempio 485 777 3456. Nel sistema attuale il formato del numero è a 10 cifre con spazi dopo la terza e la sesta cifra. L’ultima cifra è un checksum che rileva gli errori.

    • UK_NATIONAL_INSURANCE_NUMBER

      Numero di previdenza sociale (NINO) del Regno Unito, che fornisce alle persone l’accesso alle prestazioni della previdenza sociale. Viene anche utilizzato per alcuni scopi nel sistema fiscale del Regno Unito.

      Il numero è composto da nove cifre e inizia con due lettere, seguite da sei numeri e una lettera. Un codice NINO può essere formattato con uno spazio o un trattino dopo le due lettere e dopo la seconda, la quarta e la sesta cifra.

    • UK_UNIQUE_TAXPAYER_REFERENCE_NUMBER

      Codice UTR (Unique Taxpayer Reference) del Regno Unito, ovvero un numero di 10 cifre che identifica un contribuente o un’azienda.

  • Custom

    • Filtro regex

      È possibile utilizzare espressioni regolari per definire modelli di riconoscimento da parte di un guardrail, ad esempio il numero di serie o l’ID prenotazione.

Nota

Il modello per le informazioni di identificazione personale funziona in modo più efficace quando viene fornito con un contesto sufficiente. Per migliorarne la precisione, includi più informazioni contestuali ed evita di inviare al modello singole parole o frasi brevi. Poiché le informazioni di identificazione personale possono dipendere dal contesto (ad esempio, una stringa di cifre potrebbe rappresentare una AWS KMS key o un ID utente a seconda delle informazioni circostanti), la specifica di un contesto completo è fondamentale per un’identificazione accurata.

Nota

Un filtro regex personalizzato di filtri per le informazioni sensibili non supporta una corrispondenza lookaround di tipo regex.

Configurare la policy relativa alle informazioni sensibili per il guardrail

Per configurare policy per le informazioni sensibili per il guardrail, è possibile utilizzare la Console di gestione AWS o l’API Amazon Bedrock.

Console
  1. Accedi alla Console di gestione AWS con un’identità IAM che disponga delle autorizzazioni per utilizzare la console Amazon Bedrock. Quindi, apri la console Amazon Bedrock all’indirizzo https://console.aws.amazon.com/bedrock.

  2. Nel riquadro di navigazione a sinistra, scegli Guardrail e poi Crea guardrail.

  3. Nella pagina Fornisci i dettagli del guardrail, procedi come segue:

    1. Nella sezione Dettagli del guardrail, fornisci un nome e una descrizione facoltativa per il guardrail.

    2. Per Messaggi relativi ai prompt bloccati, inserisci un messaggio che viene visualizzato quando viene applicato il guardrail. Seleziona la casella di controllo Applica lo stesso messaggio bloccato per le risposte per utilizzare lo stesso messaggio quando il guardrail viene applicato alla risposta.

    3. (Facoltativo) Per abilitare l’inferenza tra Regioni per il guardrail, espandi Inferenza tra Regioni, quindi seleziona Abilita inferenza tra Regioni per il tuo guardrail. Scegli un profilo del guardrail che definisca le Regioni AWS di destinazione in cui instradare le richieste di inferenza del guardrail.

    4. (Facoltativo) Per impostazione predefinita, il guardrail è crittografato con una Chiave gestita da AWS. Per utilizzare la tua chiave KMS gestita dal cliente, espandi Selezione chiave KMS e seleziona la casella di controllo Personalizza impostazioni di crittografia (avanzate).

      Puoi selezionare una chiave AWS KMS esistente oppure seleziona Crea una chiave AWS KMS per crearne una nuova.

    5. (Facoltativo) Per aggiungere tag al guardrail, espandi Tag, quindi seleziona Aggiungi nuovo tag per ogni tag che definisci.

      Per ulteriori informazioni, consulta Assegnazione di tag alle risorse Amazon Bedrock.

    6. Scegli Next (Successivo).

  4. Nella pagina Aggiungi filtri per le informazioni sensibili, esegui queste operazioni per configurare i filtri al fine di bloccare o mascherare le informazioni sensibili:

    1. Nella sezione Tipi di PII, configura le categorie di informazioni di identificazione personale (PII) da bloccare o mascherare o per cui non eseguire alcuna azione (modalità di rilevamento). Sono disponibili le seguenti opzioni:

      • Per aggiungere tutti i tipi di informazioni di identificazione personale, seleziona la freccia a discesa accanto a Aggiungi tutti i tipi di PII. Seleziona quindi il comportamento del guardrail da applicare.

        avvertimento

        Se specifichi un comportamento, qualsiasi comportamento esistente configurato per i tipi di informazioni di identificazione personale viene sovrascritto.

      • Per eliminare un tipo di informazione di identificazione personale, seleziona l’icona del cestino ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ).

      • Per eliminare le righe che contengono errori, seleziona Elimina tutto, quindi seleziona Elimina tutte le righe con errore.

      • Per eliminare tutti i tipi di informazioni di identificazione personale, seleziona Elimina tutto, quindi seleziona Elimina tutte le righe.

      • Per cercare una riga, immetti un’espressione nella barra di ricerca.

      • Per mostrare solo le righe con errori, seleziona il menu a discesa Mostra tutto e seleziona Mostra solo errori.

      • Per configurare le dimensioni di ogni pagina della tabella o la visualizzazione delle colonne nella tabella, seleziona l’icona delle impostazioni ( Gear icon representing settings or configuration options. ). Imposta le tue preferenze, quindi seleziona Conferma.

    2. Nella sezione Modelli regex, usa le espressioni regolari per definire i modelli da filtrare nel guardrail. Sono disponibili le seguenti opzioni:

      • Per aggiungere un modello, seleziona Aggiungi modello regex. Configura i campi seguenti:

        Campo Descrizione
        Nome Nome del modello
        Modello regex Espressione regolare che definisce il modello
        Input Scegli se bloccare il contenuto in cui è incluso il modello o di mascherarlo con un identificatore. Per non intraprendere alcuna azione, seleziona Rileva (nessuna azione).
        Output
        Aggiungi descrizione (Facoltativo) Scrivi una descrizione per il modello
      • Per modificare un modello, seleziona l’icona con tre punti nella stessa riga dell’argomento nella colonna Azioni. Seleziona Modifica. Al termine della modifica, seleziona Conferma.

      • Per eliminare uno o più modelli, seleziona le caselle di controllo relative ai modelli da eliminare. Seleziona Elimina, quindi seleziona Elimina selezionati.

      • Per eliminare tutti i modelli, seleziona Elimina, quindi seleziona Elimina tutto.

      • Per cercare un modello, immetti un’espressione nella barra di ricerca.

      • Per configurare le dimensioni di ogni pagina della tabella o la visualizzazione delle colonne nella tabella, seleziona l’icona delle impostazioni ( Gear icon representing settings or configuration options. ). Imposta le tue preferenze, quindi seleziona Conferma.

    3. Al termine della configurazione dei filtri per le informazioni sensibili, seleziona Avanti o Passa a Rivedi e crea.

API

Per creare un guardrail con policy per le informazioni sensibili, invia una richiesta CreateGuardrail. Il formato della richiesta è il seguente:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [{ "type": "ADDRESS | EMAIL | PHONE | NAME | SSN | ...", "action": "BLOCK | ANONYMIZE | NONE", "inputAction": "BLOCK | ANONYMIZE | NONE", "inputEnabled": true, "outputAction": "BLOCK | ANONYMIZE | NONE", "outputEnabled": true }], "regexesConfig": [{ "name": "string", "pattern": "string", "action": "BLOCK | ANONYMIZE | NONE", "description": "string", "inputAction": "BLOCK | ANONYMIZE | NONE", "inputEnabled": true, "outputAction": "BLOCK | ANONYMIZE | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }
  • Specifica name e description per il guardrail.

  • Specifica i messaggi che indicano quando il guardrail blocca correttamente un prompt o una risposta del modello nei campi blockedInputMessaging e blockedOutputsMessaging.

  • Configura le policy relative alle informazioni sensibili nell’oggetto sensitiveInformationPolicyConfig:

    • Usa l’array piiEntitiesConfig per configurare i tipi di entità delle informazioni di identificazione personale predefiniti:

      • Specifica il tipo di entità delle informazioni di identificazione personale nel campo type. I valori validi includono ADDRESS, EMAIL, PHONE, NAME, US_SOCIAL_SECURITY_NUMBER e altri.

      • Specifica l’azione da eseguire quando viene rilevata l’entità delle informazioni di identificazione personale nel campo action. Scegli BLOCK per bloccare il contenuto, ANONYMIZE per mascherarlo o NONE per non eseguire alcuna azione, ma per restituire informazioni di rilevamento.

      • (Facoltativo) Usa inputAction, inputEnabled, outputAction e outputEnabled per configurare comportamenti diversi per prompt e risposte.

    • Usa l’array regexesConfig per definire modelli personalizzati da rilevare:

      • Specifica un valore per name per il modello regex (1-100 caratteri).

      • Definisci l’espressione regolare pattern da rilevare (1-500 caratteri).

      • Specifica un’azione action da eseguire quando viene rilevato il modello. Scegli BLOCK per bloccare il contenuto, ANONYMIZE per mascherarlo o NONE per non eseguire alcuna azione, ma per restituire informazioni di rilevamento.

      • (Facoltativo) Inserisci una descrizione per description per il modello regex (1-1000 caratteri).

      • (Facoltativo) Usa inputAction, inputEnabled, outputAction e outputEnabled per configurare comportamenti diversi per prompt e risposte.

  • (Facoltativo) Collega eventuali tag al guardrail. Per ulteriori informazioni, consulta Assegnazione di tag alle risorse Amazon Bedrock.

  • (Facoltativo) Per motivi di sicurezza, includi l’ARN di una chiave KMS nel campo kmsKeyId.

  • (Facoltativo) Per abilitare l’inferenza tra Regioni, specifica un profilo di guardrail nell’oggetto crossRegionConfig.

Il formato della risposta è il seguente:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }