Blocca gli argomenti negati per aiutare a rimuovere i contenuti dannosi - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Blocca gli argomenti negati per aiutare a rimuovere i contenuti dannosi

Puoi specificare una serie di argomenti negati in un guardrail che non sono desiderati nel contesto della tua applicazione di intelligenza artificiale generativa. Ad esempio, una banca potrebbe volere che il suo assistente AI eviti conversazioni relative alla consulenza in materia di investimenti o alle criptovalute.

I suggerimenti e le risposte dei modelli in linguaggio naturale vengono valutati in base a ogni argomento negato nel guardrail. Se viene rilevato uno degli argomenti negati, il guardrail restituisce un messaggio bloccato.

Crea un argomento negato con i seguenti parametri, che il tuo guardrail utilizza per rilevare se un prompt o una risposta appartiene all'argomento:

  • Nome: il nome dell'argomento. Il nome deve essere un sostantivo o una frase. Non descrivere l'argomento nel nome. Per esempio:

    • Investment Advice

  • Definizione: fino a 200 caratteri che riassumono il contenuto dell'argomento. La definizione deve descrivere il contenuto dell'argomento e i relativi argomenti secondari.

    Di seguito è riportato un esempio di definizione di argomento che è possibile fornire:

    Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.

  • Frasi di esempio (facoltativo): un elenco di un massimo di cinque frasi di esempio che si riferiscono all'argomento. Ogni frase può contenere fino a 100 caratteri. Un esempio è un prompt o una continuazione che mostra il tipo di contenuto da filtrare. Per esempio:

    • Is investing in the stocks better than bonds?

    • Should I invest in gold?

Procedure consigliate per la creazione di argomenti negati

  • Definisci l'argomento in modo chiaro e preciso. Una definizione chiara e inequivocabile dell'argomento può migliorare l'accuratezza della rilevazione dell'argomento. Ad esempio, un argomento per rilevare domande o affermazioni associate alle criptovalute può essere definito come. Question or information associated with investing, selling, transacting, or procuring cryptocurrencies

  • Non includere esempi o istruzioni nella definizione dell'argomento. Ad esempio, Block all contents associated to cryptocurrency è un'istruzione e non una definizione dell'argomento. Tali istruzioni non devono essere utilizzate come parte delle definizioni dell'argomento.

  • Non definire argomenti o eccezioni negativi. Ad esempio, All contents except medical information o Contents not containing medical information sono definizioni negative di un argomento e non devono essere utilizzate.

  • Non utilizzare argomenti negati per catturare entità o parole. Ad esempio Statement or questions containing the name of a person "X" o Statements with a competitor name Y. Le definizioni degli argomenti rappresentano un tema o un argomento e guardrails valuta un input contestualmente. Il filtraggio degli argomenti non deve essere usato per catturare singole parole o tipi di entità. Per ulteriori informazioniRimuovi le informazioni personali dalle conversazioni utilizzando filtri per informazioni sensibili, consulta o Rimuovi un elenco specifico di parole e frasi dalle conversazioni con filtri di parole per questi casi d'uso.

Aggiungi argomenti negati al tuo guardrail

Puoi aggiungere fino a 30 argomenti negati al tuo guardrail utilizzando l'API AWS Management Console o Amazon Bedrock.

Console
  1. Accedi all' AWS Management Console utilizzo di un ruolo IAM con autorizzazioni Amazon Bedrock e apri la console Amazon Bedrock all'indirizzo. https://console.aws.amazon.com/bedrock/

  2. Dal riquadro di navigazione a sinistra, scegli Guardrails, quindi scegli Crea guardrail.

  3. Per fornire la pagina dei dettagli del guardrail, procedi come segue:

    1. Nella sezione dei dettagli del guardrail, fornisci un nome e una descrizione facoltativa per il guardrail.

    2. Per Messaggi per richieste bloccate, inserisci un messaggio che viene visualizzato quando viene applicato il guardrail. Seleziona la casella di controllo Applica lo stesso messaggio bloccato alle risposte per utilizzare lo stesso messaggio quando il guardrail viene applicato alla risposta.

    3. (Facoltativo) Per abilitare l'inferenza tra regioni per il tuo guardrail, espandi Inferenza interregionale, quindi seleziona Abilita inferenza interregionale per il tuo guardrail. Scegli un profilo guardrail che definisca la destinazione in cui possono essere instradate le richieste di inferenza del guardrail. Regioni AWS

    4. (Facoltativo) Per impostazione predefinita, il guardrail è crittografato con un. Chiave gestita da AWS Per utilizzare la tua chiave KMS gestita dal cliente, espandi la selezione della chiave KMS e seleziona la casella di controllo Personalizza le impostazioni di crittografia (avanzate).

      Puoi selezionare una AWS KMS chiave esistente o selezionare Crea una chiave per crearne una AWS KMS nuova.

    5. (Facoltativo) Per aggiungere tag al tuo guardrail, espandi Tag, quindi seleziona Aggiungi nuovo tag per ogni tag che definisci.

      Per ulteriori informazioni, consulta Etichettare le risorse di Amazon Bedrock.

    6. Scegli Next (Successivo).

  4. Quando arrivi alla pagina Aggiungi argomenti negati, scegli Aggiungi argomento negato ed esegui le seguenti operazioni:

    1. Immetti un nome per l'argomento.

    2. Per Definizione, definisci l'argomento. Per linee guida su come definire un argomento negato, consultaBlocca gli argomenti negati per aiutare a rimuovere i contenuti dannosi.

    3. (Facoltativo) Per Input, specificate se la valutazione del guardrail è abilitata per i prompt del modello. Se abilitata, scegliete l'azione che desiderate per il guardrail. Il blocco è abilitato per impostazione predefinita. Per ulteriori informazioni, consulta Opzioni per la gestione dei contenuti dannosi rilevati da Amazon Bedrock Guardrails.

    4. (Facoltativo) Per Output, specificate se la valutazione del guardrail è abilitata per le risposte del modello. Se abilitata, scegli l'azione che desideri che il guardrail intraprenda sulle risposte. Il blocco è abilitato per impostazione predefinita. Per ulteriori informazioni, consulta Opzioni per la gestione dei contenuti dannosi rilevati da Amazon Bedrock Guardrails.

    5. (Facoltativo) Espandi Aggiungi frasi di esempio e inserisci una frase rappresentativa delle richieste o delle risposte relative a questo argomento. Puoi inserire fino a cinque frasi. Per ogni frase che includi, seleziona Aggiungi frase.

    6. Per il livello Argomenti negati, scegli il livello di protezione che desideri che il guardrail utilizzi per bloccare gli argomenti nei prompt e nelle risposte. Per ulteriori informazioni, consulta Livelli di salvaguardia per le politiche di guardrail.

    7. Quando hai finito di configurare l'argomento negato, seleziona Conferma.

    8. Ripeti i passaggi precedenti per creare ulteriori argomenti negati.

    9. Scegli Avanti per configurare altre politiche in base alle esigenze o Passa a Rivedi e crea per completare la creazione del guardrail.

  5. Controlla le impostazioni del tuo guardrail.

    1. Seleziona Modifica in qualsiasi sezione a cui desideri apportare modifiche.

    2. Quando hai finito di configurare le politiche, seleziona Crea per creare il guardrail.

API

Aggiungi argomenti negati al tuo guardrail inviando una richiesta. CreateGuardrail Ecco come si presenta il formato della richiesta:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "inputAction": "BLOCK | NONE", "inputEnabled": true, "name": "string", "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "DENY" }, "tierConfig": { "tierName": "CLASSIC | STANDARD" }, ] }, "crossRegionConfig": { "guardrailProfileIdentifier": "string" }, "description": "string", "name": "string" }
  • Specificate i messaggi che indicano quando il guardrail blocca con successo un prompt o una risposta del modello nei campi blockedInputMessaging andblockedOutputsMessaging.

  • Specificate gli argomenti che il guardrail deve negare nell'oggetto. topicPolicyConfig Ogni elemento dell'topicsConfigelenco riguarda un argomento.

    • Specificate un name e definition per l'argomento che deve essere negato.

    • Specificare DENY nel type campo.

    • Specificate l'azione da intraprendere quando l'argomento viene rilevato nei prompt utilizzando inputAction o nelle risposte utilizzando. outputAction Scegli BLOCK di bloccare i contenuti e sostituirli con messaggi bloccati oppure di non NONE intraprendere alcuna azione ma restituire informazioni di rilevamento. Per ulteriori informazioni, consulta Opzioni per la gestione dei contenuti dannosi rilevati da Amazon Bedrock Guardrails.

    • Imposta inputEnabled e controlla se outputEnabled la valutazione del guardrail è abilitata per i prompt e le risposte del modello.

    • (Facoltativo) Nell'exampleselenco, specificate fino a cinque frasi di esempio rappresentative dei prompt o delle risposte relative a questo argomento.

  • (Facoltativo) Specificate un livello di protezione per il guardrail nell'oggetto. tierConfig Le opzioni includono i STANDARD livelli. CLASSIC

    Per ulteriori informazioni, consulta Livelli di salvaguardia per le politiche di guardrail.

  • (Facoltativo) Per abilitare l'inferenza tra regioni, specificate un profilo di guardrail nell'oggetto. crossRegionConfig Questo è necessario quando si utilizza il livello. STANDARD

  • Specificare una name e description per il guardrail.

Il formato di risposta è simile al seguente:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }