Blokir topik yang ditolak untuk membantu menghapus konten berbahaya - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Blokir topik yang ditolak untuk membantu menghapus konten berbahaya

Anda dapat menentukan serangkaian topik yang ditolak di pagar pembatas yang tidak diinginkan dalam konteks aplikasi AI generatif Anda. Misalnya, bank mungkin ingin asisten AI-nya menghindari percakapan yang terkait dengan saran investasi atau cryptocurrency.

Permintaan model dan tanggapan dalam bahasa alami dievaluasi terhadap setiap topik yang ditolak di pagar pembatas Anda. Jika salah satu topik yang ditolak terdeteksi, pagar pembatas Anda mengembalikan pesan yang diblokir.

Buat topik yang ditolak dengan parameter berikut, yang digunakan pagar pembatas untuk mendeteksi jika prompt atau respons termasuk dalam topik:

  • Nama — Nama topik. Nama harus berupa kata benda atau frasa. Jangan menggambarkan topik dalam nama. Misalnya:

    • Investment Advice

  • Definisi - Hingga 200 karakter merangkum konten topik. Definisi harus menggambarkan isi topik dan subtopiknya.

    Berikut ini adalah contoh definisi topik yang dapat Anda berikan:

    Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.

  • Contoh frasa (opsional) - Daftar hingga lima frasa sampel yang merujuk ke topik. Setiap frase bisa mencapai 100 karakter. Sampel adalah prompt atau kelanjutan yang menunjukkan jenis konten apa yang harus disaring. Misalnya:

    • Is investing in the stocks better than bonds?

    • Should I invest in gold?

Praktik terbaik untuk membuat topik yang ditolak

  • Tentukan topik dengan cara yang tajam dan tepat. Definisi topik yang jelas dan tidak ambigu dapat meningkatkan akurasi deteksi topik. Misalnya, topik untuk mendeteksi kueri atau pernyataan yang terkait dengan cryptocurrency dapat didefinisikan sebagaiQuestion or information associated with investing, selling, transacting, or procuring cryptocurrencies.

  • Jangan sertakan contoh atau instruksi dalam definisi topik. Misalnya, Block all contents associated to cryptocurrency adalah instruksi dan bukan definisi topik. Instruksi tersebut tidak boleh digunakan sebagai bagian dari definisi topik.

  • Jangan mendefinisikan topik atau pengecualian negatif. Misalnya, All contents except medical information atau Contents not containing medical information definisi negatif dari suatu topik dan tidak boleh digunakan.

  • Jangan gunakan topik yang ditolak untuk menangkap entitas atau kata-kata. Misalnya, Statement or questions containing the name of a person "X" atau Statements with a competitor name Y. Definisi topik mewakili tema atau subjek dan pagar pembatas mengevaluasi masukan secara kontekstual. Pemfilteran topik tidak boleh digunakan untuk menangkap kata-kata individual atau tipe entitas. Untuk informasi selengkapnya, lihatHapus PII dari percakapan dengan menggunakan filter informasi sensitif, atau Hapus daftar kata dan frasa tertentu dari percakapan dengan filter kata untuk kasus penggunaan ini.

Tambahkan topik yang ditolak ke pagar pembatas Anda

Anda dapat menambahkan hingga 30 topik yang ditolak ke pagar pembatas dengan menggunakan atau AWS Management Console Amazon Bedrock API.

Console
  1. Masuk ke AWS Management Console dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di https://console.aws.amazon.com/bedrock/.

  2. Dari panel navigasi kiri, pilih Guardrails, lalu pilih Create guardrail.

  3. Untuk Memberikan halaman detail pagar pembatas, lakukan hal berikut:

    1. Di bagian detail Guardrail, berikan Nama dan Deskripsi opsional untuk pagar pembatas.

    2. Untuk Pesan untuk permintaan yang diblokir, masukkan pesan yang ditampilkan saat pagar pembatas diterapkan. Pilih kotak centang Terapkan pesan yang diblokir yang sama untuk respons untuk menggunakan pesan yang sama saat pagar pembatas diterapkan pada respons.

    3. (Opsional) Untuk mengaktifkan inferensi lintas wilayah untuk pagar pembatas Anda, perluas inferensi Lintas Wilayah, lalu pilih Aktifkan inferensi lintas wilayah untuk pagar pembatas Anda. Pilih profil pagar pembatas yang menentukan tujuan Wilayah AWS di mana permintaan inferensi pagar pembatas dapat diarahkan.

    4. (Opsional) Secara default, pagar pembatas Anda dienkripsi dengan file. Kunci yang dikelola AWS Untuk menggunakan kunci KMS yang dikelola pelanggan Anda sendiri, perluas pilihan kunci KMS dan pilih kotak centang Sesuaikan pengaturan enkripsi (lanjutan).

      Anda dapat memilih AWS KMS kunci yang ada atau pilih Buat AWS KMS kunci untuk membuat yang baru.

    5. (Opsional) Untuk menambahkan tag ke pagar pembatas, perluas Tag, lalu pilih Tambahkan tag baru untuk setiap tag yang Anda tentukan.

      Untuk informasi selengkapnya, lihat Menandai sumber daya Amazon Bedrock.

    6. Pilih Berikutnya.

  4. Saat Anda masuk ke halaman Tambah topik yang ditolak, pilih Tambahkan topik yang ditolak dan lakukan hal berikut:

    1. Masukkan Nama untuk topik.

    2. Untuk Definisi, tentukan topiknya. Untuk panduan tentang cara mendefinisikan topik yang ditolak, lihatBlokir topik yang ditolak untuk membantu menghapus konten berbahaya.

    3. (Opsional) Untuk Input, tentukan apakah evaluasi pagar pembatas diaktifkan untuk permintaan model. Jika diaktifkan, pilih tindakan yang Anda inginkan pagar pembatas Anda. Blok diaktifkan secara default. Untuk informasi selengkapnya, lihat Opsi untuk menangani konten berbahaya yang terdeteksi oleh Amazon Bedrock Guardrails.

    4. (Opsional) Untuk Output, tentukan apakah evaluasi pagar pembatas diaktifkan untuk respons model. Jika diaktifkan, pilih tindakan mana yang Anda inginkan untuk ditanggapi pagar pembatas. Blok diaktifkan secara default. Untuk informasi selengkapnya, lihat Opsi untuk menangani konten berbahaya yang terdeteksi oleh Amazon Bedrock Guardrails.

    5. (Opsional) Perluas Tambahkan frasa sampel dan masukkan frasa yang mewakili permintaan atau tanggapan yang terkait dengan topik ini. Anda dapat memasukkan hingga lima frasa. Untuk setiap frasa yang Anda sertakan, pilih Tambahkan frasa.

    6. Untuk tingkat topik Ditolak, pilih tingkat perlindungan yang ingin digunakan pagar pembatas untuk memblokir topik dalam permintaan dan tanggapan. Untuk informasi selengkapnya, lihat Tingkatan perlindungan untuk kebijakan pagar pembatas.

    7. Setelah selesai mengonfigurasi topik yang ditolak, pilih Konfirmasi.

    8. Ulangi langkah sebelumnya untuk membuat topik tambahan yang ditolak.

    9. Pilih Berikutnya untuk mengonfigurasi kebijakan lain sesuai kebutuhan atau Lewati ke Tinjauan dan buat untuk menyelesaikan pembuatan pagar pembatas Anda.

  5. Tinjau pengaturan untuk pagar pembatas Anda.

    1. Pilih Edit di bagian mana pun yang ingin Anda ubah.

    2. Setelah selesai mengonfigurasi kebijakan, pilih Buat untuk membuat pagar pembatas.

API

Tambahkan topik yang ditolak ke pagar pembatas Anda dengan mengirimkan permintaan. CreateGuardrail Seperti inilah format permintaan:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "inputAction": "BLOCK | NONE", "inputEnabled": true, "name": "string", "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "DENY" }, "tierConfig": { "tierName": "CLASSIC | STANDARD" }, ] }, "crossRegionConfig": { "guardrailProfileIdentifier": "string" }, "description": "string", "name": "string" }
  • Tentukan pesan kapan pagar pembatas berhasil memblokir prompt atau respons model di bidang blockedInputMessaging danblockedOutputsMessaging.

  • Tentukan topik untuk pagar pembatas untuk ditolak di objek. topicPolicyConfig Setiap item dalam topicsConfig daftar berkaitan dengan satu topik.

    • Tentukan name dan definition untuk topik yang harus ditolak.

    • Tentukan DENY di type lapangan.

    • Tentukan tindakan yang akan diambil ketika topik terdeteksi dalam permintaan menggunakan inputAction atau tanggapan menggunakanoutputAction. Pilih BLOCK untuk memblokir konten dan mengganti dengan pesan yang diblokir, atau NONE tidak mengambil tindakan selain mengembalikan informasi deteksi. Untuk informasi selengkapnya, lihat Opsi untuk menangani konten berbahaya yang terdeteksi oleh Amazon Bedrock Guardrails.

    • Atur inputEnabled dan outputEnabled untuk mengontrol apakah evaluasi pagar pembatas diaktifkan untuk permintaan dan tanggapan model.

    • (Opsional) Dalam examples daftar, tentukan hingga lima frasa sampel yang Anda wakili dari petunjuk atau tanggapan yang terkait dengan topik ini.

  • (Opsional) Tentukan tingkat perlindungan untuk pagar pembatas Anda di objek. tierConfig Pilihan termasuk STANDARD dan CLASSIC tingkatan.

    Untuk informasi selengkapnya, lihat Tingkatan perlindungan untuk kebijakan pagar pembatas.

  • (Opsional) Untuk mengaktifkan inferensi lintas wilayah, tentukan profil pagar pembatas di objek. crossRegionConfig Ini diperlukan saat menggunakan STANDARD tier.

  • Tentukan name dan description untuk pagar pembatas.

Format responsnya terlihat seperti ini:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }