Konfigurasikan filter konten untuk pagar pembatas

Blokir kata-kata dan percakapan berbahaya dengan filter konten

Amazon Bedrock Guardrails mendukung filter konten untuk membantu mendeteksi dan memfilter input pengguna berbahaya dan output yang dihasilkan model dalam bahasa alami serta konten terkait kode di tingkat Standar. Filter konten didukung di seluruh kategori berikut:

Benci

Menjelaskan petunjuk masukan dan tanggapan model yang mendiskriminasi, mengkritik, menghina, mencela, atau merendahkan seseorang atau kelompok berdasarkan identitas (seperti ras, etnis, jenis kelamin, agama, orientasi seksual, kemampuan, dan asal negara).

Penghinaan

Menjelaskan petunjuk masukan dan respons model yang mencakup bahasa yang merendahkan, mempermalukan, mengejek, menghina, atau meremehkan. Jenis bahasa ini juga diberi label sebagai bullying.

Seksual

Menjelaskan petunjuk input dan respons model yang menunjukkan minat seksual, aktivitas, atau gairah menggunakan referensi langsung atau tidak langsung ke bagian tubuh, sifat fisik, atau jenis kelamin.

Kekerasan

Menjelaskan petunjuk masukan dan respons model yang mencakup pemuliaan, atau ancaman untuk menimbulkan rasa sakit fisik, luka, atau cedera terhadap seseorang, kelompok, atau benda.

Pelanggaran

Menjelaskan petunjuk masukan dan tanggapan model yang mencari atau memberikan informasi tentang terlibat dalam kegiatan kriminal, atau merugikan, menipu, atau mengambil keuntungan dari seseorang, kelompok atau institusi.

Konfigurasikan filter konten untuk pagar pembatas

Anda dapat mengonfigurasi filter konten untuk pagar pembatas dengan menggunakan atau Konsol Manajemen AWS Amazon Bedrock API.

Console

Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di https://console.aws.amazon.com/bedrock.
Dari panel navigasi kiri, pilih Guardrails, lalu pilih Create guardrail.
Untuk Memberikan halaman detail pagar pembatas, lakukan hal berikut:
1. Di bagian detail Guardrail, berikan Nama dan Deskripsi opsional untuk pagar pembatas.
2. Untuk Pesan untuk permintaan yang diblokir, masukkan pesan yang ditampilkan saat pagar pembatas diterapkan. Pilih kotak centang Terapkan pesan yang diblokir yang sama untuk respons untuk menggunakan pesan yang sama saat pagar pembatas diterapkan pada respons.
3. (Opsional) Untuk mengaktifkan inferensi lintas wilayah untuk pagar pembatas Anda, perluas inferensi, lalu pilih Aktifkan Cross-Region inferensi lintas wilayah untuk pagar pembatas Anda. Pilih profil pagar pembatas yang menentukan tujuan Wilayah AWS di mana permintaan inferensi pagar pembatas dapat diarahkan.
4. (Opsional) Secara default, pagar pembatas Anda dienkripsi dengan file. Kunci yang dikelola AWS Untuk menggunakan kunci KMS yang dikelola pelanggan Anda sendiri, perluas pilihan kunci KMS dan pilih kotak centang Sesuaikan pengaturan enkripsi (lanjutan).
  
  Anda dapat memilih AWS KMS kunci yang ada atau pilih Buat AWS KMS kunci untuk membuat yang baru.
5. (Opsional) Untuk menambahkan tag ke pagar pembatas Anda, perluas Tag. Kemudian pilih Tambahkan tag baru untuk setiap tag yang Anda tentukan.
  
  Untuk informasi selengkapnya, lihat Menandai sumber daya Amazon Bedrock.
6. Pilih Berikutnya.
Pada halaman Konfigurasi filter konten, atur seberapa kuat Anda ingin memfilter konten yang terkait dengan kategori yang ditentukan Blokir kata-kata dan percakapan berbahaya dengan filter konten dengan melakukan hal berikut:
1. Pilih Konfigurasikan filter kategori berbahaya. Pilih and/or Gambar Teks untuk memfilter konten teks atau gambar dari petunjuk atau tanggapan terhadap model. Pilih Tidak Ada, Rendah, Sedang, atau Tinggi untuk tingkat filtrasi yang ingin Anda terapkan untuk setiap kategori. Anda dapat memilih untuk memiliki tingkat filter yang berbeda untuk permintaan atau tanggapan. Anda dapat memilih filter untuk serangan cepat dalam kategori berbahaya. Konfigurasikan seberapa ketat yang Anda inginkan setiap filter untuk petunjuk yang diberikan pengguna ke model.
2. Pilih Blokir atau Deteksi (tanpa tindakan) untuk menentukan tindakan apa yang dilakukan pagar pembatas Anda saat mendeteksi konten berbahaya dalam permintaan dan tanggapan.
  
  Untuk informasi selengkapnya, lihat Opsi untuk menangani konten berbahaya yang terdeteksi oleh Amazon Bedrock Guardrails.
3. Untuk Setel ambang batas, pilih Tidak Ada, Rendah, Sedang, atau Tinggi untuk tingkat filtrasi yang ingin Anda terapkan ke setiap kategori.
  
  Anda dapat memilih untuk memiliki tingkat filter yang berbeda untuk permintaan dan tanggapan.
4. Untuk tingkat filter Konten, pilih tingkat perlindungan yang ingin digunakan pagar pembatas untuk memfilter permintaan dan tanggapan berbasis teks. Untuk informasi selengkapnya, lihat Tingkatan perlindungan untuk kebijakan pagar pembatas.
5. Pilih Berikutnya untuk mengonfigurasi kebijakan lain sesuai kebutuhan atau Lewati ke Tinjauan dan buat untuk menyelesaikan pembuatan pagar pembatas Anda.
Tinjau pengaturan untuk pagar pembatas Anda.
1. Pilih Edit di bagian mana pun yang ingin Anda ubah.
2. Setelah selesai mengonfigurasi kebijakan, pilih Buat untuk membuat pagar pembatas.

API

Konfigurasikan filter konten untuk pagar pembatas Anda dengan mengirimkan permintaan. CreateGuardrail Format permintaan adalah sebagai berikut:


POST /guardrails HTTP/1.1
Content-type: application/json

{
   "blockedInputMessaging": "string",
   "blockedOutputsMessaging": "string",
   "contentPolicyConfig": { 
      "filtersConfig": [ 
         {
            "inputAction": "BLOCK | NONE",
            "inputModalities": [ "TEXT" ], 
            "inputStrength": "NONE | LOW | MEDIUM | HIGH",
            "outputStrength": "NONE | LOW | MEDIUM | HIGH",
            "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT"
         }
      ],
      "tierConfig": { 
         "tierName": "CLASSIC | STANDARD"
      }
   },
   "crossRegionConfig": { 
      "guardrailProfileIdentifier": "string"
   },
   "description": "string",
   "name": "string"
}

Tentukan name dan description untuk pagar pembatas.
Tentukan pesan kapan pagar pembatas berhasil memblokir prompt atau respons model di bidang blockedInputMessaging danblockedOutputsMessaging.
Tentukan kekuatan filter untuk kategori berbahaya yang tersedia contentPolicyConfig objek.

Setiap item dalam filtersConfig daftar berkaitan dengan kategori berbahaya. Untuk informasi selengkapnya, lihat Blokir kata-kata dan percakapan berbahaya dengan filter konten. Untuk informasi selengkapnya tentang bidang dalam filter konten, lihat ContentFilter.
- (Opsional) Untuk inputAction danoutputAction, tentukan tindakan pagar pembatas Anda saat mendeteksi konten berbahaya dalam permintaan dan tanggapan.
- (Opsional) Tentukan tindakan yang akan diambil ketika konten berbahaya terdeteksi dalam permintaan menggunakan inputAction atau tanggapan menggunakanoutputAction. Pilih BLOCK untuk memblokir konten dan mengganti dengan pesan yang diblokir, atau NONE tidak mengambil tindakan selain mengembalikan informasi deteksi. Untuk informasi selengkapnya, lihat Opsi untuk menangani konten berbahaya yang terdeteksi oleh Amazon Bedrock Guardrails.
- Tentukan kekuatan filter untuk petunjuk di inputStrength lapangan dan untuk respons model di outputStrength lapangan.
- Tentukan kategori di type lapangan.
(Opsional) Tentukan tingkat perlindungan untuk pagar pembatas Anda di objek di dalam objek. tierConfig contentPolicyConfig Pilihan termasuk STANDARD dan CLASSIC tingkatan.

Untuk informasi selengkapnya, lihat Tingkatan perlindungan untuk kebijakan pagar pembatas.
(Opsional) Untuk mengaktifkan inferensi lintas wilayah, tentukan profil pagar pembatas di objek. crossRegionConfig Ini diperlukan saat menggunakan STANDARD tier.

Format responsnya terlihat seperti ini:


HTTP/1.1 202
Content-type: application/json

{
   "createdAt": "string",
   "guardrailArn": "string",
   "guardrailId": "string",
   "version": "string"
}

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Konfigurasikan filter konten

Filter konten (gambar)