Blokir kata-kata dan percakapan berbahaya dengan filter konten - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Blokir kata-kata dan percakapan berbahaya dengan filter konten

Amazon Bedrock Guardrails mendukung filter konten untuk membantu mendeteksi dan memfilter input pengguna berbahaya dan output yang dihasilkan model dalam bahasa alami. Filter konten didukung di seluruh kategori berikut:

Benci

  • Menjelaskan petunjuk masukan dan tanggapan model yang membedakan, mengkritik, menghina, mencela, atau merendahkan seseorang atau kelompok berdasarkan identitas (seperti ras, etnis, jenis kelamin, agama, orientasi seksual, kemampuan, dan asal negara).

Penghinaan

  • Menjelaskan petunjuk masukan dan respons model yang mencakup bahasa yang merendahkan, mempermalukan, mengejek, menghina, atau meremehkan. Jenis bahasa ini juga diberi label sebagai bullying.

Seksual

  • Menjelaskan petunjuk input dan respons model yang menunjukkan minat seksual, aktivitas, atau gairah menggunakan referensi langsung atau tidak langsung ke bagian tubuh, sifat fisik, atau jenis kelamin.

Kekerasan

  • Menjelaskan petunjuk masukan dan respons model yang mencakup pemuliaan, atau ancaman untuk menimbulkan rasa sakit fisik, luka, atau cedera terhadap seseorang, kelompok, atau benda.

Pelanggaran

  • Menjelaskan petunjuk masukan dan tanggapan model yang mencari atau memberikan informasi tentang terlibat dalam kegiatan kriminal, atau merugikan, menipu, atau mengambil keuntungan dari seseorang, kelompok atau institusi.

Konfigurasikan filter konten untuk pagar pembatas

Anda dapat mengonfigurasi filter konten untuk pagar pembatas dengan menggunakan atau AWS Management Console Amazon Bedrock API.

Console
  1. Masuk ke AWS Management Console menggunakan peran IAM dengan izin Amazon Bedrock, dan buka konsol Amazon Bedrock di. https://console.aws.amazon.com/bedrock/

  2. Dari panel navigasi kiri, pilih Guardrails, lalu pilih Create guardrail.

  3. Untuk Memberikan halaman detail pagar pembatas, lakukan hal berikut:

    1. Di bagian detail Guardrail, berikan Nama dan Deskripsi opsional untuk pagar pembatas.

    2. Untuk Pesan untuk permintaan yang diblokir, masukkan pesan yang ditampilkan saat pagar pembatas diterapkan. Pilih kotak centang Terapkan pesan yang diblokir yang sama untuk respons untuk menggunakan pesan yang sama saat pagar pembatas diterapkan pada respons.

    3. (Opsional) Untuk mengaktifkan inferensi lintas wilayah untuk pagar pembatas Anda, perluas inferensi Lintas Wilayah, lalu pilih Aktifkan inferensi lintas wilayah untuk pagar pembatas Anda. Pilih profil pagar pembatas yang menentukan tujuan Wilayah AWS di mana permintaan inferensi pagar pembatas dapat diarahkan.

    4. (Opsional) Secara default, pagar pembatas Anda dienkripsi dengan file. Kunci yang dikelola AWS Untuk menggunakan kunci KMS yang dikelola pelanggan Anda sendiri, perluas pilihan kunci KMS dan pilih kotak centang Sesuaikan pengaturan enkripsi (lanjutan).

      Anda dapat memilih AWS KMS kunci yang ada atau pilih Buat AWS KMS kunci untuk membuat yang baru.

    5. (Opsional) Untuk menambahkan tag ke pagar pembatas Anda, perluas Tag. Kemudian pilih Tambahkan tag baru untuk setiap tag yang Anda tentukan.

      Untuk informasi selengkapnya, lihat Menandai sumber daya Amazon Bedrock.

    6. Pilih Berikutnya.

  4. Pada halaman Konfigurasi filter konten, atur seberapa kuat Anda ingin memfilter konten yang terkait dengan kategori yang ditentukan Blokir kata-kata dan percakapan berbahaya dengan filter konten dengan melakukan hal berikut:

    1. Pilih Konfigurasikan filter kategori berbahaya. Pilih Teks dan/atau Gambar untuk memfilter teks atau konten gambar dari petunjuk atau tanggapan terhadap model. Pilih Tidak Ada, Rendah, Sedang, atau Tinggi untuk tingkat filtrasi yang ingin Anda terapkan untuk setiap kategori. Anda dapat memilih untuk memiliki tingkat filter yang berbeda untuk permintaan atau tanggapan. Anda dapat memilih filter untuk serangan cepat dalam kategori berbahaya. Konfigurasikan seberapa ketat yang Anda inginkan setiap filter untuk petunjuk yang diberikan pengguna ke model.

    2. Pilih Blokir atau Deteksi (tanpa tindakan) untuk menentukan tindakan apa yang dilakukan pagar pembatas Anda saat mendeteksi konten berbahaya dalam permintaan dan tanggapan.

      Untuk informasi selengkapnya, lihat Opsi untuk menangani konten berbahaya yang terdeteksi oleh Amazon Bedrock Guardrails.

    3. Untuk Setel ambang batas, pilih Tidak Ada, Rendah, Sedang, atau Tinggi untuk tingkat filtrasi yang ingin Anda terapkan ke setiap kategori.

      Anda dapat memilih untuk memiliki tingkat filter yang berbeda untuk permintaan dan tanggapan.

    4. Untuk tingkat filter Konten, pilih tingkat perlindungan yang ingin digunakan pagar pembatas untuk memfilter permintaan dan tanggapan berbasis teks. Untuk informasi selengkapnya, lihat Tingkatan perlindungan untuk kebijakan pagar pembatas.

    5. Pilih Berikutnya untuk mengonfigurasi kebijakan lain sesuai kebutuhan atau Lewati ke Tinjauan dan buat untuk menyelesaikan pembuatan pagar pembatas Anda.

  5. Tinjau pengaturan untuk pagar pembatas Anda.

    1. Pilih Edit di bagian mana pun yang ingin Anda ubah.

    2. Setelah selesai mengonfigurasi kebijakan, pilih Buat untuk membuat pagar pembatas.

API

Konfigurasikan filter konten untuk pagar pembatas Anda dengan mengirimkan permintaan. CreateGuardrail Format permintaan adalah sebagai berikut:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "contentPolicyConfig": { "filtersConfig": [ { "inputAction": "BLOCK | NONE", "inputModalities": [ "TEXT" ], "inputStrength": "NONE | LOW | MEDIUM | HIGH", "outputStrength": "NONE | LOW | MEDIUM | HIGH", "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT" } ], "tierConfig": { "tierName": "CLASSIC | STANDARD" } }, "crossRegionConfig": { "guardrailProfileIdentifier": "string" }, "description": "string", "name": "string" }
  • Tentukan name dan description untuk pagar pembatas.

  • Tentukan pesan kapan pagar pembatas berhasil memblokir prompt atau respons model di bidang blockedInputMessaging danblockedOutputsMessaging.

  • Tentukan kekuatan filter untuk kategori berbahaya yang tersedia contentPolicyConfig objek.

    Setiap item dalam filtersConfig daftar berkaitan dengan kategori berbahaya. Untuk informasi selengkapnya, lihat Blokir kata-kata dan percakapan berbahaya dengan filter konten. Untuk informasi selengkapnya tentang bidang dalam filter konten, lihat ContentFilter.

    • (Opsional) Untuk inputAction danoutputAction, tentukan tindakan pagar pembatas Anda saat mendeteksi konten berbahaya dalam permintaan dan tanggapan.

    • (Opsional) Tentukan tindakan yang akan diambil ketika konten berbahaya terdeteksi dalam permintaan menggunakan inputAction atau tanggapan menggunakanoutputAction. Pilih BLOCK untuk memblokir konten dan mengganti dengan pesan yang diblokir, atau NONE tidak mengambil tindakan selain mengembalikan informasi deteksi. Untuk informasi selengkapnya, lihat Opsi untuk menangani konten berbahaya yang terdeteksi oleh Amazon Bedrock Guardrails.

    • Tentukan kekuatan filter untuk petunjuk di inputStrength lapangan dan untuk respons model di outputStrength lapangan.

    • Tentukan kategori di type lapangan.

  • (Opsional) Tentukan tingkat perlindungan untuk pagar pembatas Anda di objek di dalam objek. tierConfig contentPolicyConfig Pilihan termasuk STANDARD dan CLASSIC tingkatan.

    Untuk informasi selengkapnya, lihat Tingkatan perlindungan untuk kebijakan pagar pembatas.

  • (Opsional) Untuk mengaktifkan inferensi lintas wilayah, tentukan profil pagar pembatas di objek. crossRegionConfig Ini diperlukan saat menggunakan STANDARD tier.

Format responsnya terlihat seperti ini:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }