Buat pagar pembatas Anda - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat pagar pembatas Anda

Amazon Bedrock Guardrails terdiri dari kumpulan kebijakan pemfilteran berbeda yang dapat Anda konfigurasikan untuk membantu menghindari konten yang tidak diinginkan dan berbahaya serta menghapus atau menutupi informasi sensitif untuk perlindungan privasi.

Anda dapat mengonfigurasi kebijakan berikut di pagar pembatas:

  • Filter konten — Anda dapat mengonfigurasi ambang batas untuk membantu memblokir permintaan input atau memodelkan respons dalam bahasa alami untuk teks dan secara terpisah untuk gambar yang berisi konten berbahaya seperti: kebencian, penghinaan, seksual, kekerasan, pelanggaran (termasuk aktivitas kriminal), dan serangan cepat (injeksi cepat dan jailbreak). Misalnya, situs e-commerce dapat merancang asisten online-nya untuk menghindari penggunaan and/or gambar bahasa yang tidak pantas seperti kebencian atau kekerasan.

  • Serangan cepat - Dapat membantu Anda mendeteksi dan memfilter serangan cepat dan suntikan cepat. Membantu mendeteksi petunjuk yang dimaksudkan untuk melewati moderasi, mengesampingkan instruksi, atau menghasilkan konten berbahaya.

  • Topik yang ditolak - Anda dapat menentukan serangkaian topik yang harus dihindari dalam aplikasi AI generatif Anda. Misalnya, aplikasi asisten perbankan dapat dirancang untuk membantu menghindari topik yang terkait dengan saran investasi ilegal.

  • Filter Word - Anda dapat mengonfigurasi serangkaian kata atau frasa khusus (pencocokan persis) yang ingin Anda deteksi dan blokir dalam interaksi antara pengguna Anda dan aplikasi AI generatif. Misalnya, Anda dapat mendeteksi dan memblokir kata-kata kotor serta kata-kata khusus tertentu seperti nama pesaing, atau kata-kata ofensif lainnya.

  • Filter informasi sensitif - Dapat membantu Anda mendeteksi konten sensitif seperti Informasi Identifikasi Pribadi (PII) dalam format standar atau entitas regex khusus dalam input pengguna dan tanggapan FM. Berdasarkan kasus penggunaan, Anda dapat menolak input yang berisi informasi sensitif atau menyuntingnya dalam tanggapan FM. Misalnya, Anda dapat menyunting informasi pribadi pengguna sambil membuat ringkasan dari transkrip percakapan pelanggan dan agen.

  • Pemeriksaan grounding kontekstual — Dapat membantu Anda mendeteksi dan memfilter halusinasi dalam respons model jika tidak dibumikan (secara faktual tidak akurat atau menambahkan informasi baru) dalam informasi sumber atau tidak relevan dengan kueri pengguna. Misalnya, Anda dapat memblokir atau menandai respons dalam aplikasi RAG (pengambilan augmented generation), jika respons model menyimpang dari informasi di bagian yang diambil atau tidak menjawab pertanyaan oleh pengguna.

catatan

Semua konten yang diblokir dari kebijakan di atas akan muncul sebagai teks biasa di Amazon Bedrock Model Invocation Logs, jika Anda telah mengaktifkannya. Anda dapat menonaktifkan Amazon Bedrock Invocation Logs jika Anda tidak ingin konten yang diblokir muncul sebagai teks biasa di log.

Pagar pembatas harus berisi setidaknya satu filter dan pesan ketika permintaan dan tanggapan pengguna diblokir. Anda dapat memilih untuk menggunakan pesan default. Anda dapat menambahkan filter dan mengulangi pagar pembatas Anda nanti dengan mengikuti langkah-langkah di. Ubah pagar pembatas Anda