Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Buat pagar pembatas Anda
Amazon Bedrock Guardrails terdiri dari kumpulan kebijakan pemfilteran berbeda yang dapat Anda konfigurasikan untuk membantu menghindari konten yang tidak diinginkan dan berbahaya serta menghapus atau menutupi informasi sensitif untuk perlindungan privasi.
Anda dapat mengonfigurasi kebijakan berikut di pagar pembatas:
-
Filter konten — Mendeteksi dan memfilter konten teks atau gambar berbahaya dalam permintaan input atau respons model. Pemfilteran dilakukan berdasarkan deteksi kategori konten berbahaya tertentu yang telah ditentukan sebelumnya: Kebencian, Penghinaan, Seksual, Kekerasan, Pelanggaran, dan Serangan Segera. Anda juga dapat menyesuaikan kekuatan filter untuk masing-masing kategori ini. Dengan tingkat Standar, filter konten meluas ke konten terkait kode.
-
Serangan cepat - Dapat membantu Anda mendeteksi dan memfilter serangan cepat dan suntikan cepat. Membantu mendeteksi petunjuk yang dimaksudkan untuk melewati moderasi, mengesampingkan instruksi, atau menghasilkan konten berbahaya.
-
Topik yang ditolak - Anda dapat menentukan serangkaian topik yang harus dihindari dalam aplikasi AI generatif Anda. Misalnya, aplikasi asisten perbankan dapat dirancang untuk membantu menghindari topik yang terkait dengan saran investasi ilegal. Dengan tingkat Standar, filter konten meluas ke konten terkait kode.
-
Filter Word — Anda dapat mengonfigurasi serangkaian kata atau frasa khusus (pencocokan persis) yang ingin Anda deteksi dan blokir dalam interaksi antara pengguna Anda dan aplikasi AI generatif. Misalnya, Anda dapat mendeteksi dan memblokir kata-kata kotor serta kata-kata khusus tertentu seperti nama pesaing, atau kata-kata ofensif lainnya.
-
Filter informasi sensitif - Dapat membantu Anda mendeteksi konten sensitif seperti Informasi Identifikasi Pribadi (PII) dalam format standar atau entitas regex khusus dalam input pengguna dan tanggapan FM. Berdasarkan kasus penggunaan, Anda dapat menolak input yang berisi informasi sensitif atau menyuntingnya dalam tanggapan FM. Misalnya, Anda dapat menyunting informasi pribadi pengguna sambil membuat ringkasan dari transkrip percakapan pelanggan dan agen.
-
Pemeriksaan grounding kontekstual — Dapat membantu Anda mendeteksi dan memfilter halusinasi dalam respons model jika tidak dibumikan (secara faktual tidak akurat atau menambahkan informasi baru) dalam informasi sumber atau tidak relevan dengan kueri pengguna. Misalnya, Anda dapat memblokir atau menandai respons dalam aplikasi RAG (pengambilan augmented generation), jika respons model menyimpang dari informasi di bagian yang diambil atau tidak menjawab pertanyaan oleh pengguna.
-
Pemeriksaan penalaran otomatis — Dapat membantu Anda memvalidasi bahwa respons model mematuhi aturan dan kebijakan logis yang Anda tetapkan. Anda dapat membuat kebijakan menggunakan bahasa alami yang menentukan persyaratan penalaran, dan pagar pembatas akan mengevaluasi apakah keluaran model sesuai dengan batasan logis ini. Misalnya, Anda dapat memastikan bahwa chatbot layanan pelanggan hanya merekomendasikan produk yang benar-benar tersedia dalam inventaris, atau memverifikasi bahwa saran keuangan mengikuti aturan kepatuhan peraturan.
catatan
Semua konten yang diblokir dari kebijakan di atas akan muncul sebagai teks biasa di Amazon Bedrock Model Invocation Logs, jika Anda telah mengaktifkannya. Anda dapat menonaktifkan Amazon Bedrock Invocation Logs jika Anda tidak ingin konten yang diblokir muncul sebagai teks biasa di log.
Pagar pembatas harus berisi setidaknya satu filter dan pesan ketika permintaan dan tanggapan pengguna diblokir. Anda dapat memilih untuk menggunakan pesan default. Anda dapat menambahkan filter dan mengulangi pagar pembatas Anda nanti dengan mengikuti langkah-langkah di. Ubah pagar pembatas Anda
Topik
Konfigurasikan filter konten untuk Amazon Bedrock Guardrails
Blokir topik yang ditolak untuk membantu menghapus konten berbahaya
Hapus daftar kata dan frasa tertentu dari percakapan dengan filter kata
Hapus PII dari percakapan dengan menggunakan filter informasi sensitif
Gunakan pemeriksaan pentanahan kontekstual untuk memfilter halusinasi dalam tanggapan
Opsi untuk menangani konten berbahaya yang terdeteksi oleh Amazon Bedrock Guardrails
Tingkatkan akurasi dengan menambahkan pemeriksaan Penalaran Otomatis di Amazon Bedrock Guardrails