Buat pagar pembatas Anda

Amazon Bedrock Guardrails menawarkan filter yang dapat Anda konfigurasi untuk membantu menghindari konten yang tidak diinginkan dan berbahaya serta menghapus atau menutupi informasi sensitif untuk perlindungan privasi.

Anda dapat mengonfigurasi filter berikut dengan Amazon Bedrock Guardrails:

Filter konten — Filter ini membantu Anda mendeteksi dan memfilter konten teks atau gambar berbahaya dalam permintaan input atau respons model (tidak termasuk konten penalaran). Pemfilteran dilakukan berdasarkan deteksi kategori konten berbahaya tertentu yang telah ditentukan sebelumnya: Kebencian, Penghinaan, Seksual, Kekerasan, Pelanggaran, dan Serangan Segera. Anda dapat mengonfigurasi kekuatan filter untuk masing-masing kategori ini berdasarkan kasus penggunaan Anda. Dengan tingkat Standar, deteksi konten yang tidak diinginkan diperluas untuk melindungi terhadap konten berbahaya dalam elemen kode termasuk komentar, nama variabel dan fungsi, dan literal string.
Serangan cepat - Ditawarkan sebagai kategori dalam filter konten, filter ini dapat membantu Anda mendeteksi dan memfilter serangan cepat termasuk jailbreak, injeksi cepat, dan kebocoran cepat (hanya tingkat standar). Kemampuan ini membantu Anda mendeteksi petunjuk yang dimaksudkan untuk melewati moderasi konten, mengesampingkan instruksi, atau menghasilkan konten berbahaya.
Topik yang ditolak - Anda dapat menentukan serangkaian topik yang harus dihindari dalam aplikasi AI generatif Anda. Misalnya, aplikasi asisten perbankan dapat dirancang untuk membantu menghindari topik yang terkait dengan saran investasi ilegal. Dengan tingkat Standar, filter konten meluas ke domain kode.
Filter kata — Anda dapat menentukan serangkaian kata atau frasa khusus (pencocokan persis) yang ingin Anda deteksi dan blokir dalam interaksi antara pengguna Anda dan aplikasi AI generatif. Misalnya, Anda dapat mendeteksi dan memblokir kata-kata kotor (menggunakan opsi siap pakai) serta kata-kata khusus tertentu seperti nama pesaing, atau kata-kata ofensif lainnya.
Filter informasi sensitif - Dapat membantu Anda mendeteksi konten sensitif seperti Informasi Identifikasi Pribadi (PII) dalam format standar atau entitas regex khusus dalam input pengguna dan tanggapan FM. Filter ini adalah solusi berbasis pembelajaran maching probabilistik (ML) yang bergantung pada konteks. Ini mendeteksi informasi sensitif berdasarkan konteks dalam permintaan input atau respons model. Berdasarkan kasus penggunaan Anda, Anda dapat memblokir atau menutupi masukan dan tanggapan yang berisi informasi sensitif. Misalnya, Anda dapat menyunting informasi pribadi pengguna sambil membuat ringkasan dari transkrip percakapan pelanggan dan agen.
Pemeriksaan grounding kontekstual — Dapat membantu Anda mendeteksi dan memfilter halusinasi dalam respons model jika tidak dibumikan (secara faktual tidak akurat atau menambahkan informasi baru) dalam informasi sumber atau tidak relevan dengan kueri pengguna. Misalnya, Anda dapat memblokir atau menandai respons dalam aplikasi RAG (retrieval-augmented generation), jika respons model menyimpang dari informasi di bagian yang diambil atau tidak menjawab pertanyaan dari pengguna.
Pemeriksaan penalaran otomatis — Dapat membantu Anda memvalidasi bahwa respons model mematuhi aturan dan kebijakan logis yang Anda tetapkan. Anda dapat membuat kebijakan menggunakan bahasa alami yang menentukan persyaratan penalaran, dan Pemeriksaan penalaran otomatis akan mengevaluasi apakah keluaran model sesuai dengan batasan logis ini. Misalnya, Anda dapat memastikan bahwa chatbot layanan pelanggan hanya merekomendasikan produk yang tersedia di inventaris, atau memverifikasi bahwa saran keuangan mengikuti aturan kepatuhan peraturan.

catatan

Semua konten yang diblokir dari kebijakan di atas akan muncul sebagai teks biasa di Amazon Bedrock Model Invocation Logs, jika Anda telah mengaktifkannya. Anda dapat menonaktifkan Amazon Bedrock Invocation Logs jika Anda tidak ingin konten yang diblokir muncul sebagai teks biasa di log.

Pagar pembatas harus berisi setidaknya satu filter dan pesan ketika permintaan dan tanggapan pengguna diblokir. Anda dapat memilih untuk menggunakan pesan default. Anda dapat menambahkan filter dan mengulangi pagar pembatas Anda nanti dengan mengikuti langkah-langkah di. Ubah pagar pembatas Anda

Topik

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Menggunakan kebijakan berbasis sumber daya untuk pagar pembatas

Konfigurasikan filter konten