Generasi Augmented Grounding dan Retrieval - AWS Panduan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Generasi Augmented Grounding dan Retrieval

Kepercayaan, akurasi, dan penjelasan sangat penting untuk menerapkan sistem AI di lingkungan produksi perusahaan. Model foundation (FMs) menawarkan kemampuan umum yang mengesankan. Namun, mereka dilatih pada korpora publik skala besar dan sering kurang kesadaran akan data kepemilikan, aturan bisnis, atau perubahan terbaru.

Untuk mengatasi kesenjangan kesadaran ini, AWS aktifkan Retrieval Augmented Generation (RAG) melalui Amazon Bedrock Knowledge Bases. RAG adalah pola arsitektur yang kuat yang mendasari respons FM dalam pengetahuan eksternal khusus domain, memberikan akurasi faktual dan relevansi kontekstual.

RAG meningkatkan output model bahasa besar (LLM) dengan menggabungkan dua proses:

  • Ambil — Gunakan mekanisme pencarian semantik (biasanya didukung oleh penyematan vektor) untuk mengidentifikasi konten yang relevan dari sumber pengetahuan yang dikuratori (misalnya, dokumen internal, manual produk, dan log kasus).

  • Hasilkan - Berikan konteks yang diambil sebagai bagian dari prompt ke LLM, memungkinkannya untuk menyusun jawaban yang didasarkan pada informasi otoritatif itu.

Pendekatan ini memungkinkan model yayasan “buku tertutup” untuk bertindak seolah-olah mereka memiliki akses ke data perusahaan langsung Anda yang dikuratori, tanpa pelatihan ulang.

Misalnya, seorang karyawan bertanya kepada asisten AI internal “Apa kebijakan perjalanan kami?” Jawaban asisten dibuat dengan menggunakan dokumentasi sumber daya manusia (SDM) yang di-host di Amazon Simple Storage Service (Amazon S3), tanpa perlu menyempurnakan model.

Pembumian di Amazon Bedrock

Amazon Bedrock mendukung grounding melalui fitur Basis Pengetahuan, memungkinkan pengembang untuk mengonfigurasi dan menautkan repositori konten perusahaan ke model pondasi tanpa mengelola infrastruktur.

Kemampuan utama grounding di Amazon Bedrock meliputi yang berikut:

  • Penyematan dokumen secara otomatis menggunakan penyedia FM yang didukung

  • Pencarian semantik di seluruh PDFs, HTML, dokumen Word, atau file teks yang disimpan di Amazon S3

  • Grounding tanpa fine-tuning karena konten disuntikkan ke jendela konteks LLM

  • Bekerja dengan Amazon Bedrock Agents untuk melakukan penalaran kompleks atau penggunaan alat multi-langkah

Sumber landasan yang didukung di Pangkalan Pengetahuan Batuan Dasar Amazon meliputi yang berikut:

  • Amazon S3 (dukungan asli), dan,, Confluence SalesforceSharePoint, atau Perayap Web (dalam pratinjau)

  • Indeks pra-tertanam dengan menggunakan toko vektor seperti Amazon Aurora, Amazon Tanpa Server, OpenSearch Amazon Neptunus Analytics,,, dan MongoDB Enterprise Pinecone Cloud. Redis

Dukungan model grounding di Amazon Bedrock meliputi yang berikut:

  • Semua LLMs yang kompatibel dengan pentanahan dukungan Amazon Bedrock.

  • Model Amazon Nova dioptimalkan untuk grounding di seluruh teks, gambar, dan video dengan menggunakan teknik pengambilan hibrida.

  • Output yang dibumikan dapat diatur lebih lanjut oleh agen Amazon Bedrock untuk penalaran dan pengambilan keputusan.

Integrasi dengan AI agen

RAG bekerja sangat baik dengan agen Amazon Bedrock dengan memungkinkan mereka untuk bertindak dengan intelijen kontekstual dan kesadaran kebijakan. Berikut ini adalah contoh alur kerja agen:

  1. Masukan pengguna dikirim ke Amazon EventBridge, yang mengirimkannya ke agen Amazon Bedrock.

  2. Agen memanggil basis pengetahuan untuk mencari dokumen internal.

  3. Konteks yang diambil disematkan ke dalam prompt LLM.

  4. LLM menghasilkan output yang dibumikan dengan referensi dan ketertelusuran.

  5. (Opsional) Agen menyimpan output dan bukti pendukung dalam memori untuk tindakan masa depan.

Alur kerja ini memungkinkan agen untuk bernalar di atas konteks yang membumi dan membuat keputusan yang dapat dijelaskan, menjembatani kesenjangan antara kecerdasan tujuan umum dan aplikasi khusus domain.

Menambahkan pagar pembatas untuk keamanan dan kepatuhan

Grounding meningkatkan akurasi, tetapi AI tingkat produksi menuntut kontrol eksplisit untuk apa yang dapat dan tidak dapat dikatakan atau dilakukan model. Fitur Amazon Bedrock Guardrails membatasi perilaku agen dan menegakkan kebijakan perusahaan.

Kemampuan pagar pembatas meliputi:

  • Filter konten — Mencegah keluaran yang melanggar standar keselamatan atau kepatuhan, termasuk menutupi informasi identitas pribadi.

  • Topik penolakan — Blokir kategori tanggapan tertentu (misalnya, tidak ada saran medis).

  • Inspeksi cepat — Identifikasi dan lepaskan input sensitif sebelum inferensi.

  • Kontrol akses tingkat pengguna - Sesuaikan respons berdasarkan identitas dan peran dengan menggunakan AWS Identity and Access Management (IAM).

  • Kendala konteks sesi — Mencegah penyimpangan model dengan melingkupi agen ke tugas tertentu.

Dengan pagar pembatas, organisasi dapat dengan aman mendelegasikan penalaran dan pengambilan keputusan kepada agen sambil mempertahankan kendali atas nada, perilaku, dan batasan.

Penalaran otomatis selain RAG

Konten yang dibumikan tidak cukup. Agen harus beralasan atas konten itu. Di sinilah penalaran otomatis berbasis LLM menjadi penting. Penalaran otomatis berfokus pada memungkinkan agen untuk bernalar secara logis, seperti menarik kesimpulan, membuat keputusan, atau memecahkan masalah, tanpa campur tangan manusia secara langsung.

Penalaran otomatis memungkinkan hal berikut:

  • Sintesis — Bandingkan, kontraskan, atau rangkum beberapa dokumen yang diambil.

  • Logika multi-hop — Hubungkan fakta di seluruh dokumen atau bagian untuk menarik kesimpulan.

  • Pengambilan keputusan — Pilih antara data yang saling bertentangan berdasarkan aturan atau preferensi.

  • Tanggapan berbasis bukti — Kutipan keluaran dan pembenaran untuk setiap keputusan.

Kemampuan ini mengubah respons yang dibumikan menjadi jawaban yang masuk akal, dan agen Amazon Bedrock dari alat pengambilan menjadi penasihat sadar domain.

Dengan alat seperti rantai cepat, loop evaluasi refleksi, dan orkestrasi multi-agen, sistem AI agen dapat mensimulasikan pola penalaran ahli, seperti diagnosis, triase, perencanaan, atau analisis risiko.

Model Amazon Nova dan generasi yang membumi

Dengan Amazon Nova Pro dan Amazon Nova Premier, alur kerja RAG yang dibumikan meluas ke input multimodal, memungkinkan agen untuk menafsirkan dan bernalar di seluruh sumber berikut:

  • Dokumen beranotasi dan file PDF

  • Diagram, bagan, dan gambar yang disematkan

  • Tangkapan layar, formulir, dan visualisasi data terstruktur

  • Transkrip video dan slide deck

Kemampuan ini membuat Amazon Nova secara unik cocok untuk industri yang membutuhkan pemahaman mendalam tentang konten media kaya, seperti kasus hukum, penilaian asuransi, catatan klinis, atau pengajuan peraturan.

Keamanan dan tata kelola di RAG

Model perusahaan grounding memperkenalkan, seperti melalui RAG, basis pengetahuan, atau fine-tuning, tanggung jawab baru. Anda menyuntikkan data dan konteks Anda sendiri ke dalam model dasar. Ini memperkenalkan tanggung jawab baru di luar hanya pemilihan model dan kerajinan yang cepat. AWS merekomendasikan kontrol berikut, yang bekerja sama dengan pagar pembatas untuk mendukung penerapan perusahaan yang percaya diri:

  • Jaminan kualitas data sumber - Respons yang dibumikan hanya dapat diandalkan seperti dokumen, database, atau APIs yang menjadi dasarnya.

  • Klasifikasi dan keterlacakan data — Mengklasifikasikan dan menandai sumber konten, untuk menunjukkan dari mana respons yang dibumikan berasal.

  • Kontrol akses — Menyuntikkan dokumen pribadi ke dalam petunjuk meningkatkan risiko keamanan dan privasi. Batasi akses ke dokumen atau embeddings tertentu melalui IAM.

  • Pembaruan dan manajemen drift - Pengetahuan yang membumi harus berkembang dengan bisnis Anda. Harus ada pembuatan versi, kebijakan kesegaran, dan pengindeksan ulang otomatis untuk mencegah penyimpangan atau informasi basi dalam output model.

  • Tata Kelola Intelijen Tertanam — Anda sekarang menyebarkan pengetahuan organisasi dengan menggunakan AI. Kemampuan itu datang dengan tugas untuk memvalidasi, memantau, dan mengatur bagaimana hal itu diungkapkan, terutama dalam domain yang diatur seperti perawatan kesehatan dan keuangan.

  • Pengamatan yang cepat — Sistem yang dibumikan harus menghormati hak IP, persyaratan peraturan, dan penafian perusahaan. Tangkap rantai prompt, konteks, dan respons lengkap untuk kepatuhan.

  • Audit logging — Lacak pengambilan dan inferensi melalui AWS CloudTrail dan log terstruktur CloudWatch .

  • Umpan balik pengguna dan loop koreksi — Perusahaan bertanggung jawab untuk memungkinkan pengguna menandai landasan yang buruk, jawaban yang salah, atau sumber yang tidak relevan, dan mengarahkan umpan balik tersebut untuk meningkatkan relevansi masa depan.

  • Kontrol memori - Pilih apakah akan mempertahankan wawasan yang disimpulkan selama sesi.

  • Pengoptimalan anggaran token — Saat grounding menambahkan potongan teks yang besar, ini meningkatkan penggunaan token (dan biaya). Anda harus menyeimbangkan presisi RAG dan ekonomi yang cepat, seringkali melalui chunking, ringkasan, atau penyaringan metadata.

Ringkasan grounding dan RAG

RAG adalah strategi dasar untuk AI perusahaan yang aman dan terukur. Dengan membumikan model fondasi dalam pengetahuan internal otoritatif, RAG mengubah model bahasa besar dari generator tujuan umum menjadi asisten AI yang sadar domain, selaras dengan kebijakan, dan dapat dijelaskan. Pendekatan ini mengurangi halusinasi, menegakkan kepatuhan terhadap kebijakan internal, dan memungkinkan respons kontekstual berbasis fakta — membuat AI generatif cocok untuk aplikasi yang dihadapi pelanggan dan karyawan.

Ketika dikombinasikan dengan penalaran otomatis dan pagar pembatas, model yang dibumikan tidak hanya menjadi alat, tetapi agen yang bertanggung jawab dan tepercaya. Dengan dukungan RAG tanpa server Amazon Bedrock dan kemampuan multimodal Amazon Nova, organisasi dapat menskalakan AI yang aman dan berkinerja tinggi di seluruh bisnis mereka tanpa mengelola infrastruktur.