Menulis praktik terbaik untuk mengoptimalkan aplikasi RAG

Ivan Cui dan Samantha Stuart, Amazon Web Services

Juli 2025 (sejarah dokumen)

Model bahasa besar (LLMs) telah merevolusi bidang kecerdasan buatan dengan kemampuan luar biasa mereka untuk memahami dan menghasilkan teks mirip manusia. Namun, mereka menghadapi batasan yang signifikan: mereka hanya dapat bekerja dengan pengetahuan yang terkandung dalam data pelatihan mereka. Di sinilah Retrieval Augmented Generation (RAG) membantu. Ini menawarkan solusi yang menggabungkan LLMs dengan sumber pengetahuan eksternal, seperti data dan dokumen organisasi Anda. Melalui proses dua tahap yang melibatkan pengambilan informasi dan generasi respons, RAG memungkinkan sistem AI untuk mengakses dan menggabungkan up-to-date informasi dari berbagai sumber, menghasilkan respons yang lebih akurat dan terinformasi yang menjembatani kesenjangan antara pengetahuan model statis dan kebutuhan informasi dunia nyata yang dinamis.

Bagaimana Anda bisa mengoptimalkan konten untuk pengambilan dalam aplikasi berbasis RAG? Panduan ini memberikan praktik terbaik untuk membantu Anda mengoptimalkan gaya pemformatan dan penulisan konten berbasis teks di basis pengetahuan. Mengoptimalkan konten meningkatkan konteks yang membantu aplikasi RAG memahami informasi spesifik tugas dengan lebih akurat. Ketika sistem mengambil konten yang sangat relevan dan akurat, maka kualitas respons LLM meningkat. Mengoptimalkan proses penyampaian konteks pada tingkat sistem disebut rekayasa konteks, dan ini merupakan bagian penting dari arsitektur RAG agen. Dalam RAG agen, satu atau lebih LLMs alasan tambahan dan bertindak atas permintaan asupan sebelum eksekusi RAG. Ini memfasilitasi proses pengiriman informasi multi-langkah. Karena arsitektur RAG tumbuh semakin kompleks, optimasi konten sumber tetap menjadi cara paling langsung untuk memberikan konteks yang jelas. LLMs Praktik terbaik ini dirancang untuk membantu Anda memaksimalkan investasi organisasi Anda dalam aplikasi RAG.

Audiens yang dituju

Panduan ini ditujukan untuk insinyur AI, ilmuwan data, insinyur data, atau pengembang perangkat lunak yang sedang membangun aplikasi LLM dengan satu atau lebih komponen RAG. Untuk memahami konsep dan rekomendasi dalam panduan ini, Anda harus terbiasa dengan database vektor dan petunjuk untuk. LLMs

Tujuan

Rekomendasi dalam panduan ini dapat membantu Anda mencapai hal berikut:

Tingkatkan akurasi dan relevansi respons yang dihasilkan oleh aplikasi RAG dengan menyediakan dokumen sumber yang terstruktur dengan baik dan kaya secara semantik, dioptimalkan untuk penggunaan token dan redundansi.
Bantu aplikasi RAG untuk lebih memahami pengetahuan dan konteks khusus domain dengan memberikan definisi dan penjelasan yang jelas dalam dokumen sumber.
Memfasilitasi pemeliharaan yang lebih mudah dan pembaruan basis pengetahuan untuk aplikasi RAG dengan mengikuti pedoman pemformatan dan penataan yang konsisten di seluruh dokumen sumber.
Tingkatkan skalabilitas solusi RAG dengan memecah dokumen monolitik besar menjadi unit mandiri yang lebih kecil yang dapat diindeks dan diambil secara efisien.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Memahami LLM dan RAG