Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menulis praktik terbaik untuk mengoptimalkan aplikasi RAG
Ivan Cui dan Samantha Stuart, Amazon Web Services
Juli 2025 (sejarah dokumen)
Model bahasa besar (LLMs) telah merevolusi bidang kecerdasan buatan dengan kemampuan luar biasa mereka untuk memahami dan menghasilkan teks mirip manusia. Namun, mereka menghadapi batasan yang signifikan: mereka hanya dapat bekerja dengan pengetahuan yang terkandung dalam data pelatihan mereka. Di sinilah Retrieval Augmented Generation (RAG
Bagaimana Anda bisa mengoptimalkan konten untuk pengambilan dalam aplikasi berbasis RAG? Panduan ini memberikan praktik terbaik untuk membantu Anda mengoptimalkan gaya pemformatan dan penulisan konten berbasis teks di basis pengetahuan. Mengoptimalkan konten meningkatkan konteks yang membantu aplikasi RAG memahami informasi spesifik tugas dengan lebih akurat. Ketika sistem mengambil konten yang sangat relevan dan akurat, maka kualitas respons LLM meningkat. Mengoptimalkan proses penyampaian konteks pada tingkat sistem disebut rekayasa konteks, dan ini merupakan bagian penting dari arsitektur RAG agen. Dalam RAG agen, satu atau lebih LLMs alasan tambahan dan bertindak atas permintaan asupan sebelum eksekusi RAG. Ini memfasilitasi proses pengiriman informasi multi-langkah. Karena arsitektur RAG tumbuh semakin kompleks, optimasi konten sumber tetap menjadi cara paling langsung untuk memberikan konteks yang jelas. LLMs Praktik terbaik ini dirancang untuk membantu Anda memaksimalkan investasi organisasi Anda dalam aplikasi RAG.
Audiens yang dituju
Panduan ini ditujukan untuk insinyur AI, ilmuwan data, insinyur data, atau pengembang perangkat lunak yang sedang membangun aplikasi LLM dengan satu atau lebih komponen RAG. Untuk memahami konsep dan rekomendasi dalam panduan ini, Anda harus terbiasa dengan database vektor dan petunjuk untuk. LLMs
Tujuan
Rekomendasi dalam panduan ini dapat membantu Anda mencapai hal berikut:
-
Tingkatkan akurasi dan relevansi respons yang dihasilkan oleh aplikasi RAG dengan menyediakan dokumen sumber yang terstruktur dengan baik dan kaya secara semantik, dioptimalkan untuk penggunaan token dan redundansi.
-
Bantu aplikasi RAG untuk lebih memahami pengetahuan dan konteks khusus domain dengan memberikan definisi dan penjelasan yang jelas dalam dokumen sumber.
-
Memfasilitasi pemeliharaan yang lebih mudah dan pembaruan basis pengetahuan untuk aplikasi RAG dengan mengikuti pedoman pemformatan dan penataan yang konsisten di seluruh dokumen sumber.
-
Tingkatkan skalabilitas solusi RAG dengan memecah dokumen monolitik besar menjadi unit mandiri yang lebih kecil yang dapat diindeks dan diambil secara efisien.