Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Agen penalaran dasar
Agen penalaran dasar adalah bentuk paling sederhana dari AI agen yang melakukan inferensi logis atau pengambilan keputusan dalam menanggapi kueri. Ini menerima masukan dari pengguna atau sistem dan memproses kueri dan menghasilkan tanggapan menggunakan prompt terstruktur.
Pola ini berguna untuk tugas-tugas yang membutuhkan penalaran, klasifikasi, atau ringkasan satu langkah berdasarkan konteks tertentu. Itu tidak menggunakan memori, alat, atau manajemen status, yang membuatnya stateless, ringan, dan sangat dapat dikomposisi di seluruh alur kerja besar.
Arsitektur
Aliran agen penalaran dasar ditunjukkan pada diagram berikut:
Deskripsi
-
Menerima masukan
-
Pengguna, sistem, atau agen hulu mengirimkan kueri atau instruksi.
-
Input diserahkan ke shell agen atau lapisan orkestrasi.
-
Langkah ini mencakup setiap preprocessing, prompt templating, dan identifikasi tujuan.
-
-
Memanggil LLM
-
Agen mengubah kueri menjadi prompt terstruktur dan mengirimkannya ke LLM (misalnya, melalui Amazon Bedrock).
-
LLM menghasilkan respons berdasarkan prompt menggunakan pengetahuan dan konteks yang telah dilatih sebelumnya.
-
Output yang dihasilkan dapat mencakup langkah penalaran (chain-of-thought), jawaban akhir, atau opsi peringkat.
-
-
Mengembalikan respon
-
Output yang dihasilkan diteruskan ke antarmuka agen.
-
Ini mungkin termasuk pemformatan, postprocessing, atau respons API.
-
Kemampuan
-
Mendukung bahasa alami atau masukan terstruktur
-
Menggunakan rekayasa cepat untuk memandu perilaku
-
Tanpa kewarganegaraan dan terukur
-
Dapat disematkan ke UI, CLI, APIs, dan pipeline
Batasan
-
Tidak ada ingatan atau kesadaran historis
-
Tidak ada interaksi dengan alat eksternal atau sumber data
-
Terbatas pada apa yang diketahui LLM pada saat inferensi
Kasus penggunaan umum
-
Pertanyaan dan jawaban percakapan
-
Penjelasan dan ringkasan kebijakan
-
Panduan untuk membuat keputusan
-
Alur chatbot yang ringan dan otomatis
-
Klasifikasi, pelabelan, dan penilaian
Panduan implementasi
Anda dapat menggunakan alat dan layanan berikut untuk membuat agen penalaran dasar:
-
Amazon Bedrock untuk doa LLM (Antropik,, Meta) AI21
-
Amazon API Gateway atau AWS Lambda untuk mengeksposnya sebagai layanan mikro tanpa kewarganegaraan
-
Template prompt disimpan di Parameter Store AWS Secrets Manager,, atau sebagai kode
Ringkasan
Agen penalaran dasar adalah dasar karena strukturnya yang sederhana. Ini memiliki kemampuan inti yang mengubah tujuan menjadi jalur penalaran yang mengarah pada output cerdas. Pola ini sering menjadi titik awal untuk pola lanjutan, seperti agen berbasis alat dan agen yang menggunakan retrieval-augmented generation (RAG). Ini juga merupakan komponen yang andal dan modular dari alur kerja besar.
Agen RAG
Retrieval-augmented generation (RAG) adalah teknik yang menggabungkan pengambilan informasi dengan pembuatan teks untuk menciptakan respons yang akurat dan kontekstual. RAG memungkinkan agen untuk mengambil informasi eksternal yang relevan sebelum melibatkan LLM. Ini memperluas memori efektif agen dan akurasi penalaran dengan membumikan keputusannya dalam up-to-date, informasi faktual, atau spesifik domain. Berbeda dengan stateless LLMs yang hanya mengandalkan bobot yang telah dilatih sebelumnya, RAG memiliki lapisan pencarian pengetahuan eksternal yang secara dinamis meningkatkan permintaan dengan konteks.
Arsitektur
Logika pola RAG diilustrasikan dalam diagram berikut:
Deskripsi
-
Menerima kueri
-
Pengguna atau sistem hulu mengirimkan kueri atau tujuan ke agen.
-
Shell agen menerima permintaan dan memformatnya sebagai prompt untuk penalaran.
-
-
Mencari sumber eksternal
-
Agen mengidentifikasi konsep dan maksud dari kueri.
-
Ini menanyakan sumber pengetahuan, seperti penyimpanan vektor, database, atau indeks dokumen menggunakan pencarian semantik atau pencocokan kata kunci.
-
Bagian, dokumen, atau entitas yang paling relevan diambil untuk digunakan pada langkah berikutnya.
-
-
Menghasilkan respons kontekstual
-
Agen menambah prompt dengan informasi yang diambil, membentuk input yang ditingkatkan konteks untuk LLM.
-
LLM memproses setiap input menggunakan penalaran generatif (misalnya, chain-of-thought atau refleksi) untuk menghasilkan respons yang akurat.
-
-
Mengembalikan output akhir
-
Agen menyiapkan output dengan membungkusnya dalam header komunikasi atau format yang diperlukan dan kemudian mengembalikannya ke pengguna atau sistem panggilan.
-
(Opsional) Dokumen yang diambil dan keluaran LLM dapat dicatat, dicetak, dan disimpan dalam memori untuk kueri masa depan.
-
Kemampuan
-
Output berdasarkan fakta bahkan di domain ekor panjang atau khusus perusahaan
-
Ekstensi memori tanpa menyempurnakan model
-
Konteks dinamis berdasarkan setiap kueri dan status pengguna
-
Sepenuhnya kompatibel dengan database vektor, indeks semantik, dan penyaringan metadata
Kasus penggunaan umum
-
Asisten pengetahuan perusahaan
-
Bot kepatuhan peraturan
-
Copilot dukungan pelanggan
-
Chatbots yang disempurnakan pencarian
-
Agen dokumentasi pengembang
Panduan implementasi
Gunakan alat dan layanan berikut untuk membuat agen yang menggunakan RAG:
-
Amazon Bedrock untuk pemanggilan LLM
-
Amazon Kendra, OpenSearch, atau Amazon Aurora untuk dokumentasi atau pencarian data terstruktur
-
Amazon Simple Storage Service (Amazon S3) untuk penyimpanan dokumen
-
AWS Lambda untuk mengatur pencarian, prompt, dan inferensi LLM
-
Integrasi berbasis pengetahuan dengan agen (dengan menggunakan plugin memori, retriever semantik, atau Amazon Bedrock)
Ringkasan
Agen RAG menghubungkan penalaran model statis dengan kecerdasan dunia nyata yang dinamis. Ini melengkapi agen dengan kemampuan untuk mencari apa yang tidak mereka ketahui, mensintesis jawaban dari pengetahuan yang diambil, dan menghasilkan respons yang dapat diaudit dengan kepercayaan tinggi.
Pola RAG adalah fondasi untuk membangun agen cerdas yang meningkatkan akses pengetahuan tanpa pelatihan ulang. Ini sering merupakan pendahulu pola orkestrasi yang lebih kompleks yang melibatkan penggunaan alat, perencanaan, dan memori jangka panjang.