Arsitektur Deskripsi Kemampuan Batasan Kasus penggunaan umum Panduan implementasi Ringkasan Arsitektur Deskripsi Kemampuan Kasus penggunaan umum Panduan implementasi Ringkasan

Agen penalaran dasar

Agen penalaran dasar adalah bentuk paling sederhana dari AI agen yang melakukan inferensi logis atau pengambilan keputusan dalam menanggapi kueri. Ini menerima masukan dari pengguna atau sistem dan memproses kueri dan menghasilkan tanggapan menggunakan prompt terstruktur.

Pola ini berguna untuk tugas-tugas yang membutuhkan penalaran, klasifikasi, atau ringkasan satu langkah berdasarkan konteks tertentu. Itu tidak menggunakan memori, alat, atau manajemen status, yang membuatnya stateless, ringan, dan sangat dapat dikomposisi di seluruh alur kerja besar.

Arsitektur

Aliran agen penalaran dasar ditunjukkan pada diagram berikut:

Deskripsi

Menerima masukan
- Pengguna, sistem, atau agen hulu mengirimkan kueri atau instruksi.
- Input diserahkan ke shell agen atau lapisan orkestrasi.
- Langkah ini mencakup setiap preprocessing, prompt templating, dan identifikasi tujuan.
Memanggil LLM
- Agen mengubah kueri menjadi prompt terstruktur dan mengirimkannya ke LLM (misalnya, melalui Amazon Bedrock).
- LLM menghasilkan respons berdasarkan prompt menggunakan pengetahuan dan konteks yang telah dilatih sebelumnya.
- Output yang dihasilkan dapat mencakup langkah-langkah penalaran (rantai pemikiran), jawaban akhir, atau opsi peringkat.
Mengembalikan respon
- Output yang dihasilkan diteruskan ke antarmuka agen.
- Ini mungkin termasuk pemformatan, postprocessing, atau respons API.

Kemampuan

Mendukung bahasa alami atau masukan terstruktur
Menggunakan rekayasa cepat untuk memandu perilaku
Tanpa kewarganegaraan dan terukur
Dapat disematkan ke UI, CLI, API, dan pipeline

Batasan

Tidak ada ingatan atau kesadaran historis
Tidak ada interaksi dengan alat eksternal atau sumber data
Terbatas pada apa yang diketahui LLM pada saat inferensi

Kasus penggunaan umum

Pertanyaan dan jawaban percakapan
Penjelasan dan ringkasan kebijakan
Panduan untuk membuat keputusan
Alur chatbot yang ringan dan otomatis
Klasifikasi, pelabelan, dan penilaian

Panduan implementasi

Anda dapat menggunakan alat dan layanan berikut untuk membuat agen penalaran dasar:

Amazon Bedrock untuk doa LLM (Antropik, AI21, Meta)
Amazon API Gateway atau AWS Lambda untuk mengeksposnya sebagai layanan mikro tanpa kewarganegaraan
Template prompt disimpan di Parameter Store AWS Secrets Manager,, atau sebagai kode

Ringkasan

Agen penalaran dasar adalah dasar karena strukturnya yang sederhana. Ini memiliki kemampuan inti yang mengubah tujuan menjadi jalur penalaran yang mengarah pada output cerdas. Pola ini sering menjadi titik awal untuk pola lanjutan, seperti agen berbasis alat dan agen yang menggunakan retrieval-augmented generation (RAG). Ini juga merupakan komponen yang andal dan modular dari alur kerja besar.

Agen RAG

Retrieval-augmented Generasi (RAG) adalah teknik yang menggabungkan pengambilan informasi dengan pembuatan teks untuk menciptakan respons yang akurat dan kontekstual. RAG memungkinkan agen untuk mengambil informasi eksternal yang relevan sebelum melibatkan LLM. Ini memperluas memori efektif agen dan akurasi penalaran dengan membumikan keputusannya dalam informasi terkini, faktual, atau spesifik domain. Berbeda dengan LLM stateless yang hanya mengandalkan bobot yang telah dilatih sebelumnya, RAG memiliki lapisan pencarian pengetahuan eksternal yang secara dinamis meningkatkan permintaan dengan konteks.

Arsitektur

Logika pola RAG diilustrasikan dalam diagram berikut:

Deskripsi

Menerima kueri
- Pengguna atau sistem hulu mengirimkan kueri atau tujuan ke agen.
- Shell agen menerima permintaan dan memformatnya sebagai prompt untuk penalaran.
Mencari sumber eksternal
- Agen mengidentifikasi konsep dan maksud dari kueri.
- Ini menanyakan sumber pengetahuan, seperti penyimpanan vektor, database, atau indeks dokumen menggunakan pencarian semantik atau pencocokan kata kunci.
- Bagian, dokumen, atau entitas yang paling relevan diambil untuk digunakan pada langkah berikutnya.
Menghasilkan respons kontekstual
- Agen menambah prompt dengan informasi yang diambil, membentuk input yang ditingkatkan konteks untuk LLM.
- LLM memproses setiap input menggunakan penalaran generatif (misalnya, rantai pemikiran atau refleksi) untuk menghasilkan respons yang akurat.
Mengembalikan output akhir
- Agen menyiapkan output dengan membungkusnya dalam header komunikasi atau format yang diperlukan dan kemudian mengembalikannya ke pengguna atau sistem panggilan.
- (Opsional) Dokumen yang diambil dan keluaran LLM dapat dicatat, dinilai, dan disimpan dalam memori untuk kueri masa depan.

Kemampuan

Fact-grounded output bahkan dalam domain ekor panjang atau khusus perusahaan
Ekstensi memori tanpa menyempurnakan model
Konteks dinamis berdasarkan setiap kueri dan status pengguna
Sepenuhnya kompatibel dengan database vektor, indeks semantik, dan penyaringan metadata

Kasus penggunaan umum

Asisten pengetahuan perusahaan
Bot kepatuhan peraturan
Copilot dukungan pelanggan
Search-enhanced chatbots
Agen dokumentasi pengembang

Panduan implementasi

Gunakan alat dan layanan berikut untuk membuat agen yang menggunakan RAG:

Amazon Bedrock untuk pemanggilan LLM
Amazon Kendra, OpenSearch, atau Amazon Aurora untuk dokumentasi atau pencarian data terstruktur
Amazon Simple Storage Service (Amazon S3) untuk penyimpanan dokumen
AWS Lambda untuk mengatur pencarian, prompt, dan inferensi LLM
Knowledge-based integrasi dengan agen (dengan menggunakan plugin memori, retriever semantik, atau Amazon Bedrock)

Ringkasan

Agen RAG menghubungkan penalaran model statis dengan kecerdasan dunia nyata yang dinamis. Ini melengkapi agen dengan kemampuan untuk mencari apa yang tidak mereka ketahui, mensintesis jawaban dari pengetahuan yang diambil, dan menghasilkan respons yang dapat diaudit dengan kepercayaan tinggi.

Pola RAG adalah fondasi untuk membangun agen cerdas yang meningkatkan akses pengetahuan tanpa pelatihan ulang. Ini sering merupakan pendahulu pola orkestrasi yang lebih kompleks yang melibatkan penggunaan alat, perencanaan, dan memori jangka panjang.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Pola agen

Tool-based agen untuk memanggil fungsi