Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Agen berbasis alat untuk server
Agen berbasis alat untuk server meningkatkan agen pemanggil fungsi dengan mendelegasikan eksekusi alat ke server eksternal yang memiliki lingkungan runtime khusus untuk alat, skrip, dan agen komposit. Tidak seperti panggilan fungsi inline yang dipilih dan dipanggil oleh loop agen, agen berbasis server mengalihdayakan logika dan pipa eksekusi ke agen atau sistem lain. Ini memberikan kemampuan canggih seperti rantai multitool, eksekusi terisolasi, dan penalaran khusus. Server alat ideal untuk tindakan yang kompleks, stateful, atau intensif sumber daya di mana alat itu sendiri mungkin melibatkan model AI, aturan bisnis, atau lingkungan yang terpisah.
Arsitektur
Berikut ini adalah pola untuk agen berbasis alat untuk server:
Deskripsi
-
Menerima kueri
-
Pengguna atau sistem mengirimkan permintaan ke shell agen.
-
Agen menafsirkan kueri dan bersiap untuk mengirimkannya ke server alat.
-
-
Menjalankan proses server alat
-
Agen mengirimkan tugas, bersama dengan parameter terstruktur, ke server alat.
-
Server alat kemudian dapat:
-
Jalankan skrip atau logika dalam sistem komputasi khusus (misalnya, wadah AWS Lambda, atau Amazon) SageMaker
-
Gunakan subagennya sendiri dengan penalaran LLM untuk memilih dan menjalankan alat
-
Mengelola dependensi, percobaan ulang, atau alur eksekusi multistep
-
Hasil keluaran ke agen utama saat tugas selesai
-
-
-
Menggunakan penalaran LLM dengan keluaran alat
-
Agen memanggil LLM, meneruskan kueri asli dan hasil server alat sebagai bagian dari prompt.
-
LLM mensintesis respons yang menggabungkan informasi yang baru diperoleh.
-
-
Mengembalikan respon
-
Agen mengembalikan respons bahasa alami atau terstruktur ke pengguna atau sistem panggilan.
-
(Opsional) Hasil dapat disimpan dalam memori atau log audit.
-
Kemampuan
-
Alat dipanggil di luar loop eksekusi agen utama
-
Eksekusi alat mungkin melibatkan panggilan LLM, rantai logika, atau subagen
-
Agen bertindak sebagai pengontrol atau operator, bukan hanya pembungkus alat
-
Mengaktifkan komposabilitas, skalabilitas, dan isolasi logika
Kasus penggunaan umum
-
Mengatur rantai model (misalnya, dengan menggabungkan LLM, visi, dan kode)
-
Pipa otomatisasi berbasis AI
-
DevOps asisten agen dengan pelari skrip
-
Kompleks perhitungan keuangan, simulasi, atau agen optimasi
-
Alat multimodal (misalnya, dengan menggabungkan audio, dokumentasi, dan tindakan)
Panduan implementasi
Anda dapat membangun pola ini menggunakan yang berikut Layanan AWS:
-
Amazon Bedrock (host agen dan inferensi LLM)
-
AWS Lambda, Amazon ECS, AWS Fargate, atau SageMaker titik akhir Amazon sebagai runtime server alat
-
Amazon API Gateway atau AWS App Runner untuk mengekspos server alat APIs
-
Amazon EventBridge untuk pesan terpisah agent-to-tool
-
AWS Step Functions atau AWS AppFabric untuk menyusun logika multi-agen di server alat
Ringkasan
Agen berbasis alat yang menggunakan server sangat modular dan terukur. Mereka memisahkan logika keputusan dari eksekusi, yang memungkinkan agen utama tetap ringan saat membongkar tindakan kompleks atau sensitif ke sistem lain. Ini penting untuk AI agen tingkat perusahaan, terutama di lingkungan yang membutuhkan tata kelola, observabilitas, isolasi, komposisi dinamis, atau kombinasi apa pun darinya.