Arsitektur Deskripsi Kemampuan Kasus penggunaan umum Panduan implementasi Ringkasan

Agen berbasis alat untuk server

Agen berbasis alat untuk server meningkatkan agen pemanggil fungsi dengan mendelegasikan eksekusi alat ke server eksternal yang memiliki lingkungan runtime khusus untuk alat, skrip, dan agen komposit. Tidak seperti panggilan fungsi inline yang dipilih dan dipanggil oleh loop agen, agen berbasis server mengalihdayakan logika dan pipa eksekusi ke agen atau sistem lain. Ini memberikan kemampuan canggih seperti rantai multitool, eksekusi terisolasi, dan penalaran khusus. Server alat ideal untuk tindakan yang kompleks, stateful, atau intensif sumber daya di mana alat itu sendiri mungkin melibatkan model AI, aturan bisnis, atau lingkungan yang terpisah.

Arsitektur

Berikut ini adalah pola untuk agen berbasis alat untuk server:

Deskripsi

Menerima kueri
- Pengguna atau sistem mengirimkan permintaan ke shell agen.
- Agen menafsirkan kueri dan bersiap untuk mengirimkannya ke server alat.
Menjalankan proses server alat
- Agen mengirimkan tugas, bersama dengan parameter terstruktur, ke server alat.
- Server alat kemudian dapat:
  - Jalankan skrip atau logika dalam sistem komputasi khusus (misalnya, wadah AWS Lambda, atau Amazon) SageMaker
  - Gunakan subagennya sendiri dengan penalaran LLM untuk memilih dan menjalankan alat
  - Mengelola dependensi, percobaan ulang, atau alur eksekusi multistep
  - Hasil keluaran ke agen utama saat tugas selesai
Menggunakan penalaran LLM dengan keluaran alat
- Agen memanggil LLM, meneruskan kueri asli dan hasil server alat sebagai bagian dari prompt.
- LLM mensintesis respons yang menggabungkan informasi yang baru diperoleh.
Mengembalikan respon
- Agen mengembalikan respons bahasa alami atau terstruktur ke pengguna atau sistem panggilan.
- (Opsional) Hasil dapat disimpan dalam memori atau log audit.

Kemampuan

Alat dipanggil di luar loop eksekusi agen utama
Eksekusi alat mungkin melibatkan panggilan LLM, rantai logika, atau subagen
Agen bertindak sebagai pengontrol atau operator, bukan hanya pembungkus alat
Mengaktifkan komposabilitas, skalabilitas, dan isolasi logika

Kasus penggunaan umum

Mengatur rantai model (misalnya, dengan menggabungkan LLM, visi, dan kode)
Pipa otomatisasi berbasis AI
DevOps asisten agen dengan pelari skrip
Kompleks perhitungan keuangan, simulasi, atau agen optimasi
Alat multimodal (misalnya, dengan menggabungkan audio, dokumentasi, dan tindakan)

Panduan implementasi

Anda dapat membangun pola ini menggunakan yang berikut Layanan AWS:

Amazon Bedrock (host agen dan inferensi LLM)
AWS Lambda, Amazon ECS, AWS Fargate, atau SageMaker titik akhir Amazon sebagai runtime server alat
Amazon API Gateway atau AWS App Runner untuk mengekspos server alat APIs
Amazon EventBridge untuk pesan terpisah agent-to-tool
AWS Step Functions atau AWS AppFabric untuk menyusun logika multi-agen di server alat

Ringkasan

Agen berbasis alat yang menggunakan server sangat modular dan dapat diskalakan. Mereka memisahkan logika keputusan dari eksekusi, yang memungkinkan agen utama tetap ringan saat membongkar tindakan kompleks atau sensitif ke sistem lain. Ini penting untuk AI agen tingkat perusahaan, terutama di lingkungan yang membutuhkan tata kelola, observabilitas, isolasi, komposisi dinamis, atau kombinasi apa pun darinya.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Agen berbasis alat untuk memanggil fungsi

Agen penggunaan komputer