Blok bangunan inti agen perangkat lunak - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Blok bangunan inti agen perangkat lunak

Diagram berikut menyajikan modul fungsional utama yang ditemukan di sebagian besar agen cerdas. Setiap komponen berkontribusi pada kemampuan agen untuk beroperasi secara mandiri di lingkungan yang kompleks.

Modul fungsional utama dan submodul dalam agen cerdas.

Dalam konteks loop persepsi, alasan, tindakan, kemampuan penalaran agen didistribusikan di modul kognitif dan pembelajarannya. Melalui integrasi memori dan pembelajaran, agen mengembangkan penalaran adaptif yang didasarkan pada pengalaman masa lalu. Ketika agen bertindak dalam lingkungannya, ia menciptakan loop umpan balik yang muncul: Setiap tindakan memengaruhi persepsi masa depan, dan pengalaman yang dihasilkan dimasukkan ke dalam memori dan model internal melalui modul pembelajaran. Lingkaran persepsi, penalaran, dan tindakan yang berkelanjutan ini memungkinkan agen untuk meningkat dari waktu ke waktu dan menyelesaikan siklus persepsi, alasan, tindakan penuh.

Modul persepsi

Modul persepsi memungkinkan agen untuk berinteraksi dengan lingkungannya melalui beragam modalitas input seperti teks, audio, dan sensor. Masukan ini membentuk data mentah yang didasarkan pada semua penalaran dan tindakan. Input teks mungkin termasuk prompt bahasa alami, perintah terstruktur, atau dokumen. Input audio mencakup instruksi lisan atau suara lingkungan. Input sensor termasuk data fisik seperti umpan visual, sinyal gerak, atau koordinat GPS. Fungsi inti persepsi adalah untuk mengekstrak fitur dan representasi yang bermakna dari data mentah ini. Hal ini memungkinkan agen untuk membangun pemahaman yang akurat dan dapat ditindaklanjuti dari konteksnya saat ini. Prosesnya mungkin melibatkan ekstraksi fitur, pengenalan objek atau peristiwa, dan interpretasi semantik, dan membentuk langkah pertama yang kritis dalam loop persepsi, alasan, tindakan. Persepsi yang efektif memastikan bahwa penalaran hilir dan pengambilan keputusan didasarkan pada kesadaran situasional yang relevan. up-to-date

Modul kognitif

Modul kognitif berfungsi sebagai inti deliberatif dari agen perangkat lunak. Ini bertanggung jawab untuk menafsirkan persepsi, membentuk niat, dan membimbing perilaku yang bertujuan melalui perencanaan dan pengambilan keputusan yang didorong oleh tujuan. Modul ini mengubah input menjadi proses penalaran terstruktur, yang memungkinkan agen untuk beroperasi dengan sengaja daripada reaktif. Proses-proses ini dikelola melalui tiga submodul utama: tujuan, perencanaan, dan pengambilan keputusan.

Submodul tujuan

Submodul tujuan mendefinisikan maksud dan arah agen. Sasaran dapat eksplisit (misalnya, “navigasi ke lokasi” atau “kirimkan laporan”) atau implisit (misalnya, “memaksimalkan keterlibatan pengguna” atau “meminimalkan latensi”). Mereka adalah pusat siklus penalaran agen, dan memberikan keadaan target untuk perencanaan dan keputusannya.

Agen terus mengevaluasi kemajuan menuju tujuannya dan mungkin memprioritaskan kembali atau meregenerasi tujuan berdasarkan persepsi atau pembelajaran baru. Kesadaran tujuan ini membuat agen beradaptasi dalam lingkungan yang dinamis.

Submodul perencanaan

Submodul perencanaan membangun strategi untuk mencapai tujuan agen saat ini. Ini menghasilkan urutan tindakan, menguraikan tugas secara hierarkis, dan memilih dari rencana yang telah ditentukan atau dihasilkan secara dinamis.

Untuk beroperasi secara efektif di lingkungan non-deterministik atau berubah, perencanaan tidak statis. Agen modern dapat menghasilkan chain-of-thought urutan, memperkenalkan subtujuan sebagai langkah perantara, dan merevisi rencana secara real time ketika kondisi bergeser.

Submodul ini terhubung erat dengan memori dan pembelajaran, dan memungkinkan agen untuk menyempurnakan perencanaannya dari waktu ke waktu berdasarkan hasil masa lalu.

Submodul pengambilan keputusan

Submodul pengambilan keputusan mengevaluasi rencana dan tindakan yang tersedia untuk memilih langkah berikutnya yang paling tepat. Ini mengintegrasikan masukan dari persepsi, rencana saat ini, tujuan agen, dan konteks lingkungan.

Akun pengambilan keputusan untuk:

  • Trade-off antara tujuan yang saling bertentangan

  • Ambang kepercayaan (misalnya, ketidakpastian dalam persepsi)

  • Konsekuensi tindakan

  • Pengalaman agen yang dipelajari

Bergantung pada arsitekturnya, agen mungkin mengandalkan penalaran simbolis, heuristik, pembelajaran penguatan, atau model bahasa (LLMs) untuk membuat keputusan berdasarkan informasi. Proses ini memastikan perilaku agen tetap sadar konteks, selaras dengan tujuan, dan adaptif.

Modul aksi

Modul tindakan bertanggung jawab untuk mengeksekusi keputusan yang dipilih agen dan berinteraksi dengan dunia eksternal atau sistem internal untuk menghasilkan efek yang berarti. Ini mewakili fase Act dari loop persepsi, alasan, tindakan, di mana niat diubah menjadi perilaku.

Ketika modul kognitif memilih tindakan, modul tindakan mengoordinasikan eksekusi melalui submodul khusus, di mana setiap submodul selaras dengan lingkungan terintegrasi agen:

  • Aktuasi fisik: Untuk agen yang tertanam dalam sistem robot atau perangkat IoT, submodul ini menerjemahkan keputusan ke dalam gerakan fisik dunia nyata atau instruksi tingkat perangkat keras.

    Contoh: mengemudikan robot, memicu katup, menyalakan sensor.

  • Interaksi terintegrasi: Submodul ini menangani tindakan non-fisik tetapi terlihat secara eksternal seperti berinteraksi dengan sistem perangkat lunak, platform, atau. APIs

    Contoh: mengirim perintah ke layanan cloud, memperbarui database, mengirimkan laporan dengan memanggil API.

  • Pemanggilan alat: Agen sering memperluas kemampuan mereka dengan menggunakan alat khusus untuk menyelesaikan sub-tugas seperti berikut:

    • Pencarian: menanyakan sumber pengetahuan terstruktur atau tidak terstruktur

    • Ringkasan: mengompresi input teks besar menjadi ikhtisar tingkat tinggi

    • Perhitungan: melakukan perhitungan logis, numerik, atau simbolik

    Pemanggilan alat memungkinkan komposisi perilaku yang kompleks melalui keterampilan modular yang dapat dipanggil.

Modul pembelajaran

Modul pembelajaran memungkinkan agen untuk beradaptasi, menggeneralisasi, dan meningkatkan dari waktu ke waktu berdasarkan pengalaman. Ini mendukung proses penalaran dengan terus menyempurnakan model internal agen, strategi, dan kebijakan keputusan dengan menggunakan umpan balik dari persepsi dan tindakan.

Modul ini beroperasi dalam koordinasi dengan memori jangka pendek dan jangka panjang:

  • Memori jangka pendek: Menyimpan konteks sementara, seperti status dialog, informasi tugas saat ini, dan pengamatan terbaru. Ini membantu agen mempertahankan kontinuitas dalam interaksi dan tugas.

  • Memori jangka panjang: Mengkodekan pengetahuan persisten dari pengalaman masa lalu, termasuk tujuan yang ditemui sebelumnya, hasil tindakan, dan keadaan lingkungan. Memori jangka panjang memungkinkan agen untuk mengenali pola, menggunakan kembali strategi, dan menghindari kesalahan berulang.

Mode pembelajaran

Modul pembelajaran mendukung berbagai paradigma, seperti pembelajaran yang diawasi, tanpa pengawasan, dan penguatan, yang mendukung lingkungan dan peran agen yang berbeda:

  • Pembelajaran yang diawasi: Memperbarui model internal berdasarkan contoh berlabel, seringkali dari umpan balik manusia atau kumpulan data pelatihan.

    Contoh: belajar mengklasifikasikan maksud pengguna berdasarkan percakapan sebelumnya.

  • Pembelajaran tanpa pengawasan: Mengidentifikasi pola atau struktur tersembunyi dalam data tanpa label eksplisit.

    Contoh: mengelompokkan sinyal lingkungan untuk mendeteksi anomali.

  • Pembelajaran penguatan: Mengoptimalkan perilaku melalui coba-coba dengan memaksimalkan imbalan kumulatif di lingkungan interaktif.

    Contoh: mempelajari strategi mana yang mengarah pada penyelesaian tugas tercepat.

Pembelajaran terintegrasi erat dengan modul kognitif agen. Ini menyempurnakan strategi perencanaan berdasarkan hasil masa lalu, meningkatkan pengambilan keputusan melalui evaluasi keberhasilan historis, dan terus meningkatkan pemetaan antara persepsi dan tindakan. Melalui loop pembelajaran dan umpan balik tertutup ini, agen berkembang melampaui eksekusi reaktif untuk menjadi sistem peningkatan diri yang mampu beradaptasi dengan tujuan, kondisi, dan konteks baru dari waktu ke waktu.