

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Agen perangkat lunak untuk agen AI
<a name="new-generation"></a>

Agen perangkat lunak adalah entitas digital otonom yang dirancang untuk memahami lingkungan mereka, alasan tentang tujuan mereka, dan bertindak sesuai dengan itu. Tidak seperti program perangkat lunak tradisional yang mengikuti logika tetap, agen menyesuaikan perilaku mereka berdasarkan input kontekstual dan kerangka keputusan. Ini membuatnya ideal untuk lingkungan yang dinamis dan terdistribusi seperti sistem cloud-native, robotika, otomatisasi cerdas, dan sekarang, orkestrasi AI generatif.

Bagian ini memperkenalkan blok bangunan inti agen perangkat lunak dan menjelaskan bagaimana komponen ini berinteraksi dalam arsitektur tradisional berdasarkan model persepsi, alasan, tindakan. Ini membahas bagaimana AI generatif, terutama model bahasa besar (LLMs), telah mengubah cara agen perangkat lunak bernalar dan merencanakan. Ini menandai pergeseran mendasar dari sistem berbasis aturan ke kecerdasan AI agen berbasis data yang dipelajari.

**Topics**
+ [Blok bangunan inti agen perangkat lunak](core-modules.md)
+ [Arsitektur agen tradisional: persepsi, alasan, tindakan](traditional-agents.md)
+ [Agen AI generatif: mengganti logika simbolik dengan LLMs](generative-ai-agents.md)
+ [Membandingkan AI tradisional dengan agen perangkat lunak dan AI agen](comparison.md)

# Blok bangunan inti agen perangkat lunak
<a name="core-modules"></a>

Diagram berikut menyajikan modul fungsional utama yang ditemukan di sebagian besar agen cerdas. Setiap komponen berkontribusi pada kemampuan agen untuk beroperasi secara mandiri di lingkungan yang kompleks.

![\[Modul fungsional utama dan submodul dalam agen cerdas.\]](http://docs.aws.amazon.com/id_id/prescriptive-guidance/latest/agentic-ai-foundations/images/functional-modules.png)


Dalam konteks loop persepsi, alasan, tindakan, kemampuan penalaran agen didistribusikan di modul kognitif dan pembelajarannya. Melalui integrasi memori dan pembelajaran, agen mengembangkan penalaran adaptif yang didasarkan pada pengalaman masa lalu. Ketika agen bertindak dalam lingkungannya, ia menciptakan loop umpan balik yang muncul: Setiap tindakan memengaruhi persepsi masa depan, dan pengalaman yang dihasilkan dimasukkan ke dalam memori dan model internal melalui modul pembelajaran. Lingkaran persepsi, penalaran, dan tindakan yang berkelanjutan ini memungkinkan agen untuk meningkat dari waktu ke waktu dan menyelesaikan siklus persepsi, alasan, tindakan penuh.

## Modul persepsi
<a name="perception"></a>

Modul persepsi memungkinkan agen untuk berinteraksi dengan lingkungannya melalui beragam modalitas input seperti teks, audio, dan sensor. Masukan ini membentuk data mentah yang didasarkan pada semua penalaran dan tindakan. Input teks mungkin termasuk prompt bahasa alami, perintah terstruktur, atau dokumen. Input audio mencakup instruksi lisan atau suara lingkungan. Input sensor termasuk data fisik seperti umpan visual, sinyal gerak, atau koordinat GPS. Fungsi inti persepsi adalah untuk mengekstrak fitur dan representasi yang bermakna dari data mentah ini. Hal ini memungkinkan agen untuk membangun pemahaman yang akurat dan dapat ditindaklanjuti dari konteksnya saat ini. Prosesnya mungkin melibatkan ekstraksi fitur, pengenalan objek atau peristiwa, dan interpretasi semantik, dan membentuk langkah pertama yang kritis dalam loop persepsi, alasan, tindakan. Persepsi yang efektif memastikan bahwa penalaran hilir dan pengambilan keputusan didasarkan pada kesadaran situasional yang relevan. up-to-date

## Modul kognitif
<a name="cognitive"></a>

Modul kognitif berfungsi sebagai inti deliberatif dari agen perangkat lunak. Ini bertanggung jawab untuk menafsirkan persepsi, membentuk niat, dan membimbing perilaku yang bertujuan melalui perencanaan dan pengambilan keputusan yang didorong oleh tujuan. Modul ini mengubah input menjadi proses penalaran terstruktur, yang memungkinkan agen untuk beroperasi dengan sengaja daripada reaktif. Proses-proses ini dikelola melalui tiga submodul utama: tujuan, perencanaan, dan pengambilan keputusan.

### Submodul tujuan
<a name="cognitive-goals"></a>

Submodul tujuan mendefinisikan maksud dan arah agen. Sasaran dapat eksplisit (misalnya, “navigasi ke lokasi” atau “kirimkan laporan”) atau implisit (misalnya, “memaksimalkan keterlibatan pengguna” atau “meminimalkan latensi”). Mereka adalah pusat siklus penalaran agen, dan memberikan keadaan target untuk perencanaan dan keputusannya.

Agen terus mengevaluasi kemajuan menuju tujuannya dan mungkin memprioritaskan kembali atau meregenerasi tujuan berdasarkan persepsi atau pembelajaran baru. Kesadaran tujuan ini membuat agen beradaptasi dalam lingkungan yang dinamis.

### Submodul perencanaan
<a name="cognitive-planning"></a>

Submodul perencanaan membangun strategi untuk mencapai tujuan agen saat ini. Ini menghasilkan urutan tindakan, menguraikan tugas secara hierarkis, dan memilih dari rencana yang telah ditentukan atau dihasilkan secara dinamis.

Untuk beroperasi secara efektif di lingkungan non-deterministik atau berubah, perencanaan tidak statis. Agen modern dapat menghasilkan chain-of-thought urutan, memperkenalkan subtujuan sebagai langkah perantara, dan merevisi rencana secara real time ketika kondisi bergeser.

Submodul ini terhubung erat dengan memori dan pembelajaran, dan memungkinkan agen untuk menyempurnakan perencanaannya dari waktu ke waktu berdasarkan hasil masa lalu.

### Submodul pengambilan keputusan
<a name="cognitive-decision-making"></a>

Submodul pengambilan keputusan mengevaluasi rencana dan tindakan yang tersedia untuk memilih langkah berikutnya yang paling tepat. Ini mengintegrasikan masukan dari persepsi, rencana saat ini, tujuan agen, dan konteks lingkungan.

Akun pengambilan keputusan untuk:
+ Trade-off antara tujuan yang saling bertentangan
+ Ambang kepercayaan (misalnya, ketidakpastian dalam persepsi)
+ Konsekuensi tindakan
+ Pengalaman agen yang dipelajari

Bergantung pada arsitekturnya, agen mungkin mengandalkan penalaran simbolis, heuristik, pembelajaran penguatan, atau model bahasa (LLMs) untuk membuat keputusan berdasarkan informasi. Proses ini membuat perilaku agen sadar konteks, selaras dengan tujuan, dan adaptif.

## Modul aksi
<a name="action"></a>

Modul tindakan bertanggung jawab untuk mengeksekusi keputusan yang dipilih agen dan berinteraksi dengan dunia eksternal atau sistem internal untuk menghasilkan efek yang berarti. Ini mewakili fase Act dari loop persepsi, alasan, tindakan, di mana niat diubah menjadi perilaku.

Ketika modul kognitif memilih tindakan, modul tindakan mengoordinasikan eksekusi melalui submodul khusus, di mana setiap submodul selaras dengan lingkungan terintegrasi agen:
+ Aktuasi fisik: Untuk agen yang tertanam dalam sistem robot atau perangkat IoT, submodul ini menerjemahkan keputusan ke dalam gerakan fisik dunia nyata atau instruksi tingkat perangkat keras.

  Contoh: mengemudikan robot, memicu katup, menyalakan sensor.
+ Interaksi terintegrasi: Submodul ini menangani tindakan non-fisik tetapi terlihat secara eksternal seperti berinteraksi dengan sistem perangkat lunak, platform, atau. APIs

  Contoh: mengirim perintah ke layanan cloud, memperbarui database, mengirimkan laporan dengan memanggil API.
+ Pemanggilan alat: Agen sering memperluas kemampuan mereka dengan menggunakan alat khusus untuk menyelesaikan sub-tugas seperti berikut:
  + Pencarian: menanyakan sumber pengetahuan terstruktur atau tidak terstruktur
  + Ringkasan: mengompresi input teks besar menjadi ikhtisar tingkat tinggi
  + Perhitungan: melakukan perhitungan logis, numerik, atau simbolik

  Pemanggilan alat memungkinkan komposisi perilaku yang kompleks melalui keterampilan modular yang dapat dipanggil.

## Modul pembelajaran
<a name="learning"></a>

Modul pembelajaran memungkinkan agen untuk beradaptasi, menggeneralisasi, dan meningkatkan dari waktu ke waktu berdasarkan pengalaman. Ini mendukung proses penalaran dengan terus menyempurnakan model internal agen, strategi, dan kebijakan keputusan dengan menggunakan umpan balik dari persepsi dan tindakan.

Modul ini beroperasi dalam koordinasi dengan memori jangka pendek dan jangka panjang:
+ Memori jangka pendek: Menyimpan konteks sementara, seperti status dialog, informasi tugas saat ini, dan pengamatan terbaru. Ini membantu agen mempertahankan kontinuitas dalam interaksi dan tugas.
+ Memori jangka panjang: Mengkodekan pengetahuan persisten dari pengalaman masa lalu, termasuk tujuan yang ditemui sebelumnya, hasil tindakan, dan keadaan lingkungan. Memori jangka panjang memungkinkan agen untuk mengenali pola, menggunakan kembali strategi, dan menghindari kesalahan berulang.

### Mode pembelajaran
<a name="learning-modes"></a>

Modul pembelajaran mendukung berbagai paradigma, seperti pembelajaran yang diawasi, tanpa pengawasan, dan penguatan, yang mendukung lingkungan dan peran agen yang berbeda:
+ Pembelajaran yang diawasi: Memperbarui model internal berdasarkan contoh berlabel, seringkali dari umpan balik manusia atau kumpulan data pelatihan. 

  Contoh: belajar mengklasifikasikan maksud pengguna berdasarkan percakapan sebelumnya.
+ Pembelajaran tanpa pengawasan: Mengidentifikasi pola atau struktur tersembunyi dalam data tanpa label eksplisit. 

  Contoh: mengelompokkan sinyal lingkungan untuk mendeteksi anomali.
+ Pembelajaran penguatan: Mengoptimalkan perilaku melalui coba-coba dengan memaksimalkan imbalan kumulatif di lingkungan interaktif. 

  Contoh: mempelajari strategi mana yang mengarah pada penyelesaian tugas tercepat.

Pembelajaran terintegrasi erat dengan modul kognitif agen. Ini menyempurnakan strategi perencanaan berdasarkan hasil masa lalu, meningkatkan pengambilan keputusan melalui evaluasi keberhasilan historis, dan terus meningkatkan pemetaan antara persepsi dan tindakan. Melalui loop pembelajaran dan umpan balik tertutup ini, agen berkembang melampaui eksekusi reaktif untuk menjadi sistem peningkatan diri yang mampu beradaptasi dengan tujuan, kondisi, dan konteks baru dari waktu ke waktu.

# Arsitektur agen tradisional: persepsi, alasan, tindakan
<a name="traditional-agents"></a>

Diagram berikut menggambarkan bagaimana blok bangunan yang dibahas di [bagian sebelumnya](core-modules.md) beroperasi di bawah siklus persepsi, alasan, tindakan.

![\[Bagaimana blok bangunan inti berlaku untuk arsitektur agen tradisional.\]](http://docs.aws.amazon.com/id_id/prescriptive-guidance/latest/agentic-ai-foundations/images/traditional-agent-modules.png)


## Persepsi modul
<a name="perceive"></a>

Modul persepsi bertindak sebagai antarmuka sensorik agen dengan dunia luar. Ini mengubah input lingkungan mentah menjadi representasi terstruktur yang menginformasikan penalaran. Ini termasuk menangani data multimodal seperti teks, audio, atau sinyal sensor.
+ Input teks dapat berasal dari perintah pengguna, dokumen, atau dialog.
+ Input audio termasuk instruksi lisan atau suara lingkungan.
+ Input sensor menangkap sinyal dunia nyata seperti gerakan, umpan visual, atau GPS.

Ketika input mentah telah dicerna, proses persepsi melakukan ekstraksi fitur, diikuti oleh pengenalan objek atau peristiwa dan interpretasi semantik untuk menciptakan model yang bermakna dari situasi saat ini. Output ini memberikan konteks terstruktur untuk pengambilan keputusan hilir dan menambatkan alasan agen dalam pengamatan dunia nyata.

## Modul alasan
<a name="reason"></a>

Modul alasan adalah inti kognitif agen. Ini mengevaluasi konteks, merumuskan niat, dan menentukan tindakan yang tepat. Modul ini mengatur perilaku yang didorong oleh tujuan dengan menggunakan pengetahuan dan penalaran yang dipelajari.

Modul alasan terdiri dari submodul yang terintegrasi erat:
+ Memori: Mempertahankan status dialog, konteks tugas, dan sejarah episodik dalam format jangka pendek dan jangka panjang.
+ Basis pengetahuan: Menyediakan akses ke aturan simbolis, ontologi, atau model yang dipelajari (seperti penyematan, fakta, dan kebijakan).
+ Tujuan dan rencana: Mendefinisikan hasil yang diinginkan dan membangun strategi tindakan untuk mencapainya. Tujuan dapat diperbarui secara dinamis dan rencana dapat dimodifikasi secara adaptif berdasarkan umpan balik.
+ Pengambilan keputusan: Bertindak sebagai mesin arbitrase pusat dengan menimbang opsi, mengevaluasi trade-off, dan memilih tindakan selanjutnya. Faktor submodul ini dalam ambang kepercayaan, penyelarasan tujuan, dan kendala kontekstual.

Bersama-sama, komponen-komponen ini memungkinkan agen untuk bernalar tentang lingkungannya, memperbarui keyakinan, memilih jalur, dan berperilaku dengan cara yang koheren dan adaptif. Modul alasan menutup kesenjangan antara persepsi dan perilaku.

## Modul Act
<a name="act"></a>

Modul tindakan mengeksekusi keputusan yang dipilih agen dengan berinteraksi dengan lingkungan digital atau fisik untuk melaksanakan tugas. Di sinilah niat menjadi tindakan.

Modul ini mencakup tiga saluran fungsional:
+ Aktuator: Untuk agen yang memiliki kehadiran fisik (seperti robot dan perangkat IoT), mengontrol interaksi tingkat perangkat keras seperti gerakan, manipulasi, atau pensinyalan.
+ Eksekusi: Menangani tindakan berbasis perangkat lunak, termasuk memanggil, mengirim perintah APIs, dan memperbarui sistem.
+ Alat: Memungkinkan kemampuan fungsional seperti pencarian, ringkasan, eksekusi kode, perhitungan, dan penanganan dokumen. Alat-alat ini sering dinamis dan sadar konteks, yang memperluas utilitas agen.

Output dari modul tindakan memberi umpan balik ke lingkungan dan menutup loop. Hasil ini dirasakan oleh agen lagi. Mereka memperbarui keadaan internal agen dan menginformasikan keputusan masa depan, sehingga menyelesaikan siklus persepsi, alasan, tindakan.

# Agen AI generatif: mengganti logika simbolik dengan LLMs
<a name="generative-ai-agents"></a>

Diagram berikut menggambarkan bagaimana model bahasa besar (LLMs) sekarang berfungsi sebagai inti kognitif yang fleksibel dan cerdas untuk agen perangkat lunak. Berbeda dengan sistem logika simbolis tradisional, yang mengandalkan perpustakaan rencana statis dan aturan kode tangan, LLMs memungkinkan penalaran adaptif, perencanaan kontekstual, dan penggunaan alat dinamis, yang mengubah cara agen memandang, bernalar, dan bertindak.

![\[Diagram showing LLM-based agent architecture with perceive, reason, and act components.\]](http://docs.aws.amazon.com/id_id/prescriptive-guidance/latest/agentic-ai-foundations/images/gen-ai-modules.png)


## Peningkatan utama
<a name="enhancements"></a>

Arsitektur ini meningkatkan arsitektur agen tradisional sebagai berikut:
+ LLMs sebagai mesin kognitif: Tujuan, rencana, dan kueri diteruskan ke dalam model sebagai konteks yang**** cepat. LLM menghasilkan jalur penalaran (seperti rantai pemikiran), menguraikan tugas menjadi sub-tujuan, dan memutuskan tindakan selanjutnya.
+ Penggunaan alat melalui prompt: LLMs dapat diarahkan melalui agen penggunaan alat atau penalaran dan acting (ReAct) meminta untuk memanggil APIs dan mencari, menanyakan, menghitung, dan menafsirkan output.
+ Perencanaan sadar konteks: Agen menghasilkan atau merevisi rencana secara dinamis berdasarkan tujuan agen saat ini, lingkungan input, dan umpan balik, tanpa memerlukan pustaka rencana hardcode.
+ Konteks cepat sebagai memori: Alih-alih menggunakan basis pengetahuan simbolis, agen menyandikan memori, rencana, dan tujuan sebagai token prompt yang diteruskan ke model.
+ Belajar melalui beberapa kesempatan, pembelajaran dalam konteks: LLMs mengadaptasi perilaku melalui rekayasa yang cepat, yang mengurangi kebutuhan akan pelatihan ulang eksplisit atau perpustakaan rencana yang kaku.

## Mencapai memori jangka panjang pada agen berbasis LLM
<a name="long-term-memory"></a>

Tidak seperti agen tradisional, yang menyimpan memori jangka panjang dalam basis pengetahuan terstruktur, agen AI generatif harus bekerja dalam batasan jendela konteks. LLMs Untuk memperluas memori dan mendukung kecerdasan persisten, agen AI generatif menggunakan beberapa teknik pelengkap: penyimpanan agen, Retrieval-Augmented Generation (RAG), pembelajaran dalam konteks dan rantai cepat, dan pra-pelatihan.

**Toko agen: memori jangka panjang eksternal**

Status agen, riwayat pengguna, keputusan, dan hasil disimpan dalam penyimpanan memori agen jangka panjang (seperti database vektor, penyimpanan objek, atau penyimpanan dokumen). Memori yang relevan diambil sesuai permintaan dan disuntikkan ke dalam konteks prompt LLM saat runtime. Ini menciptakan loop memori persisten, di mana agen mempertahankan kontinuitas di seluruh sesi, tugas, atau interaksi.

**KAIN**

RAG meningkatkan kinerja LLM dengan menggabungkan pengetahuan yang diambil dengan kemampuan generatif. Ketika tujuan atau kueri dikeluarkan, agen mencari indeks pengambilan (misalnya, melalui pencarian semantik dokumen, percakapan sebelumnya, atau pengetahuan terstruktur). Hasil yang diambil ditambahkan ke prompt LLM, yang mendasari generasi dalam fakta eksternal atau konteks yang dipersonalisasi. Metode ini memperluas memori efektif agen dan meningkatkan keandalan dan kebenaran faktual.

**Pembelajaran dalam konteks dan rantai cepat**

Agen mempertahankan memori jangka pendek dengan menggunakan konteks token dalam sesi dan rantai prompt terstruktur. Elemen kontekstual, seperti rencana saat ini, hasil tindakan sebelumnya, dan status agen, diteruskan di antara panggilan untuk memandu perilaku.

**Pretraining lanjutan dan fine-tuning**

Untuk agen khusus domain, LLMs dapat dilanjutkan pra-pelatihan pada koleksi kustom seperti log, data perusahaan, atau dokumentasi produk. Atau, penyetelan instruksi atau pembelajaran penguatan dari umpan balik manusia (RLHF) dapat menanamkan perilaku seperti agen langsung ke dalam model. Ini menggeser pola penalaran dari logika waktu cepat ke representasi internal model, mengurangi panjang yang cepat, dan meningkatkan efisiensi.

## Manfaat gabungan dalam AI agen
<a name="benefits"></a>

Teknik-teknik ini, ketika digunakan bersama, memungkinkan agen AI generatif untuk:
+ Pertahankan kesadaran kontekstual dari waktu ke waktu.
+ Sesuaikan perilaku berdasarkan riwayat atau preferensi pengguna.
+ Membuat keputusan dengan menggunakan up-to-date, pengetahuan faktual, atau pribadi.
+ Skala ke kasus penggunaan perusahaan dengan perilaku yang persisten, patuh, dan dapat dijelaskan.

Dengan menambah LLMs dengan memori eksternal, lapisan pengambilan, dan pelatihan lanjutan, agen dapat mencapai tingkat kontinuitas kognitif dan tujuan yang tidak dapat dicapai sebelumnya melalui sistem simbolik saja.

# Membandingkan AI tradisional dengan agen perangkat lunak dan AI agen
<a name="comparison"></a>

Tabel berikut memberikan perbandingan rinci AI tradisional, agen perangkat lunak, dan AI agen.


| Karakteristik | AI tradisional | Agen perangkat lunak | AI Agen | 
| --- | --- | --- | --- | 
|  Contoh  |  Filter spam, pengklasifikasi gambar, mesin rekomendasi  |  Chatbots, penjadwal tugas, agen pemantauan  |  Asisten AI, agen pengembang otonom, orkestrasi LLM multi-agen  | 
|  Model eksekusi  |  Batch atau sinkron  |  Digerakkan oleh acara atau terjadwal  |  Asinkron, didorong oleh peristiwa, dan didorong oleh tujuan  | 
|  Otonomi  |  Terbatas; sering membutuhkan orkestrasi manusia atau eksternal  |  Medium; beroperasi secara independen dalam batas yang telah ditentukan  |  Tinggi; bertindak secara independen dengan strategi adaptif  | 
|  Reaktivitas  |  Reaktif terhadap input data  |  Reaktif terhadap lingkungan dan peristiwa  |  Reaktif dan proaktif; mengantisipasi dan memulai tindakan  | 
|  Proaktif  |  Langka  |  Hadir dalam beberapa sistem  |  Atribut inti; mendorong perilaku yang diarahkan pada tujuan  | 
|  Komunikasi  |  Minimal; biasanya mandiri atau terikat API  |  Pesan antar-agen atau agen-manusia  |  Multi-agen dan human-in-the-loop interaksi yang kaya  | 
|  Pengambilan keputusan  |  Inferensi model saja (klasifikasi, prediksi, dan sebagainya)  |  Penalaran simbolis, atau keputusan berbasis aturan atau naskah  |  Penalaran kontekstual, berbasis tujuan, dinamis (sering kali ditingkatkan LLM)  | 
|  Niat yang didelegasikan  |  Tidak; melakukan tugas yang ditentukan langsung oleh pengguna  |  Sebagian; bertindak atas nama pengguna atau sistem yang memiliki ruang lingkup terbatas  |  Ya; bertindak dengan tujuan yang didelegasikan, seringkali di seluruh layanan, pengguna, atau sistem  | 
|  Pembelajaran dan adaptasi  |  Seringkali model-sentris (misalnya., pelatihan ML)  |  Terkadang adaptif  |  Pembelajaran, memori, atau penalaran tertanam (misalnya, umpan balik, koreksi diri)  | 
|  Agensi  |  Tidak ada; alat untuk manusia  |  Implisit atau dasar  |  Eksplisit; beroperasi dengan tujuan, sasaran, dan pengarahan diri  | 
|  Kesadaran konteks  |  Rendah; tanpa kewarganegaraan atau berbasis snapshot  |  Sedang; beberapa pelacakan negara  |  Tinggi; menggunakan memori, konteks situasional, dan model lingkungan  | 
|  Peran infrastruktur  |  Tertanam dalam aplikasi atau pipeline analitik  |  Middleware atau komponen lapisan layanan  |  Jaring agen yang dapat dikomposisikan terintegrasi dengan sistem cloud, tanpa server, atau edge  | 

Ringkasnya:
+ AI tradisional berpusat pada alat dan sempit secara fungsional. Ini berfokus pada prediksi atau klasifikasi.
+ Agen perangkat lunak tradisional memperkenalkan otonomi dan komunikasi dasar, tetapi mereka sering terikat aturan atau statis.
+ Agentic AI menyatukan otonomi, asinkron, dan agensi. Ini memungkinkan entitas cerdas yang didorong oleh tujuan yang dapat bernalar, bertindak, dan beradaptasi dalam sistem yang kompleks. Ini membuat AI agen ideal untuk masa depan cloud-native yang digerakkan oleh AI.