Elementi costitutivi fondamentali degli agenti software - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Elementi costitutivi fondamentali degli agenti software

Il diagramma seguente presenta i moduli funzionali chiave presenti nella maggior parte degli agenti intelligenti. Ogni componente contribuisce alla capacità dell'agente di operare autonomamente in ambienti complessi.

Moduli e sottomoduli funzionali chiave negli agenti intelligenti.

Nel contesto del ciclo percepire, ragionare, agire, la capacità di ragionamento di un agente è distribuita tra i suoi moduli cognitivi e di apprendimento. Attraverso l'integrazione della memoria e dell'apprendimento, l'agente sviluppa un ragionamento adattivo basato sull'esperienza passata. Quando l'agente agisce all'interno del suo ambiente, crea un ciclo di feedback emergente: ogni azione influenza le percezioni future e l'esperienza risultante viene incorporata nella memoria e nei modelli interni attraverso il modulo di apprendimento. Questo ciclo continuo di percezione, ragionamento e azione consente all'agente di migliorare nel tempo e completa l'intero ciclo di percezione, ragione e azione.

Modulo di percezione

Il modulo di percezione consente all'agente di interfacciarsi con il proprio ambiente attraverso diverse modalità di input come testo, audio e sensori. Questi input costituiscono i dati grezzi su cui si basano tutti i ragionamenti e le azioni. Gli input di testo possono includere istruzioni in linguaggio naturale, comandi strutturati o documenti. Gli ingressi audio comprendono istruzioni vocali o suoni ambientali. Gli ingressi dei sensori includono dati fisici come feed visivi, segnali di movimento o coordinate GPS. La funzione principale della percezione è estrarre caratteristiche e rappresentazioni significative da questi dati grezzi. Ciò consente all'agente di costruire una comprensione accurata e pratica del contesto attuale. Il processo potrebbe comportare l'estrazione di caratteristiche, il riconoscimento di oggetti o eventi e l'interpretazione semantica e costituisce la prima fase fondamentale del ciclo percepire, ragionare, agire. Una percezione efficace garantisce che il ragionamento e il processo decisionale a valle siano fondati su una consapevolezza situazionale pertinente. up-to-date

Modulo cognitivo

Il modulo cognitivo funge da nucleo deliberativo dell'agente software. È responsabile dell'interpretazione delle percezioni, della formazione degli intenti e della guida di comportamenti intenzionali attraverso una pianificazione e un processo decisionale orientati agli obiettivi. Questo modulo trasforma gli input in processi di ragionamento strutturati, che consentono all'agente di operare intenzionalmente anziché in modo reattivo. Questi processi sono gestiti attraverso tre sottomoduli chiave: obiettivi, pianificazione e processo decisionale.

Sottomodulo degli obiettivi

Il sottomodulo degli obiettivi definisce l'intento e la direzione dell'agente. Gli obiettivi possono essere espliciti (ad esempio, «raggiungere una località» o «inviare un rapporto») o impliciti (ad esempio, «massimizzare il coinvolgimento degli utenti» o «ridurre al minimo la latenza»). Sono fondamentali per il ciclo di ragionamento dell'agente e forniscono uno stato obiettivo per la sua pianificazione e le sue decisioni.

L'agente valuta continuamente i progressi verso i propri obiettivi e potrebbe ridefinire le priorità o rigenerare gli obiettivi sulla base di nuove percezioni o apprendimenti. Questa consapevolezza degli obiettivi mantiene l'agente adattabile in ambienti dinamici.

Sottomodulo di pianificazione

Il sottomodulo di pianificazione costruisce strategie per raggiungere gli obiettivi attuali dell'agente. Genera sequenze di azioni, scompone le attività gerarchicamente e seleziona tra piani predefiniti o generati dinamicamente.

Per operare efficacemente in ambienti non deterministici o mutevoli, la pianificazione non è statica. Gli agenti moderni possono generare chain-of-thought sequenze, introdurre obiettivi secondari come fasi intermedie e rivedere i piani in tempo reale quando le condizioni cambiano.

Questo sottomodulo si collega strettamente alla memoria e all'apprendimento e consente all'agente di affinare la propria pianificazione nel tempo sulla base dei risultati passati.

Sottomodulo decisionale

Il sottomodulo decisionale valuta i piani e le azioni disponibili per selezionare la fase successiva più appropriata. Integra gli input provenienti dalla percezione, dal piano attuale, dagli obiettivi dell'agente e dal contesto ambientale.

Conti decisionali per:

  • Compromessi tra obiettivi contrastanti

  • Soglie di confidenza (ad esempio, incertezza nella percezione)

  • Conseguenze delle azioni

  • L'esperienza acquisita dall'agente

A seconda dell'architettura, gli agenti potrebbero fare affidamento sul ragionamento simbolico, sull'euristica, sull'apprendimento per rinforzo o sui modelli linguistici (LLMs) per prendere decisioni informate. Questo processo garantisce che il comportamento dell'agente rimanga consapevole del contesto, allineato agli obiettivi e adattivo.

Modulo d'azione

Il modulo d'azione è responsabile dell'esecuzione delle decisioni selezionate dall'agente e dell'interfaccia con il mondo esterno o i sistemi interni per produrre effetti significativi. Rappresenta la fase dell'atto del ciclo percepire, ragionare, agire, in cui l'intento si trasforma in comportamento.

Quando il modulo cognitivo seleziona un'azione, il modulo d'azione coordina l'esecuzione tramite sottomoduli specializzati, in cui ogni sottomodulo si allinea con l'ambiente integrato dell'agente:

  • Attuazione fisica: per gli agenti integrati in sistemi robotici o dispositivi IoT, questo sottomodulo traduce le decisioni in movimenti fisici reali o istruzioni a livello di hardware.

    Esempi: pilotare un robot, attivare una valvola, accendere un sensore.

  • Interazione integrata: questo sottomodulo gestisce azioni non fisiche ma visibili esternamente, come l'interazione con sistemi software, piattaforme o. APIs

    Esempi: invio di un comando a un servizio cloud, aggiornamento di un database, invio di un rapporto chiamando un'API.

  • Richiamo di strumenti: gli agenti spesso estendono le proprie funzionalità utilizzando strumenti specializzati per eseguire attività secondarie come le seguenti:

    • Ricerca: interrogazione di fonti di conoscenza strutturate o non strutturate

    • Riepilogo: compressione di input di testo di grandi dimensioni in panoramiche di alto livello

    • Calcolo: esecuzione di calcoli logici, numerici o simbolici

    L'invocazione di strumenti consente una composizione comportamentale complessa attraverso competenze modulari e richiamabili.

Modulo di apprendimento

Il modulo di apprendimento consente agli agenti di adattarsi, generalizzare e migliorare nel tempo in base all'esperienza. Supporta il processo di ragionamento perfezionando continuamente i modelli interni, le strategie e le politiche decisionali dell'agente utilizzando il feedback derivante dalla percezione e dall'azione.

Questo modulo opera in coordinamento con la memoria a breve e lungo termine:

  • Memoria a breve termine: memorizza il contesto transitorio, come lo stato del dialogo, le informazioni sulle attività correnti e le osservazioni recenti. Aiuta l'agente a mantenere la continuità all'interno delle interazioni e delle attività.

  • Memoria a lungo termine: codifica la conoscenza persistente delle esperienze passate, inclusi gli obiettivi raggiunti in precedenza, i risultati delle azioni e gli stati ambientali. La memoria a lungo termine consente all'agente di riconoscere schemi, riutilizzare le strategie ed evitare di ripetere gli errori.

Modalità di apprendimento

Il modulo di apprendimento supporta una serie di paradigmi, come l'apprendimento supervisionato, non supervisionato e per rinforzo, che supportano diversi ambienti e ruoli degli agenti:

  • Apprendimento supervisionato: aggiorna i modelli interni sulla base di esempi etichettati, spesso tratti da feedback umani o set di dati di formazione.

    Esempio: imparare a classificare le intenzioni degli utenti in base alle conversazioni precedenti.

  • Apprendimento senza supervisione: identifica modelli o strutture nascoste nei dati senza etichette esplicite.

    Esempio: raggruppamento di segnali ambientali per rilevare anomalie.

  • Apprendimento per rinforzo: ottimizza il comportamento attraverso tentativi ed errori massimizzando la ricompensa cumulativa in ambienti interattivi.

    Esempio: imparare quale strategia porta al completamento più rapido delle attività.

L'apprendimento si integra perfettamente con il modulo cognitivo dell'agente. Perfeziona le strategie di pianificazione basate sui risultati passati, migliora il processo decisionale attraverso la valutazione del successo storico e migliora continuamente la mappatura tra percezione e azione. Attraverso questo ciclo chiuso di apprendimento e feedback, gli agenti si evolvono oltre l'esecuzione reattiva per diventare sistemi che si autovalutano e sono in grado di adattarsi a nuovi obiettivi, condizioni e contesti nel tempo.