Agenti basati su strumenti per server - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Agenti basati su strumenti per server

Gli agenti per server basati su strumenti migliorano gli agenti che richiamano le funzioni delegando l'esecuzione degli strumenti a un server esterno dotato di un ambiente di runtime dedicato per strumenti, script e agenti compositi. A differenza delle chiamate di funzioni in linea che l'agent loop seleziona e richiama, gli agenti basati su server esternalizzano la logica e la pipeline di esecuzione ad altri agenti o sistemi. Ciò fornisce funzionalità avanzate come il concatenamento di più strumenti, l'esecuzione isolata e il ragionamento specializzato. I tool server sono ideali per azioni complesse, basate sullo stato o che richiedono molte risorse, in cui gli strumenti stessi possono comportare modelli di intelligenza artificiale, regole aziendali o ambienti separati.

Architecture

Di seguito è riportato uno schema per agenti basati su strumenti per server:

Agenti basati su strumenti per server.

Description

  1. Riceve una richiesta

    • Un utente o un sistema invia una richiesta alla shell dell'agente.

    • L'agente interpreta la query e si prepara a inviarla a un server di strumenti.

  2. Esegue i processi del tool server

    • L'agente invia l'operazione, insieme ai parametri strutturati, a un server di strumenti.

    • Il tool server può quindi:

      • Esegui script o logica in sistemi di elaborazione dedicati (ad esempio AWS Lambda, container o Amazon) SageMaker

      • Utilizza il proprio subagente con il ragionamento LLM per selezionare ed eseguire gli strumenti

      • Gestisci dipendenze, nuovi tentativi o flussi di esecuzione in più fasi

      • Invia i risultati all'agente principale quando l'attività è completa

  3. Utilizza il ragionamento LLM con l'output dello strumento

    • L'agente richiama un LLM, passando la query originale e il risultato del toolserver come parte del prompt.

    • L'LLM sintetizza una risposta che incorpora le informazioni appena acquisite.

  4. Restituisce una risposta

    • L'agente restituisce una risposta in linguaggio naturale o strutturata all'utente o al sistema chiamante.

    • (Facoltativo) I risultati possono essere archiviati in memoria o nei registri di controllo.

Funzionalità

  • Gli strumenti vengono richiamati al di fuori del ciclo di esecuzione dell'agente principale

  • L'esecuzione degli strumenti può coinvolgere chiamate LLM, catene logiche o subagenti

  • L'agente funge da controller o dispatcher, non solo da strumento wrapper

  • Consente la componibilità, la scalabilità e l'isolamento della logica

Casi di utilizzo comune

  • Orchestrazione di catene di modelli (ad esempio, combinando LLM, visione e codice)

  • Pipeline di automazione basate sull'intelligenza artificiale

  • DevOps agenti assistenti con script runner

  • Agenti complessi di calcolo, simulazione o ottimizzazione finanziaria

  • Strumenti multimodali (ad esempio, combinando audio, documentazione e azione)

Guida all'implementazione

È possibile creare questo modello utilizzando quanto segue: Servizi AWS

  • Amazon Bedrock (host dell'agente e inferenza LLM)

  • AWS Lambda, Amazon ECS o Amazon SageMaker endpoint come runtime del server degli strumenti AWS Fargate

  • Amazon API Gateway o AWS App Runner per esporre il server degli strumenti APIs

  • Amazon EventBridge per la messaggistica disaccoppiata agent-to-tool

  • AWS Step Functions o AWS AppFabric per comporre una logica multiagente sul server degli strumenti

Riepilogo

Gli agenti basati su strumenti che utilizzano server sono altamente modulari e scalabili. Dissociano la logica decisionale dall'esecuzione, il che consente all'agente principale di rimanere leggero mentre trasferisce le azioni complesse o sensibili su altri sistemi. Questo è importante per l'intelligenza artificiale agentica di livello aziendale, specialmente in ambienti che richiedono governance, osservabilità, isolamento, composizione dinamica o qualsiasi combinazione di questi elementi.