Agenti basati su strumenti per la chiamata di funzioni - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Agenti basati su strumenti per la chiamata di funzioni

Gli agenti basati su strumenti estendono le capacità degli agenti di ragionamento richiamando funzioni esterne o per completare attività che vanno oltre il ragionamento basato APIs esclusivamente sul linguaggio. Questo modello utilizza un LLM per decidere quale strumento utilizzare, quindi genera argomenti di chiamata e incorpora l'output di uno strumento nel relativo ciclo di ragionamento.

Questo modello consente agli agenti di agire anziché limitarsi a fornire risposte. L'interfaccia dello strumento rappresenta qualsiasi funzionalità richiamabile, dai calcoli aritmetici e dalle ricerche nei database ai servizi esterni e cloud. APIs

Architecture

Nel diagramma seguente è illustrato un agente basato su strumenti per la chiamata di funzioni:

Agente basato su strumenti per la chiamata di funzioni.

Description

  1. Riceve una richiesta

    • L'agente riceve una richiesta o un'attività in linguaggio naturale dall'utente o dal sistema chiamante.

  2. Cerca strumenti

    • L'agente utilizza metadati interni o un registro degli strumenti per cercare gli strumenti, gli schemi e le funzionalità pertinenti disponibili.

  3. Seleziona e richiama gli strumenti

    • L'LLM riceve i metadati della query e dello strumento (ad esempio, nomi delle funzioni, tipi di input e descrizioni) nel relativo prompt.

    • Sceglie lo strumento più pertinente, costruisce argomenti di input e restituisce una chiamata di funzione strutturata.

  4. Esegue lo strumento scelto

    • La shell dell'agente o il tool runner esegue la funzione selezionata e restituisce il risultato (ad esempio, un output API, un valore del database o un calcolo).

  5. Restituisce una risposta

    • L'LLM trasmette i risultati all'agente, direttamente o come parte di un prompt aggiornato. Quindi restituisce un risultato in linguaggio naturale.

Funzionalità

  • Selezione dinamica degli utensili in base al contesto dell'attività

  • Richiesta basata su schemi (OpenAPI, schema JSON, interfaccia funzionale) AWS

  • Interpretazione dei risultati e concatenamento degli output nel ragionamento

  • Operazioni senza stato o con riconoscimento della sessione

Casi di utilizzo comune

  • Assistenti virtuali con accesso esterno ai dati

  • Calcolatori e stimatori finanziari

  • Knowledge worker basati su API

  • LLMs che richiamano AWS Lambda, SageMaker endpoint Amazon e servizi SaaS

Guida all'implementazione

Usa quanto segue per creare agenti basati su strumenti per chiamare le funzioni:

  • Amazon Bedrock con supporto per le chiamate di funzioni (Anthropic Claude)

  • AWS Lambda come backend per l'esecuzione degli strumenti

  • Amazon API Gateway o AWS Step Functions per l'orchestrazione degli strumenti

  • Amazon DynamoDB o Amazon Relational Database Service (Amazon RDS) per i metadati degli strumenti sensibili al contesto

  • Amazon EventBridge Pipeline o AWS Step Functions che mappano gli stati per indirizzare gli output

Riepilogo

Gli agenti di chiamata di funzioni basati su strumenti rappresentano il passaggio dalla comprensione del linguaggio all'esecuzione di azioni. Questi agenti richiamano strumenti dinamici e sensibili al contesto pur mantenendo il ragionamento LLM, trasformando gli assistenti passivi in sistemi che completano le attività, accedono ai servizi e integrano le operazioni aziendali. Questo modello è una componente importante dell'intelligenza artificiale agentica in ambito aziendale, specialmente se combinato con schemi dichiarativi, framework di autorizzazione e sistemi multiagente.