Agentes basados en herramientas para llamar a funciones - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Agentes basados en herramientas para llamar a funciones

Los agentes basados en herramientas amplían las capacidades de los agentes de razonamiento al invocar funciones externas o APIs completar tareas que van más allá del razonamiento basado únicamente en el lenguaje. Este patrón utiliza un LLM para decidir qué herramienta utilizar y, a continuación, genera argumentos de llamada e incorpora los resultados de la herramienta en su ciclo de razonamiento.

Este patrón permite a los agentes actuar en lugar de limitarse a dar respuestas. La interfaz de la herramienta representa cualquier capacidad que se pueda invocar, desde cálculos aritméticos y búsquedas en bases de datos hasta servicios externos y en la nube. APIs

Arquitectura

En el siguiente diagrama se muestra un agente basado en herramientas para llamar a funciones:

Agente basado en herramientas para llamar a funciones.

Description (Descripción)

  1. Recibe una consulta

    • El agente recibe una consulta o tarea en lenguaje natural del usuario o del sistema que realiza la llamada.

  2. Busca herramientas

    • El agente utiliza metadatos internos o un registro de herramientas para buscar las herramientas, los esquemas y las capacidades relevantes disponibles.

  3. Selecciona e invoca las herramientas

    • El LLM recibe los metadatos de la consulta y la herramienta (por ejemplo, los nombres de las funciones, los tipos de entrada y las descripciones) en su solicitud de datos.

    • Elige la herramienta más relevante, construye los argumentos de entrada y devuelve una llamada a una función estructurada.

  4. Ejecuta la herramienta elegida

    • El shell del agente o el ejecutor de herramientas ejecuta la función seleccionada y devuelve el resultado (por ejemplo, una salida de API, un valor de base de datos o un cálculo).

  5. Devuelve una respuesta

    • El LLM pasa los resultados al agente, ya sea directamente o como parte de una solicitud actualizada. A continuación, devuelve un resultado en lenguaje natural.

Capacidades

  • Selección dinámica de herramientas basada en el contexto de la tarea

  • Solicitud basada en esquemas (OpenAPI, esquema JSON, interfaz de funciones) AWS

  • Interpretación de los resultados y encadenamiento de los resultados en el razonamiento

  • Operaciones apátridas o con registro de sesiones

Casos de uso comunes

  • Asistentes virtuales con acceso a datos externos

  • Calculadoras y estimadoras financieras

  • Trabajadores del conocimiento basados en API

  • LLMs que invocan SageMaker puntos de AWS Lambda conexión de Amazon y servicios SaaS

Guía para la implementación

Utilice lo siguiente para crear agentes basados en herramientas para llamar a funciones:

  • Amazon Bedrock con soporte para llamadas a funciones (Anthropic Claude)

  • AWS Lambda como un backend de ejecución de herramientas

  • Amazon API Gateway o AWS Step Functions para la organización de herramientas

  • Amazon DynamoDB o Amazon Relational Database Service (Amazon RDS) para metadatos de herramientas sensibles al contexto

  • Amazon EventBridge Pipelines o AWS Step Functions que mapean estados para enrutar las salidas

Resumen

Los agentes de llamada a funciones basados en herramientas representan un cambio de entender el lenguaje a realizar acciones. Estos agentes recurren a herramientas dinámicas y sensibles al contexto y, al mismo tiempo, mantienen el razonamiento LLM, transformando los asistentes pasivos en sistemas que completan tareas, acceden a los servicios e integran las operaciones comerciales. Este patrón es un componente importante de la IA de los agentes en los entornos empresariales, especialmente cuando se combina con esquemas declarativos, marcos de autorización y sistemas multiagente.