Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Agentes basados en herramientas para llamar a funciones
Los agentes basados en herramientas amplían las capacidades de los agentes de razonamiento al invocar funciones externas o APIs completar tareas que van más allá del razonamiento basado únicamente en el lenguaje. Este patrón utiliza un LLM para decidir qué herramienta utilizar y, a continuación, genera argumentos de llamada e incorpora los resultados de la herramienta en su ciclo de razonamiento.
Este patrón permite a los agentes actuar en lugar de limitarse a dar respuestas. La interfaz de la herramienta representa cualquier capacidad que se pueda invocar, desde cálculos aritméticos y búsquedas en bases de datos hasta servicios externos y en la nube. APIs
Arquitectura
En el siguiente diagrama se muestra un agente basado en herramientas para llamar a funciones:
Description (Descripción)
-
Recibe una consulta
-
El agente recibe una consulta o tarea en lenguaje natural del usuario o del sistema que realiza la llamada.
-
-
Busca herramientas
-
El agente utiliza metadatos internos o un registro de herramientas para buscar las herramientas, los esquemas y las capacidades relevantes disponibles.
-
-
Selecciona e invoca las herramientas
-
El LLM recibe los metadatos de la consulta y la herramienta (por ejemplo, los nombres de las funciones, los tipos de entrada y las descripciones) en su solicitud de datos.
-
Elige la herramienta más relevante, construye los argumentos de entrada y devuelve una llamada a una función estructurada.
-
-
Ejecuta la herramienta elegida
-
El shell del agente o el ejecutor de herramientas ejecuta la función seleccionada y devuelve el resultado (por ejemplo, una salida de API, un valor de base de datos o un cálculo).
-
-
Devuelve una respuesta
-
El LLM pasa los resultados al agente, ya sea directamente o como parte de una solicitud actualizada. A continuación, devuelve un resultado en lenguaje natural.
-
Capacidades
-
Selección dinámica de herramientas basada en el contexto de la tarea
-
Solicitud basada en esquemas (OpenAPI, esquema JSON, interfaz de funciones) AWS
-
Interpretación de los resultados y encadenamiento de los resultados en el razonamiento
-
Operaciones apátridas o con registro de sesiones
Casos de uso comunes
-
Asistentes virtuales con acceso a datos externos
-
Calculadoras y estimadoras financieras
-
Trabajadores del conocimiento basados en API
-
LLMs que invocan SageMaker puntos de AWS Lambda conexión de Amazon y servicios SaaS
Guía para la implementación
Utilice lo siguiente para crear agentes basados en herramientas para llamar a funciones:
-
Amazon Bedrock con soporte para llamadas a funciones (Anthropic Claude)
-
AWS Lambda como un backend de ejecución de herramientas
-
Amazon API Gateway o AWS Step Functions para la organización de herramientas
-
Amazon DynamoDB o Amazon Relational Database Service (Amazon RDS) para metadatos de herramientas sensibles al contexto
-
Amazon EventBridge Pipelines o AWS Step Functions que mapean estados para enrutar las salidas
Resumen
Los agentes de llamada a funciones basados en herramientas representan un cambio de entender el lenguaje a realizar acciones. Estos agentes recurren a herramientas dinámicas y sensibles al contexto y, al mismo tiempo, mantienen el razonamiento LLM, transformando los asistentes pasivos en sistemas que completan tareas, acceden a los servicios e integran las operaciones comerciales. Este patrón es un componente importante de la IA de los agentes en los entornos empresariales, especialmente cuando se combina con esquemas declarativos, marcos de autorización y sistemas multiagente.