Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Agentes basados en herramientas para servidores
Los agentes basados en herramientas para servidores mejoran las funciones de los agentes al delegar la ejecución de las herramientas a un servidor externo que cuenta con un entorno de ejecución dedicado a las herramientas, los scripts y los agentes compuestos. A diferencia de las llamadas a funciones en línea que el bucle de agentes selecciona e invoca, los agentes basados en servidor subcontratan la lógica y el proceso de ejecución a otros agentes o sistemas. Esto proporciona funciones avanzadas, como el encadenamiento de múltiples herramientas, la ejecución aislada y el razonamiento especializado. Los servidores de herramientas son ideales para acciones complejas, activas o que requieren muchos recursos, en las que las propias herramientas pueden implicar modelos de IA, reglas empresariales o entornos independientes.
Arquitectura
El siguiente es un patrón para los agentes basados en herramientas para servidores:
Description (Descripción)
-
Recibe una consulta
-
Un usuario o un sistema envía una solicitud al shell del agente.
-
El agente interpreta la consulta y se prepara para enviarla a un servidor de herramientas.
-
-
Ejecuta los procesos del servidor de herramientas
-
El agente envía la tarea, junto con los parámetros estructurados, a un servidor de herramientas.
-
El servidor de herramientas puede entonces:
-
Ejecute scripts o lógica en sistemas de cómputo dedicados (por ejemplo AWS Lambda, contenedores o Amazon SageMaker)
-
Utilice su propio subagente con el razonamiento LLM para seleccionar y ejecutar las herramientas
-
Gestione las dependencias, los reintentos o los flujos de ejecución en varios pasos
-
Envíe los resultados al agente principal cuando se complete la tarea
-
-
-
Utiliza el razonamiento LLM con el resultado de la herramienta
-
El agente invoca un LLM y pasa la consulta original y el resultado del servidor de herramientas como parte de la solicitud.
-
El LLM sintetiza una respuesta que incorpora la información recién adquirida.
-
-
Devuelve una respuesta
-
El agente devuelve una respuesta estructurada o en lenguaje natural al usuario o al sistema que realiza la llamada.
-
(Opcional) Los resultados se pueden almacenar en la memoria o en los registros de auditoría.
-
Capacidades
-
Las herramientas se invocan fuera del ciclo de ejecución del agente principal
-
La ejecución de la herramienta puede implicar llamadas LLM, cadenas lógicas o subagentes
-
El agente actúa como controlador o despachador, no solo como un envoltorio de herramientas
-
Permite la componibilidad, la escalabilidad y el aislamiento de la lógica
Casos de uso comunes
-
Organización de cadenas de modelos (por ejemplo, mediante la combinación de LLM, visión y código)
-
Procesos de automatización impulsados por la IA
-
DevOps agentes asistentes con ejecutores de guiones
-
Agentes complejos de computación, simulación u optimización financiera
-
Herramientas multimodales (por ejemplo, mediante la combinación de audio, documentación y acción)
Guía para la implementación
Puede crear este patrón utilizando lo siguiente: Servicios de AWS
-
Amazon Bedrock (inferencia de agente, anfitrión y LLM)
-
AWS Lambda, Amazon ECS o Amazon SageMaker Endpoints como entorno de ejecución del servidor de herramientas AWS Fargate
-
Amazon API Gateway o AWS App Runner para exponer el servidor de herramientas APIs
-
Amazon EventBridge para mensajería desacoplada agent-to-tool
-
AWS Step Functions o AWS AppFabric para componer una lógica multiagente en el servidor de herramientas
Resumen
Los agentes basados en herramientas que utilizan servidores son altamente modulares y escalables. Disocian la lógica de decisión de la ejecución, lo que permite que el agente principal sea ligero y, al mismo tiempo, delegue las acciones complejas o delicadas a otros sistemas. Esto es importante para la IA de los agentes de nivel empresarial, especialmente en entornos que requieren gobernabilidad, observabilidad, aislamiento, composición dinámica o cualquier combinación de ambos.