Arquitectura Description (Descripción)Capacidades Casos de uso comunes Guía para la implementación Resumen

Agentes basados en herramientas para servidores

Los agentes basados en herramientas para servidores mejoran las funciones de los agentes al delegar la ejecución de las herramientas a un servidor externo que cuenta con un entorno de ejecución dedicado a las herramientas, los scripts y los agentes compuestos. A diferencia de las llamadas a funciones en línea que el bucle de agentes selecciona e invoca, los agentes basados en servidor subcontratan la lógica y el proceso de ejecución a otros agentes o sistemas. Esto proporciona funciones avanzadas, como el encadenamiento de múltiples herramientas, la ejecución aislada y el razonamiento especializado. Los servidores de herramientas son ideales para acciones complejas, activas o que requieren muchos recursos, en las que las propias herramientas pueden implicar modelos de IA, reglas empresariales o entornos independientes.

Arquitectura

El siguiente es un patrón para los agentes basados en herramientas para servidores:

Description (Descripción)

Recibe una consulta
- Un usuario o un sistema envía una solicitud al shell del agente.
- El agente interpreta la consulta y se prepara para enviarla a un servidor de herramientas.
Ejecuta los procesos del servidor de herramientas
- El agente envía la tarea, junto con los parámetros estructurados, a un servidor de herramientas.
- El servidor de herramientas puede entonces:
  - Ejecute scripts o lógica en sistemas de cómputo dedicados (por ejemplo AWS Lambda, contenedores o Amazon SageMaker)
  - Utilice su propio subagente con el razonamiento LLM para seleccionar y ejecutar las herramientas
  - Gestione las dependencias, los reintentos o los flujos de ejecución en varios pasos
  - Envíe los resultados al agente principal cuando se complete la tarea
Utiliza el razonamiento LLM con el resultado de la herramienta
- El agente invoca un LLM y pasa la consulta original y el resultado del servidor de herramientas como parte de la solicitud.
- El LLM sintetiza una respuesta que incorpora la información recién adquirida.
Devuelve una respuesta
- El agente devuelve una respuesta estructurada o en lenguaje natural al usuario o al sistema que realiza la llamada.
- (Opcional) Los resultados se pueden almacenar en la memoria o en los registros de auditoría.

Capacidades

Las herramientas se invocan fuera del ciclo de ejecución del agente principal
La ejecución de la herramienta puede implicar llamadas LLM, cadenas lógicas o subagentes
El agente actúa como controlador o despachador, no solo como un envoltorio de herramientas
Permite la componibilidad, la escalabilidad y el aislamiento de la lógica

Casos de uso comunes

Organización de cadenas de modelos (por ejemplo, mediante la combinación de LLM, visión y código)
Procesos de automatización impulsados por la IA
DevOps agentes asistentes con ejecutores de guiones
Agentes complejos de computación, simulación u optimización financiera
Herramientas multimodales (por ejemplo, mediante la combinación de audio, documentación y acción)

Guía para la implementación

Puede crear este patrón utilizando lo siguiente: Servicios de AWS

Amazon Bedrock (inferencia de agente, anfitrión y LLM)
AWS Lambda, Amazon ECS o Amazon SageMaker Endpoints como entorno de ejecución del servidor de herramientas AWS Fargate
Amazon API Gateway o AWS App Runner para exponer el servidor de herramientas APIs
Amazon EventBridge para la mensajería desacoplada agent-to-tool
AWS Step Functions o AWS AppFabric para componer una lógica multiagente en el servidor de herramientas

Resumen

Los agentes basados en herramientas que utilizan servidores son altamente modulares y escalables. Disocian la lógica de decisión de la ejecución, lo que permite que el agente principal sea ligero y, al mismo tiempo, delegue las acciones complejas o delicadas a otros sistemas. Esto es importante para la IA de los agentes de nivel empresarial, especialmente en entornos que requieren gobernabilidad, observabilidad, aislamiento, composición dinámica o cualquier combinación de ambos.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Agentes basados en herramientas para llamar a funciones

Agentes de uso informático