View a markdown version of this page

Agent Builder - Creador de aplicaciones de IA generativa en AWS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Agent Builder

Agent Builder proporciona una plataforma para crear, implementar y administrar agentes de IA listos para la producción en Amazon Bedrock. AgentCore En esta sección se describen los componentes técnicos y los detalles de la implementación.

AgentCore integración

Agent Builder utiliza un enfoque de despliegue basado en la configuración con imágenes de agentes prediseñadas para permitir despliegues de agentes rápidos, seguros y escalables.

Imágenes de agentes prediseñadas

El equipo de la GAAB crea las imágenes de los contenedores de agentes durante el CI/CD proceso y las publica en un repositorio de ECR público. Cada versión de imagen está vinculada a la versión de la solución GAAB (por ejemplo, v4.0.0 →:v4.0.0). gaab-strands-agent Las imágenes se basan en el SDK de Strands e incluyen:

  • Entorno de ejecución del agente

  • Integración de clientes MCP

  • Capacidades de administración de memoria

  • OpenTelemetry instrumentación

Caché desplegable ECR

La solución utiliza la memoria caché Pull-Through de ECR para distribuir automáticamente las imágenes de los agentes desde el repositorio de ECR público al ECR privado del cliente. Este servicio gestionado por AWS:

  • Almacena en caché las imágenes al extraerlas por primera vez (retraso de 2 a 5 minutos)

  • Elimina la lógica de copia de imágenes personalizada

  • Proporciona disponibilidad de imágenes locales para despliegues posteriores

  • Crea reglas de caché únicas por implementación para evitar conflictos

Almacenamiento de configuraciones

Las configuraciones de los agentes se almacenan en DynamoDB junto con las configuraciones de casos de uso existentes. Cada configuración incluye:

  • Plantilla de solicitud del sistema

  • Proveedor de modelos e ID de modelo

  • Parámetros del modelo (temperatura, max_tokens)

  • Referencias y puntos finales del servidor MCP

  • Configuración de memoria (conmutador de memoria a largo plazo)

  • Metadatos de despliegue

Registro de versiones de imágenes

Una tabla de DynamoDB rastrea las versiones de las imágenes de los agentes disponibles y su URIs caché, lo que permite la administración de versiones y la compatibilidad con versiones anteriores.

Configuración del agente

Indicaciones del sistema

Las indicaciones del sistema definen el comportamiento, la personalidad y las capacidades del agente. Los usuarios administradores pueden:

  • Edite la plantilla predeterminada a través de la interfaz de usuario de Agent Builder

  • Incluya instrucciones para el uso de la herramienta y el formato de las respuestas

  • Restablezca la plantilla predeterminada en cualquier momento

Selección de modelos

Agent Builder es compatible con los modelos de Amazon Bedrock en la versión 4.0.0:

  • Proveedor del modelo: Amazon Bedrock (solo opción en la versión 4.0.0)

  • Selección de modelos: Claude, Nova y otros modelos de Bedrock

  • Parámetros del modelo: temperatura, max_tokens, top_p y ajustes específicos del modelo

Integración del servidor MCP

Los servidores Model Context Protocol proporcionan a los agentes acceso a herramientas y datos empresariales:

  • Detección de servidores mediante el punto final de la API GET/mcp

  • Configuración dinámica sin cambios de código

  • Autenticación y administración de terminales

  • Capacidad de la herramienta: exposición a los agentes

Transmisión y procesamiento

Transmisión en tiempo real

Agent Builder utiliza los eventos enviados por el servidor (SSE) de forma AgentCore puente a transmisión de respuestas en WebSocket tiempo real:

  • La función Lambda establece la conexión SSE con Runtime AgentCore

  • Las transmisiones se conectan a API Gateway WebSocket

  • Permite la entrega de token-by-token respuestas a los clientes

  • Mantiene la conexión para las solicitudes de larga duración

Restricciones de procesamiento

El procesamiento del agente en la versión 4.0.0 está limitado al tiempo de espera de ejecución de Lambda:

  • Tiempo máximo de procesamiento: 15 minutos

  • Modelo de procesamiento sincrónico

  • Adecuado para agentes conversacionales y flujos de trabajo moderados

  • El soporte asíncrono ampliado está previsto para la versión 4.1 o posterior

Administración de la memoria

Memoria a corto plazo

Habilitada de forma predeterminada para todos los agentes que utilizan una configuración personalizada MemoryHookProvider:

  • Captura los eventos de conversación a través de los controladores de devolución de llamadas de Strands

  • Se organiza por ActorID y SessionID para aislar el contexto

  • Mantiene el contexto de la conversación dentro de las sesiones

  • Integración automática con AgentCore Memory

Memoria a largo plazo

Función opcional que utiliza AgentCore la herramienta de memoria de strands_tools:

  • Conmutador sencillo en la interfaz de usuario de Agent Builder

  • Estrategia de memoria semántica con ajustes predeterminados

  • Acceso controlado por agentes mediante la invocación natural de herramientas

  • Almacena la información extraída en todas las sesiones

  • Usa ConversationID como SessionID

Observabilidad

OpenTelemetry Distribución AWS (ADOT)

Los agentes se instrumentan automáticamente durante la creación del contenedor:

  • Generación automática de trazas para las operaciones de los agentes

  • Rastreo distribuido entre los límites del servicio

  • Registro estructurado con correlación IDs

  • Integración con CloudWatch Transaction Search

Flujo de autenticación

Los usuarios se autentican a través de Amazon Cognito con tokens JWT validados por autorizadores Lambda personalizados que recuperan las políticas de IAM de DynamoDB en función de los grupos de usuarios.

Creador de flujos de trabajo

Workflow Builder permite la orquestación de varios agentes mediante la creación de un agente supervisor que coordina varios agentes de Agent Builder mediante el patrón de delegación de agentes como herramientas.

Arquitectura de flujo de trabajo

Componentes clave

  • Agente supervisor: agente de punto de entrada que recibe las solicitudes de los usuarios y las delega en agentes especializados

  • Agentes especializados: casos de uso de Agent Builder registrados como herramientas para el supervisor

  • Registro de agentes: tabla de DynamoDB que almacena las configuraciones y los metadatos de los agentes

  • Capa de orquestación: implementa el patrón Agents as Tools en el SDK

Instanciación de agentes

Creación de agentes locales

Todos los agentes especializados se instancian localmente en el mismo tiempo AgentCore de ejecución:

  1. Recupera las configuraciones de los agentes de DynamoDB

  2. Crea instancias locales de cada agente de Agent Builder

  3. Cada agente mantiene sus propias conexiones de servidor MCP

  4. El agente supervisor registra a los agentes especializados como herramientas

  5. El SDK de Strands gestiona la selección y delegación de agentes