AgentCore integración Configuración del agente Transmisión y procesamiento Administración de la memoria Observabilidad Creador de flujos de trabajo

Agent Builder

Agent Builder proporciona una plataforma para crear, implementar y administrar agentes de IA listos para la producción en Amazon Bedrock. AgentCore En esta sección se describen los componentes técnicos y los detalles de la implementación.

AgentCore integración

Agent Builder utiliza un enfoque de despliegue basado en la configuración con imágenes de agentes prediseñadas para permitir despliegues de agentes rápidos, seguros y escalables.

Imágenes de agentes prediseñadas

El equipo de la GAAB crea las imágenes de los contenedores de agentes durante el CI/CD proceso y las publica en un repositorio de ECR público. Cada versión de imagen está vinculada a la versión de la solución GAAB (por ejemplo, v4.0.0 →:v4.0.0). gaab-strands-agent Las imágenes se basan en el SDK de Strands e incluyen:

Entorno de ejecución del agente
Integración de clientes MCP
Capacidades de administración de memoria
OpenTelemetry instrumentación

Caché desplegable ECR

La solución utiliza la memoria caché Pull-Through de ECR para distribuir automáticamente las imágenes de los agentes desde el repositorio de ECR público al ECR privado del cliente. Este servicio gestionado por AWS:

Almacena en caché las imágenes al extraerlas por primera vez (retraso de 2 a 5 minutos)
Elimina la lógica de copia de imágenes personalizada
Proporciona disponibilidad de imágenes locales para despliegues posteriores
Crea reglas de caché únicas por implementación para evitar conflictos

Almacenamiento de configuraciones

Las configuraciones de los agentes se almacenan en DynamoDB junto con las configuraciones de casos de uso existentes. Cada configuración incluye:

Plantilla de solicitud del sistema
Proveedor de modelos e ID de modelo
Parámetros del modelo (temperatura, max_tokens)
Referencias y puntos finales del servidor MCP
Configuración de memoria (conmutador de memoria a largo plazo)
Metadatos de despliegue

Registro de versiones de imágenes

Una tabla de DynamoDB rastrea las versiones de las imágenes de los agentes disponibles y su URIs caché, lo que permite la administración de versiones y la compatibilidad con versiones anteriores.

Configuración del agente

Indicaciones del sistema

Las indicaciones del sistema definen el comportamiento, la personalidad y las capacidades del agente. Los usuarios administradores pueden:

Edite la plantilla predeterminada a través de la interfaz de usuario de Agent Builder
Incluya instrucciones para el uso de la herramienta y el formato de las respuestas
Restablezca la plantilla predeterminada en cualquier momento

Selección de modelos

Agent Builder es compatible con los modelos de Amazon Bedrock en la versión 4.0.0:

Proveedor del modelo: Amazon Bedrock (solo opción en la versión 4.0.0)
Selección de modelos: Claude, Nova y otros modelos de Bedrock
Parámetros del modelo: temperatura, max_tokens, top_p y ajustes específicos del modelo

Integración del servidor MCP

Los servidores Model Context Protocol proporcionan a los agentes acceso a herramientas y datos empresariales:

Detección de servidores mediante el punto final de la API GET/mcp
Configuración dinámica sin cambios de código
Autenticación y administración de terminales
Capacidad de la herramienta: exposición a los agentes

Transmisión y procesamiento

Transmisión en tiempo real

Agent Builder utiliza los eventos enviados por el servidor (SSE) de forma AgentCore puente a transmisión de respuestas en WebSocket tiempo real:

La función Lambda establece la conexión SSE con Runtime AgentCore
Las transmisiones se conectan a API Gateway WebSocket
Permite la entrega de token-by-token respuestas a los clientes
Mantiene la conexión para las solicitudes de larga duración

Restricciones de procesamiento

El procesamiento del agente en la versión 4.0.0 está limitado al tiempo de espera de ejecución de Lambda:

Tiempo máximo de procesamiento: 15 minutos
Modelo de procesamiento sincrónico
Adecuado para agentes conversacionales y flujos de trabajo moderados
El soporte asíncrono ampliado está previsto para la versión 4.1 o posterior

Administración de la memoria

Memoria a corto plazo

Habilitada de forma predeterminada para todos los agentes que utilizan una configuración personalizada MemoryHookProvider:

Captura los eventos de conversación a través de los controladores de devolución de llamadas de Strands
Se organiza por ActorID y SessionID para aislar el contexto
Mantiene el contexto de la conversación dentro de las sesiones
Integración automática con AgentCore Memory

Memoria a largo plazo

Función opcional que utiliza AgentCore la herramienta de memoria de strands_tools:

Conmutador sencillo en la interfaz de usuario de Agent Builder
Estrategia de memoria semántica con ajustes predeterminados
Acceso controlado por agentes mediante la invocación natural de herramientas
Almacena la información extraída en todas las sesiones
Usa ConversationID como SessionID

Observabilidad

OpenTelemetry Distribución AWS (ADOT)

Los agentes se instrumentan automáticamente durante la creación del contenedor:

Generación automática de trazas para las operaciones de los agentes
Rastreo distribuido entre los límites del servicio
Registro estructurado con correlación IDs
Integración con CloudWatch Transaction Search

Flujo de autenticación

Los usuarios se autentican a través de Amazon Cognito con tokens JWT validados por autorizadores Lambda personalizados que recuperan las políticas de IAM de DynamoDB en función de los grupos de usuarios.

Creador de flujos de trabajo

Workflow Builder permite la orquestación de varios agentes mediante la creación de un agente supervisor que coordina varios agentes de Agent Builder mediante el patrón de delegación de agentes como herramientas.

Arquitectura de flujo de trabajo

Componentes clave

Agente supervisor: agente de punto de entrada que recibe las solicitudes de los usuarios y las delega en agentes especializados
Agentes especializados: casos de uso de Agent Builder registrados como herramientas para el supervisor
Registro de agentes: tabla de DynamoDB que almacena las configuraciones y los metadatos de los agentes
Capa de orquestación: implementa el patrón Agents as Tools en el SDK

Instanciación de agentes

Creación de agentes locales

Todos los agentes especializados se instancian localmente en el mismo tiempo AgentCore de ejecución:

Recupera las configuraciones de los agentes de DynamoDB
Crea instancias locales de cada agente de Agent Builder
Cada agente mantiene sus propias conexiones de servidor MCP
El agente supervisor registra a los agentes especializados como herramientas
El SDK de Strands gestiona la selección y delegación de agentes

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Cómo funciona la solución Generative AI Application Builder en AWS

Planificación de la implementación