Arquitectura basada en eventos: la columna vertebral de la IA sin servidor - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Arquitectura basada en eventos: la columna vertebral de la IA sin servidor

Serverless AI on AWS se basa en la arquitectura basada en eventos (EDA), un estilo arquitectónico en el que los eventos son el principal mecanismo de integración y control. Un evento es un cambio de estado o un hecho notable dentro de un sistema, como la carga de un archivo, una solicitud de un usuario, una señal de un sensor o el resultado de una inferencia de un modelo. Los eventos actúan como desencadenantes, lo que provoca que los servicios o agentes intermedios respondan sin una estrecha conexión entre los componentes.

En EDA, en lugar de invocar los servicios directamente o sondear si hay cambios, los sistemas responden a los eventos de forma asíncrona y en tiempo real. Este enfoque crea aplicaciones altamente desacopladas, escalables y reactivas.

Por qué la EDA es importante para los sistemas de IA

La EDA proporciona los siguientes beneficios importantes para los sistemas de IA:

  • Diseño de sistema disociado: los productores de eventos (por ejemplo, Amazon S3 y Amazon API Gateway) no necesitan conocer a los consumidores (por ejemplo AWS Lambda, Amazon Bedrock y AWS Step Functions). Este desacoplamiento permite una iteración rápida, un escalado independiente y un riesgo mínimo de fallos en cascada. En un sistema de IA, el servicio de recopilación de datos no necesita saber qué modelo se está ejecutando ni cómo se procesan las respuestas. El servicio simplemente emite un evento.

  • Integración perfecta de los flujos de trabajo de la IA: la EDA permite que las funciones de la IA, como el preprocesamiento, la inferencia, la fundamentación, el resumen o la toma de acciones, se conviertan en servicios modulares activados por eventos. Estos servicios pueden ampliarse de forma independiente y evolucionar sin una lógica de coordinación centralizada.

  • Escalamiento elástico y basado en eventos: las cargas de trabajo de IA suelen ser excesivas. La EDA puede eliminar los recursos inactivos y mejorar la rentabilidad mediante las siguientes capacidades de escalado:

    • AWS Lambda escala automáticamente en función del volumen de eventos.

    • Las operaciones de la API de Amazon Bedrock se pueden llamar desde las funciones de Lambda en respuesta a eventos desencadenantes.

    • AWS Step Functions puede coordinar canalizaciones de varios pasos solo cuando es necesario.

  • Toma de decisiones en tiempo real: los eventos permiten a los servicios de IA reaccionar inmediatamente a las entradas del sistema o del usuario, como se ilustra en los siguientes ejemplos:

    • Un mensaje de chatbot activa a un agente de Amazon Bedrock.

    • Un evento de transacción activa un modelo de detección de fraudes.

    • La carga de un documento desencadena un proceso de resumen.

La EDA y el modelo de agente de software

La EDA no se trata solo de desacoplar. La EDA se alinea con el paradigma de los agentes de software, según el cual los agentes autónomos perciben los eventos, razonan sobre ellos y actúan en función de su entorno.

En los sistemas de IA de las agencias, los eventos se perciben como observaciones, lo que desencadena ciclos cognitivos de establecimiento de objetivos, planificación y acción. La EDA proporciona el sustrato para la interacción entre el agente y el entorno:

Dado que los servicios sin servidor como Lambda EventBridge y Amazon Bedrock son intrínsecamente apátridas, reactivos y bajo demanda, constituyen la infraestructura ideal para las arquitecturas de IA de los agentes.

Servicios de AWS compatible con EDA

La arquitectura basada en eventos es el sustrato conectivo de los sistemas de IA modernos. Permite flujos de trabajo asíncronos, reactivos y altamente disociados que se escalan de forma elástica y responden en tiempo real. La EDA sirve de base operativa para los modelos de agentes de software, lo que la convierte en la arquitectura ideal para la IA de los agentes en entornos sin servidor.

Las siguientes arquitecturas basadas en eventos son Servicios de AWS compatibles:

  • Amazon EventBridge ofrece funciones de gestión de esquemas y enrutamiento de eventos.

  • La función de notificaciones de eventos de Amazon S3 activa los flujos de IA cuando se actualizan archivos u objetos.

  • AWS Lambdaejecuta la lógica en respuesta a los eventos.

  • Amazon SNS y Amazon SQS gestionan la mensajería pub/sub y el almacenamiento en búfer de mensajes.

  • AWS Step Functionsorganiza los flujos de trabajo de IA al recibir eventos.

  • Amazon Kinesis Data Streams permite la ingesta y el procesamiento en tiempo real de datos de streaming de alto rendimiento.

  • Amazon API Gateway (webhooks y activadores de eventos) puede recibir y transformar eventos externos mediante REST o WebSocket publicarlos EventBridge en Lambda.

  • AWS AppSyncSuscripciones a GraphQL para GraphQL basado en eventos y en tiempo real. APIs

  • Amazon Bedrock Agents proporciona una orquestación de agentes provocada por objetivos o eventos.

  • Amazon Bedrock AgentCore:

    • AgentCore Tiempo de ejecución: el entorno de ejecución para alojar y ejecutar la lógica del agente. Se integra con AWS Lambda Amazon Elastic Container Service (Amazon ECS) para ofrecer elasticidad y escala de forma autónoma en función de los activadores de eventos.

    • AgentCore Memoria: proporciona memoria persistente para almacenar el contexto de la conversación, los resultados de las tareas y el estado específico del agente. Puede complementar o sustituir a Amazon DynamoDB en determinados patrones, en función de los requisitos de latencia y tamaño.

    • AgentCore Gateway: permite a los agentes invocar fuentes externas y de datos mediante integraciones administradas APIs Servicios de AWS, lo que reduce el código de conector personalizado y mejora la observabilidad.

    • AgentCore herramientas integradas: proporcionan capacidades para la ejecución de código y la navegación web dentro de los entornos. AgentCore