Flujo de trabajo para enrutamiento - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Flujo de trabajo para enrutamiento

En el patrón de enrutamiento, un clasificador o agente de enrutamiento utiliza un LLM para interpretar la intención o la categoría de una consulta y, a continuación, enruta la entrada a un agente o tarea posterior especializado.

Flujo de trabajo para el enrutamiento.

El flujo de trabajo de enrutamiento se utiliza en situaciones en las que un agente debe clasificar rápidamente la intención de entrada, el tipo de tarea o el dominio y, a continuación, delegar la solicitud a un subagente, herramienta o flujo de trabajo especializados. Resulta especialmente útil en el caso de los agentes de capacidades, como los que actúan como asistentes generales, son los encargados de dar acceso a las funciones empresariales o las interfaces de IA orientadas al usuario que abarcan varios dominios.

El enrutamiento es particularmente efectivo cuando:

  • Clasifica las solicitudes en función de una variedad de tareas (por ejemplo, búsqueda, resumen, reserva o cálculos).

  • Las entradas deben preprocesarse o normalizarse antes de entrar en flujos de trabajo más especializados.

  • Los diferentes tipos de entrada (por ejemplo, imágenes frente a texto, consultas estructuradas frente a consultas no estructuradas) requieren un tratamiento personalizado.

  • Un agente actúa como una centralita conversacional y delega tareas a agentes especializados o microservicios.

  • Este flujo de trabajo es común en los copilotos de dominios específicos, los bots de atención al cliente, los enrutadores de servicios empresariales y los agentes multimodales, donde el despacho inteligente determina tanto la calidad como la eficiencia del comportamiento de los agentes.

Capacidades

  • Un LLM de primer paso actúa como despachador

  • Las rutas pueden invocar flujos de trabajo distintos o incluso otros patrones de agentes

  • Soporta la expansión modular de las capacidades

Casos de uso comunes

  • Asistentes multidominio («¿se trata de una cuestión legal, médica o financiera?»)

  • Árboles de decisión mejorados con el razonamiento LLM

  • Selección dinámica de herramientas (por ejemplo, búsqueda frente a generación de código)