Flujo de trabajo para enrutamiento

En el patrón de enrutamiento, un clasificador o agente de enrutamiento utiliza un LLM para interpretar la intención o la categoría de una consulta y, a continuación, enruta la entrada a un agente o tarea posterior especializado.

El flujo de trabajo de enrutamiento se utiliza en situaciones en las que un agente debe clasificar rápidamente la intención de entrada, el tipo de tarea o el dominio y, a continuación, delegar la solicitud a un subagente, herramienta o flujo de trabajo especializados. Resulta especialmente útil en el caso de los agentes de capacidades, como los que actúan como asistentes generales, son los encargados de dar acceso a las funciones empresariales o las interfaces de IA orientadas al usuario que abarcan varios dominios.

El enrutamiento es particularmente efectivo cuando:

Clasifica las solicitudes en función de una variedad de tareas (por ejemplo, búsqueda, resumen, reserva o cálculos).
Las entradas deben preprocesarse o normalizarse antes de entrar en flujos de trabajo más especializados.
Los diferentes tipos de entrada (por ejemplo, imágenes frente a texto, consultas estructuradas frente a consultas no estructuradas) requieren un tratamiento personalizado.
Un agente actúa como una centralita conversacional y delega tareas a agentes especializados o microservicios.
Este flujo de trabajo es común en los copilotos de dominios específicos, los bots de atención al cliente, los enrutadores de servicios empresariales y los agentes multimodales, donde el despacho inteligente determina tanto la calidad como la eficiencia del comportamiento de los agentes.

Capacidades

Un LLM de primer paso actúa como despachador
Las rutas pueden invocar flujos de trabajo distintos o incluso otros patrones de agentes
Soporta la expansión modular de las capacidades

Casos de uso comunes

Asistentes multidominio («¿se trata de una cuestión legal, médica o financiera?»)
Árboles de decisión mejorados con el razonamiento LLM
Selección dinámica de herramientas (por ejemplo, búsqueda frente a generación de código)

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Flujo de trabajo para un encadenamiento rápido

Flujo de trabajo para la paralelización