Fonctionnalités Cas d’utilisation courants

Flux de travail pour le routage

Dans le schéma de routage, un classificateur ou un agent de routeur utilise un LLM pour interpréter l'intention ou la catégorie d'une requête, puis achemine l'entrée vers une tâche ou un agent spécialisé en aval.

Le flux de travail de routage est utilisé dans les scénarios où un agent doit rapidement classer l'intention d'entrée, le type de tâche ou le domaine, puis déléguer la demande à un sous-agent, un outil ou un flux de travail spécialisé. Il est particulièrement utile pour les agents de capacité, tels que ceux qui font office d'assistants généraux, de portes d'entrée des fonctions de l'entreprise ou d'interfaces d'IA orientées utilisateur couvrant plusieurs domaines.

Le routage est particulièrement efficace lorsque :

Triage des demandes selon diverses tâches (par exemple, recherche, synthèse, réservation, calculs).
Les entrées doivent être prétraitées ou normalisées avant d'entrer dans des flux de travail plus spécialisés.
Les différents types de saisie (par exemple, images par rapport au texte, requêtes structurées par rapport aux requêtes non structurées) nécessitent un traitement personnalisé.
Un agent agit comme un central conversationnel, déléguant des tâches à des agents spécialisés ou à des microservices.
Ce flux de travail est courant dans les copilotes spécifiques à un domaine, les robots de support client, les routeurs de services d'entreprise et les agents multimodaux, où le dispatching intelligent détermine à la fois la qualité et l'efficacité du comportement des agents.

Fonctionnalités

Un LLM de premier passage agit en tant que répartiteur
Les itinéraires peuvent invoquer des flux de travail distincts ou même d'autres modèles d'agents
Prend en charge l'extension modulaire des capacités

Cas d’utilisation courants

Assistants multidomaines (« s'agit-il d'une question juridique, médicale ou financière ? »)
Arbres de décision améliorés grâce au raisonnement LLM
Sélection d'outils dynamique (par exemple, recherche ou génération de code)

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Flux de travail pour un chaînage rapide

Workflow pour la parallélisation