Flux de travail pour le routage - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Flux de travail pour le routage

Dans le schéma de routage, un classificateur ou un agent de routeur utilise un LLM pour interpréter l'intention ou la catégorie d'une requête, puis achemine l'entrée vers une tâche ou un agent spécialisé en aval.

Flux de travail pour le routage.

Le flux de travail de routage est utilisé dans les scénarios où un agent doit rapidement classer l'intention d'entrée, le type de tâche ou le domaine, puis déléguer la demande à un sous-agent, un outil ou un flux de travail spécialisé. Il est particulièrement utile pour les agents de capacité, tels que ceux qui font office d'assistants généraux, de portes d'entrée des fonctions de l'entreprise ou d'interfaces d'IA orientées utilisateur couvrant plusieurs domaines.

Le routage est particulièrement efficace lorsque :

  • Triage des demandes selon diverses tâches (par exemple, recherche, synthèse, réservation, calculs).

  • Les entrées doivent être prétraitées ou normalisées avant d'entrer dans des flux de travail plus spécialisés.

  • Les différents types de saisie (par exemple, images par rapport au texte, requêtes structurées par rapport aux requêtes non structurées) nécessitent un traitement personnalisé.

  • Un agent agit comme un central conversationnel, déléguant des tâches à des agents spécialisés ou à des microservices.

  • Ce flux de travail est courant dans les copilotes spécifiques à un domaine, les robots de support client, les routeurs de services d'entreprise et les agents multimodaux, où le dispatching intelligent détermine à la fois la qualité et l'efficacité du comportement des agents.

Fonctionnalités

  • Un LLM de premier passage agit en tant que répartiteur

  • Les itinéraires peuvent invoquer des flux de travail distincts ou même d'autres modèles d'agents

  • Prend en charge l'extension modulaire des capacités

Cas d’utilisation courants

  • Assistants multidomaines (« s'agit-il d'une question juridique, médicale ou financière ? »)

  • Arbres de décision améliorés grâce au raisonnement LLM

  • Sélection d'outils dynamique (par exemple, recherche ou génération de code)