Description Fonctionnalités Cas d’utilisation courants

Flux de travail pour un chaînage rapide

Le chaînage rapide décompose les tâches complexes en une séquence d'étapes, chaque étape étant un appel LLM discret qui traite ou s'appuie sur le résultat de la précédente.

Le flux de travail de chaînage rapide convient aux scénarios dans lesquels les tâches peuvent être logiquement divisées en étapes de raisonnement séquentielles, et dans lesquels les résultats intermédiaires indiquent l'étape suivante. Il excelle dans les flux de travail qui nécessitent une réflexion structurée, une transformation progressive ou une analyse en couches, tels que la révision de documents, la génération de code, l'extraction de connaissances et le raffinement du contenu.

Description

La complexité de la tâche dépasse la fenêtre contextuelle ou la profondeur de raisonnement d'un seul appel LLM.
Les résultats d'une étape (par exemple, analyse, synthèse ou planification) deviennent des entrées pour une décision de suivi ou une phase de génération.
Vous avez besoin de transparence et de contrôle à chaque étape du raisonnement (par exemple, résultats intermédiaires vérifiables).
Vous souhaitez intégrer une logique de validation, de filtrage ou d'enrichissement externe entre les étapes.
Il est idéal pour les agents opérant dans des boucles de raisonnement de type pipeline, tels que les agents de recherche, les assistants éditoriaux, les systèmes de planification et les copilotes en plusieurs étapes.

Fonctionnalités

Chaînes linéaires ou ramifiées d'appels LLM
Résultats intermédiaires transmis sous forme de saisie structurée ou intégrés dans des instructions de suivi
Peut être orchestré avec ou avec AWS Step Functions des coureurs AWS Lambda spécifiques à un agent

Cas d’utilisation courants

Tâches de raisonnement en plusieurs étapes (par exemple, « réécriture d'une critique résumée »)
Assistants de recherche synthétisant des résultats en couches (par exemple, « rechercher, extraire des faits, répondre à une question »)
Pipelines de génération de code (« générer un plan, écrire du code, tester le code, expliquer la sortie »)

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Vue d'ensemble de la cognition augmentée par le LLM

Flux de travail pour le routage