Flux de travail pour un chaînage rapide - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Flux de travail pour un chaînage rapide

Le chaînage rapide décompose les tâches complexes en une séquence d'étapes, chaque étape étant un appel LLM discret qui traite ou s'appuie sur le résultat de la précédente.

Flux de travail pour un chaînage rapide.

Le flux de travail de chaînage rapide convient aux scénarios dans lesquels les tâches peuvent être logiquement divisées en étapes de raisonnement séquentielles, et dans lesquels les résultats intermédiaires indiquent l'étape suivante. Il excelle dans les flux de travail qui nécessitent une réflexion structurée, une transformation progressive ou une analyse en couches, tels que la révision de documents, la génération de code, l'extraction de connaissances et le raffinement du contenu.

Description

  • La complexité de la tâche dépasse la fenêtre contextuelle ou la profondeur de raisonnement d'un seul appel LLM.

  • Les résultats d'une étape (par exemple, analyse, synthèse ou planification) deviennent des entrées pour une décision de suivi ou une phase de génération.

  • Vous avez besoin de transparence et de contrôle à chaque étape du raisonnement (par exemple, résultats intermédiaires vérifiables).

  • Vous souhaitez intégrer une logique de validation, de filtrage ou d'enrichissement externe entre les étapes.

  • Il est idéal pour les agents opérant dans des boucles de raisonnement de type pipeline, tels que les agents de recherche, les assistants éditoriaux, les systèmes de planification et les copilotes en plusieurs étapes.

Fonctionnalités

  • Chaînes linéaires ou ramifiées d'appels LLM

  • Résultats intermédiaires transmis sous forme de saisie structurée ou intégrés dans des instructions de suivi

  • Peut être orchestré avec ou avec AWS Step Functions des coureurs AWS Lambda spécifiques à un agent

Cas d’utilisation courants

  • Tâches de raisonnement en plusieurs étapes (par exemple, « réécriture d'une critique résumée »)

  • Assistants de recherche synthétisant des résultats en couches (par exemple, « rechercher, extraire des faits, répondre à une question »)

  • Pipelines de génération de code (« générer un plan, écrire du code, tester le code, expliquer la sortie »)