Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Workflow pour la parallélisation
Ce flux de travail consiste à décomposer une tâche en sous-tâches indépendantes qui peuvent être gérées simultanément par plusieurs appels ou agents LLM. Les résultats sont ensuite agrégés par programmation et synthétisés en un résultat.
Le flux de travail de parallélisation est utilisé lorsqu'une tâche peut être divisée en sous-tâches indépendantes et non séquentielles pouvant être traitées simultanément, ce qui améliore considérablement l'efficacité, le débit et l'évolutivité. Il est particulièrement puissant dans les espaces problématiques riches en données, orientés par lots ou à perspectives multiples où l'agent doit analyser ou générer du contenu à partir de plusieurs entrées.
La parallélisation est particulièrement efficace lorsque :
-
Les sous-tâches ne dépendent pas des résultats intermédiaires des unes et des autres, ce qui leur permet de s'exécuter en parallèle sans coordination.
-
Une tâche implique de répéter le même processus de raisonnement pour de nombreux éléments (par exemple, résumer plusieurs documents ou évaluer une liste d'options).
-
De multiples hypothèses ou perspectives sont explorées en parallèle pour promouvoir la diversité, la créativité ou la robustesse.
-
Vous devez réduire la latence pour les demandes à volume élevé ou à haute fréquence grâce à l'exécution simultanée du LLM.
-
Ce flux de travail est couramment utilisé dans les agents de traitement de documents, les moteurs d'enquête ou de comparaison, les synthétiseurs par lots, les brainstormers multi-agents et les tâches de classification ou d'étiquetage évolutives, en particulier lorsque le raisonnement rapide et parallèle constitue un avantage en termes de performances.
Fonctionnalités
-
Exécution parallèle de tâches LLM (en utilisant AWS Lambda AWS Fargate, ou un état de AWS Step Functions carte)
-
Nécessite l'alignement, la validation ou la déduplication des résultats au stade de la synthèse
-
Convient parfaitement aux boucles d'agents apatrides
Cas d’utilisation courants
-
Analyse de plusieurs documents ou perspectives en parallèle
-
Génération de brouillons, de résumés ou de plans variés
-
Accélérer le débit entre les tâches par lots