Flujo de trabajo para la paralelización - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Flujo de trabajo para la paralelización

Este flujo de trabajo implica dividir una tarea en subtareas independientes que pueden ser gestionadas simultáneamente por varios agentes o llamadas de LLM. Luego, los resultados se agregan mediante programación y se sintetizan en un resultado.

Flujo de trabajo para la paralelización.

El flujo de trabajo de paralelización se utiliza cuando una tarea se puede dividir en subtareas independientes y no secuenciales que se pueden procesar simultáneamente, lo que mejora significativamente la eficiencia, el rendimiento y la escalabilidad. Es especialmente eficaz en espacios problemáticos con muchos datos, orientados a lotes o con múltiples perspectivas, en los que el agente debe analizar o generar contenido a partir de múltiples entradas.

La paralelización es particularmente eficaz cuando:

  • Las subtareas no dependen de los resultados intermedios de las demás, lo que les permite ejecutarse en paralelo sin coordinación.

  • Una tarea implica repetir el mismo proceso de razonamiento en varios elementos (por ejemplo, resumir varios documentos o evaluar una lista de opciones).

  • Se exploran múltiples hipótesis o perspectivas en paralelo para promover la diversidad, la creatividad o la solidez.

  • Debe reducir la latencia de las solicitudes de gran volumen o alta frecuencia mediante la ejecución simultánea de la LLM.

  • Este flujo de trabajo se suele utilizar en agentes de procesamiento de documentos, motores de encuestas o comparación, resumidores de lotes, sesiones de intercambio de ideas con varios agentes y tareas de clasificación o etiquetado escalables, especialmente cuando el razonamiento rápido y paralelo es una ventaja de rendimiento.

Capacidades

  • Ejecución paralela de tareas de LLM (mediante el uso de AWS Lambda, AWS Fargate o un estado del mapa) AWS Step Functions

  • Requiere alinear, validar o deduplicar los resultados en la etapa de síntesis

  • Muy adecuado para bucles de agentes sin estado

Casos de uso comunes

  • Analizar varios documentos o perspectivas en paralelo

  • Generar diversos borradores, resúmenes o planes

  • Acelerar el rendimiento en los trabajos por lotes