Flusso di lavoro per la parallelizzazione - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Flusso di lavoro per la parallelizzazione

Questo flusso di lavoro prevede la suddivisione di un'attività in sottoattività indipendenti che possono essere gestite contemporaneamente da più chiamate o agenti LLM. Gli output vengono quindi aggregati a livello di codice e sintetizzati in un risultato.

Flusso di lavoro per la parallelizzazione.

Il flusso di lavoro di parallelizzazione viene utilizzato quando un'attività può essere suddivisa in sottoattività indipendenti e non sequenziali che possono essere elaborate contemporaneamente, migliorando significativamente l'efficienza, la produttività e la scalabilità. È particolarmente efficace negli spazi problematici ad alto contenuto di dati, orientati ai batch o multiprospettici in cui l'agente deve analizzare o generare contenuti su più input.

La parallelizzazione è particolarmente efficace quando:

  • Le sottoattività non dipendono dai reciproci risultati intermedi, pertanto possono essere eseguite in parallelo senza coordinamento.

  • Un'attività prevede la ripetizione dello stesso processo di ragionamento su più elementi (ad esempio, riepilogando più documenti o valutando un elenco di opzioni).

  • Molteplici ipotesi o prospettive vengono esplorate in parallelo per promuovere la diversità, la creatività o la solidità.

  • È necessario ridurre la latenza per le richieste ad alto volume o ad alta frequenza tramite l'esecuzione simultanea di LLM.

  • Questo flusso di lavoro viene comunemente utilizzato negli agenti di elaborazione di documenti, nei motori di sondaggi o di confronto, nei riepiloghi di batch, nei brainstorming multiagente e nelle attività di classificazione o etichettatura scalabili, specialmente laddove il ragionamento rapido e parallelo rappresenta un vantaggio in termini di prestazioni.

Funzionalità

  • Esecuzione parallela di attività LLM (utilizzando o uno stato della mappa) AWS Lambda AWS Fargate AWS Step Functions

  • Richiede l'allineamento, la convalida o la deduplicazione dei risultati in fase di sintesi

  • Ideale per i loop di agenti stateless

Casi di utilizzo comune

  • Analisi parallela di più documenti o prospettive

  • Generazione di bozze, riepiloghi o piani diversi

  • Accelerazione della produttività tra i lavori in batch