Flusso di lavoro per il concatenamento rapido - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Flusso di lavoro per il concatenamento rapido

Il prompt chaining scompone le attività complesse in una sequenza di passaggi, in cui ogni passaggio è una chiamata LLM discreta che elabora o si basa sull'output di quella precedente.

Flusso di lavoro per il concatenamento dei prompt.

Il flusso di lavoro di concatenamento dei prompt è adatto per scenari in cui le attività possono essere suddivise logicamente in fasi di ragionamento sequenziali e in cui gli output intermedi determinano la fase successiva. Eccelle nei flussi di lavoro che richiedono un pensiero strutturato, una trasformazione progressiva o un'analisi su più livelli, come la revisione dei documenti, la generazione di codice, l'estrazione della conoscenza e il perfezionamento dei contenuti.

Descrizione

  • La complessità dell'attività supera la finestra contestuale o la profondità di ragionamento di una singola chiamata LLM.

  • I risultati di una fase (ad esempio, analisi, riepilogo o pianificazione) diventano input per una successiva fase decisionale o di generazione.

  • Sono necessari trasparenza e controllo in tutte le fasi di ragionamento (ad esempio, risultati intermedi verificabili).

  • Vuoi inserire una logica di convalida, filtraggio o arricchimento esterna tra i passaggi.

  • È ideale per gli agenti che operano in cicli di ragionamento in stile pipeline, come agenti di ricerca, assistenti editoriali, sistemi di pianificazione e copiloti multistadio.

Funzionalità

  • Catene lineari o ramificate di chiamate LLM

  • Risultati intermedi passati come input strutturato o incorporati nei prompt di follow-up

  • Può essere orchestrato con o con corridori specifici per un agente AWS Step Functions AWS Lambda

Casi di utilizzo comune

  • Attività di ragionamento in più fasi (ad esempio, «riepilogo, riscrittura critica»)

  • Assistenti di ricerca che sintetizzano risultati stratificati (ad esempio, «cerca, estrai fatti, rispondi a una domanda»)

  • Pipeline di generazione del codice («generate plan write code test code explain output»)