Fluxo de trabalho para encadeamento imediato - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Fluxo de trabalho para encadeamento imediato

O encadeamento imediato decompõe tarefas complexas em uma sequência de etapas, em que cada etapa é uma invocação LLM discreta que processa ou se baseia na saída da anterior.

Fluxo de trabalho para encadeamento imediato.

O fluxo de trabalho de encadeamento imediato é adequado para cenários em que as tarefas podem ser divididas logicamente em etapas de raciocínio sequencial e em que os resultados intermediários informam o próximo estágio. Ele se destaca em fluxos de trabalho que exigem pensamento estruturado, transformação progressiva ou análise em camadas, como revisão de documentos, geração de código, extração de conhecimento e refinamento de conteúdo.

Descrição

  • A complexidade da tarefa excede a janela de contexto ou a profundidade de raciocínio de uma única chamada LLM.

  • Os resultados de uma etapa (por exemplo, análise, resumo ou planejamento) se tornam entradas para uma decisão de acompanhamento ou fase de geração.

  • Você precisa de transparência e controle em todos os estágios de raciocínio (por exemplo, resultados intermediários auditáveis).

  • Você deseja conectar a lógica externa de validação, filtragem ou enriquecimento entre as etapas.

  • É ideal para agentes que operam em ciclos de raciocínio no estilo pipeline, como agentes de pesquisa, assistentes editoriais, sistemas de planejamento e copilotos de vários estágios.

Capacidades

  • Cadeias lineares ou ramificadas de chamadas LLM

  • Resultados intermediários passados como entrada estruturada ou incorporados em solicitações de acompanhamento

  • Pode ser orquestrado com AWS Step Functions, ou com corredores AWS Lambda específicos do agente

Casos de uso comuns

  • Tarefas de raciocínio em várias etapas (por exemplo, “resumir, reescrever uma crítica”)

  • Assistentes de pesquisa sintetizando resultados em camadas (por exemplo, “pesquisar, extrair fatos, responder à pergunta”)

  • Pipelines de geração de código (“gerar plano, escrever código de teste, explicar a saída”)