赋值器的工作流程和反射优化循环

该工作流程提供了一个反馈循环，其中一个 LLM 生成结果，另一个法学硕士评估或批评结果。这促进了自我反思、优化和迭代改进。

评估器工作流程非常适合输出质量、准确性和对齐性很重要，以及单通道生成不可靠或不足的场景。当工程师必须自我批评、迭代和完善其输出时，这种工作流程非常出色，要么是为了达到更高的正确性标准，要么是为了根据反馈探索改进的替代方案。

在以下情况下，此工作流程特别有效：

此工作流程用于内容生成、代码合成和审查、策略执行、对齐检查、指令调整和 RAG 后处理。它对自我完善的代理也很有用，在这些代理中，持续的反馈有助于随着时间的推移形成更好的响应，从而建立值得信赖的自主决策循环。

常见使用案例

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

编排工作流程

结论