

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 赋值器的工作流程和反射优化循环
<a name="workflow-for-evaluators-and-reflect-refine-loops"></a>

该工作流程提供了一个反馈循环，其中一个 LLM 生成结果，另一个法学硕士评估或批评结果。这促进了自我反思、优化和迭代改进。

![评估人员的工作流程。](http://docs.aws.amazon.com/zh_cn/prescriptive-guidance/latest/agentic-ai-patterns/images/workflow-patterns-evaluator-reflect-refine-feedback-loop.png)


评估器工作流程非常适合输出质量、准确性和对齐性很重要，以及单通道生成不可靠或不足的场景。当工程师必须自我批评、迭代和完善其输出时，这种工作流程非常出色，要么是为了达到更高的正确性标准，要么是为了根据反馈探索改进的替代方案。

在以下情况下，此工作流程特别有效：
+ 输出涉及主观质量指标（例如风格、语气和可读性）或客观标准（例如正确性、安全性和性能）。
+ 代理必须权衡推理、评估约束条件或针对目标进行优化。
+ 您需要内置的冗余和质量保证，尤其是在受管制、面向客户或创意领域。
+ Human-in-the-loop 审核费用昂贵或不可用，需要自主验证。

此工作流程用于内容生成、代码合成和审查、策略执行、对齐检查、指令调整和 RAG 后处理。它对自我完善的代理也很有用，在这些代理中，持续的反馈有助于随着时间的推移形成更好的响应，从而建立值得信赖的自主决策循环。

## 常见使用案例
<a name="common-use-cases-evaluators"></a>
+ 红队特工与蓝队经纪人的比较
+ 生成、评估和修改代码或计划的代理
+ 质量保证、幻觉检测和风格强制执行

## 功能
<a name="capabilities-evaluators"></a>
+ 支持使用不同的模型进行解耦生成和评估（例如，Claude 用于生成，Mistral 用于评估）
+ 反馈是结构化的，用于提示修改后的产出
+ 支持多次迭代或收敛阈值