

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 将人工反馈整合到代理人工智能系统中
<a name="feedback"></a>

没有哪个系统能百分之百成功，失败必然会发生。每一次失败，都会产生相关的变革成本。*Human in the Loop* 是一种人工智能方法，在这种方法中，人工智能执行任务，但需要人工干预或批准。当失败的成本高于 human-in-the-loop解决方案的成本时，必须使用这种方法。

代理人工智能系统的成功从根本上取决于代理通过人工反馈进行学习和改进的能力。必须考虑人力成本，这取决于所需努力的程度。与执行预定规则的静态自动化工具不同， human-in-the-loop解决方案具有具有学习能力的代理系统，可以在自主代理和人类之间建立动态的伙伴关系。在代理大规模处理日常处理的同时，人类的专业知识不断提高试剂的性能。这种协作方法将 AI 实施从一次性部署转变为持续的优化过程。该系统适应组织模式，内部化质量标准，并根据现实世界的运营经验完善其决策能力。通过系统地捕获人工更正、批准和见解，组织可以构建能够理解背景、识别模式并随着时间的推移越来越多地与业务目标保持一致的人工智能代理。

对于不需要人工干预或支持的解决方案，无需将人为成本考虑在代理经济学中。

## 向人类操作员学习行为
<a name="feedback-behavioral-learning"></a>

人类操作员会提供关键反馈，代理人工智能系统可以利用这些反馈来学习、适应和改善他们的反应。这种反馈回路创建了一个协作环境，在这种环境中，人类的专业知识可以增强代理能力，而代理则可以处理例行处理。

通过人类行为模式识别，代理可以从人际交互模式中学习，以反映成功的沟通方法。这有助于他们适应组织决策模式和风险承受能力。系统通过人工更正和批准将质量预期内在化。他们还可以学习针对不同客户群和业务环境的适当回应。

有效的反馈收集机制可以系统地捕获人工编辑和对代理响应的修改。他们分析了人工审阅者在代理推荐中批准、拒绝或修改的内容。通过了解为什么某些案例需要人工干预，并纳入对不同场景和复杂程度下代理表现的人工评估，这些系统不断完善其能力，以更紧密地与组织标准和期望保持一致。

## 持续学习操作
<a name="feedback-continuous-learning"></a>

*实时学习集成*使代理人工智能系统能够整合人工反馈，并通过动态模型更新立即改善代理的响应。这些系统使用人类洞察力来识别新的模式和边缘案例。这增强了他们的模式识别能力，同时通过人工指导的学习体验来建立组织记忆。基于人工操作员反馈和业务结果的持续改进推动了持续的绩效优化。

*以人为本的培训*可以捕捉专业知识，以增强代理决策能力。它将经验丰富的操作员的关键专业知识转移到人工智能系统。通过基于场景的学习，系统使用人为创建的示例来改善对复杂情况的处理。他们还通过质量校准使代理商的性能标准与人类的质量期望保持一致。这种方法融合了人类对组织文化和客户期望的见解。这种文化适应可以帮助代理人在不同的背景下做出适当的反应。

## 通过人机协作，实现卓越运营
<a name="feedback-human-ai-collab"></a>

*自动风险感知优化*可以持续评估操作条件和错误概率，并对高风险场景进行人工监督。这有助于系统从人类风险评估中吸取教训并改进 future 的决策。[Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-bedrock.html) 提供对具有不同功能和成本状况的多种基础模型的访问权限。这可以实现智能路由，既考虑成本又考虑风险状况，同时纳入人工反馈以优化模型选择。性能调整通过整合人工对质量标准的反馈和可接受的性能权衡来平衡效率和错误率最小化。自动决策考虑了经风险调整后的总拥有成本。运营商提供有关组织风险承受能力和业务优先权衡的指导。这可以帮助您优化成本，同时与组织目标保持一致。

*人工增强型学习系统*根据错误影响和业务后果来优先考虑人工输入。这创建了通过风险加权反馈来了解技术准确性和业务背景的学习系统。定期的绩效分析包括风险指标和错误成本分析，而人工洞察提供了自动化系统无法捕捉的背景信息。最佳实践开发通过将自动模式识别与人类专业知识和判断相结合，强调风险管理和错误预防。通过培训计划进行组织能力建设，既可以培养管理代理人工智能系统的人类技能，也可以培养支持人类决策的代理能力。这确保了人机与人工智能合作的全面方法，从而加强了伙伴关系的两个组成部分。