本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
9. Governance
机器学习治理包括一组有助于部署机器学习模型的流程和框架。它包括模型的可解释性、可审计性、可追溯性以及成功 end-to-end机器学习生命周期的其他更抽象但必不可少的要求。
9.1 数据质量和合规性 |
机器学习系统考虑了个人身份信息(PII)的注意事项,包括匿名化。它记录并审查了列级血统,以了解数据的来源、质量和适当性。还具有针对异常情况的自动数据质量检查功能。 |
9.2 审计和文档 |
机器学习系统具有开发过程中所有更改的完整日志,包括运行的试验以及为监管合规性而做出选择的原因。 |
9.3 可重复性和可追溯性 |
机器学习系统包括完整的数据快照,用于精确、快速地重新实例化模型,或者它能够重新创建环境并使用数据样本进行重新训练。 |
9.4 签收 Human-in-the-loop |
机器学习系统具有手动验证和授权功能,可确保合规性。系统要求每一次环境移动(例如,开发、QA、预生产和生产)都需要签核。 |
9.5 偏差和对抗性攻击测试 |
机器学习系统使用多种工具和攻击向量进行红队对抗性测试,并对特定亚群进行自动偏差检查。此组件与“可观测性和模型管理”部分相关联。 |