负责任的人工智能 - Amazon Nova

负责任的人工智能

内容审核设置:Amazon Nova Forge 客户可以为 Amazon Nova Lite 1.0 和 Pro 1.0 模型使用可自定义内容审核设置(CCMS)。CCMS 允许您调整内容审核控制,以符合特定的业务需求,同时保持必要的负责任的人工智能保护措施。要确定业务使用案例是否符合 CCMS 条件,请联系 Amazon Web Services 客户经理。

Amazon Nova Forge 提供负责任的人工智能工具包,其中包括训练数据、评估基准测试和运行时控制,以帮助您使模型符合 Amazon Nova 负责任的人工智能指南。

训练数据:数据混合中的“RAI”类别包含强调负责任的人工智能原则、安全考虑和负责任技术部署的案例和场景。在持续预训练期间,使用这些数据来负责任地使模型对齐。

评估:提供了基准测试任务,用于测试模型检测和拒绝不当、有害或不正确内容的能力。使用这些评估来衡量基础模型性能与自定义模型性能之间的差异。

运行时控制:默认情况下,Amazon Nova 的运行时控制会在推理期间对模型响应进行审核。要针对特定业务案例修改这些控制,请联系 Amazon Web Services 客户经理,申请可自定义内容审核设置(CCMS)。

安全责任共担

安全是 Amazon Web Services 与客户的共同责任。更改基础模型或使用持续预训练来提高特定使用案例的性能,可能会影响新模型的安全性、公平性及其他特性。

我们采用稳健的适配方法,在尽可能保留基础模型原生的安全性、公平性及其他防护机制的同时,同时最大限度地减少未针对性地对模型进行自定义的任务的性能影响。

您有责任做到以下几点:

  • 在代表其使用案例的数据集上,对其应用程序进行端到端测试

  • 判断测试结果是否满足其对安全性、公平性及其他特性的具体要求,以及整体有效性

有关更多信息,请参阅《Amazon Web Services 负责任的人工智能使用指南》、《Amazon Web Services 负责任的人工智能政策》、《AWS 可接受使用政策》以及计划使用的服务的《AWS 服务条款》。

可自定义内容审核设置(CCMS)

CCMS 允许您根据业务需求调整相关控制,与此同时,系统会保留一些不可配置的基本控制,以确保负责任地使用人工智能。

这些设置支持通过以下三种配置实现内容生成:

  • 仅安全管控

  • 安全、敏感内容与公平性联合管控

  • 全类别联合管控

内容审核共分为四大类别:

  1. 安全:涵盖危险活动、武器和管制物质

  2. 敏感内容:包括亵渎言论、裸露内容和欺凌行为

  3. 公平:处理偏见和文化相关问题

  4. 安全:涉及网络犯罪、恶意软件和恶意内容

无论 CCMS 配置如何,Amazon Nova 都会强制执行不可配置的基本控制,以确保负责任地使用人工智能,例如防止对儿童造成伤害和保护隐私的控制。

CCMS 使用建议

使用 CCMS 时,建议使用持续预训练(CPT),从 RAI 对齐前检查点(PRE-TRAINING-Early、PRE-TRAINING-Mid 或 PRE-TRAINING-Final)开始,而不是从 GA/FINAL 检查点开始。这些检查点未经安全训练,也未引导至特定的 RAI 行为,因此您可以根据内容审核要求更有效地对其进行自定义。

提示:将 CCMS 与数据混合结合使用时,请考虑调整 nova_data 配置中的“rai”类别百分比,使其符合特定的内容审核要求。

可用性

CCMS 目前可供已获批准的客户在以下条件下使用:

  • Nova Lite 1.0 和 Pro 1.0 模型

  • Amazon Bedrock 按需推理

  • us-east-1(弗吉尼亚州北部)区域

要为 Forge 模型启用 CCMS,请联系 Amazon Web Services 客户经理。