负责任的人工智能工具包和内容审核
负责任的人工智能工具包
Nova Forge 提供了负责任的人工智能工具包,其中包含训练和评估数据,可在训练过程中使模型符合 Amazon Nova 负责任的人工智能指南,并在推理过程中实施运行时控制以调节模型响应。
训练数据:强调负责任的人工智能原则、安全考虑和负责任技术部署的案例和场景可用于数据混合,以便在持续预训练期间负责任地使模型对齐。
评估:用于测试模型检测和拒绝不当、有害或不正确内容能力的评估,作为一项基准测试任务提供,以确定基础模型性能与自定义模型性能之间的差异。
运行时控制:默认情况下,Amazon Nova 的运行时控制会在推理期间对模型响应进行审核。要修改这些运行时控制,请联系 Amazon Web Services 客户经理,申请 Amazon Nova 的可自定义内容审核设置。
安全是 Amazon Web Services 与用户的共同责任。更改基础模型或使用持续预训练来提高特定使用案例的性能,可能会影响新模型的安全性、公平性及其他特性。一种稳健的适应方法,可以最大限度地减少对基础模型中内置的安全性、公平性及其他保护措施的更改,同时最大限度地减少对模型未经自定义的任务的性能影响。需要对在代表使用案例的数据集上的应用程序进行端到端测试,以确定测试结果是否符合对安全性、公平性及其他属性的特定期望,以及整体有效性。有关更多信息,请参阅《Amazon Web Services 负责任的人工智能使用指南》、《Amazon Web Services 负责任的人工智能政策》、《Amazon Web Services 可接受使用政策》以及《Amazon Web Services 服务条款》。
可自定义内容审核
可自定义的内容审核设置(CCMS)允许调整与业务需求相关的控制,同时保持不可配置的基本控制,以确保负责任地使用人工智能。
这些设置支持通过以下三种配置实现内容生成:
仅安全管控
安全、敏感内容与公平性联合管控
全类别联合管控
内容审核共分为四大类别:
-
安全:涵盖危险活动、武器和管制物质
-
敏感内容:包括亵渎言论、裸露内容和欺凌行为
-
公平:处理偏见和文化相关问题
-
安全:涉及网络犯罪、恶意软件和恶意内容
无论 CCMS 配置如何,Amazon Nova 都会强制执行不可配置的基本控制,以确保负责任地使用人工智能,例如防止对儿童造成伤害和保护隐私的控制。
使用 CCMS 时,建议使用持续预训练(CPT),从预 RAI 对齐检查点(部分或完全预训练的仅文本)开始,而不是从完全对齐的生产检查点开始。这些检查点未经安全训练,也未引导至特定的 RAI 行为,因此您可以根据内容审核要求更有效地对其进行自定义。
提示
将 CCMS 与数据混合结合使用时,请考虑调整 nova_data 配置中的“rai”类别百分比,使其符合特定的内容审核要求。
可用性
CCMS 目前可供已获批准的客户在以下条件下使用:
Amazon Nova Lite 1.0 和 Pro 1.0 模型
Amazon Bedrock 按需推理
us-east-1(弗吉尼亚州北部)区域
要为 Forge 模型启用 CCMS,请联系 Amazon Web Services 客户经理。