负责任的人工智能工具包和内容审核

负责任的人工智能工具包

Nova Forge 提供了负责任的人工智能工具包，其中包含训练和评估数据，可在训练过程中使模型符合 Amazon Nova 负责任的人工智能指南，并在推理过程中实施运行时控制以调节模型响应。

训练数据：强调负责任的人工智能原则、安全考虑和负责任技术部署的案例和场景可用于数据混合，以便在持续预训练期间负责任地使模型对齐。

评估：用于测试模型检测和拒绝不当、有害或不正确内容能力的评估，作为一项基准测试任务提供，以确定基础模型性能与自定义模型性能之间的差异。

运行时控制：默认情况下，Amazon Nova 的运行时控制会在推理期间对模型响应进行审核。要修改这些运行时控制，请联系 Amazon Web Services 客户经理，申请 Amazon Nova 的可自定义内容审核设置。

安全是 Amazon Web Services 与用户的共同责任。更改基础模型或使用持续预训练来提高特定使用案例的性能，可能会影响新模型的安全性、公平性及其他特性。一种稳健的适应方法，可以最大限度地减少对基础模型中内置的安全性、公平性及其他保护措施的更改，同时最大限度地减少对模型未经自定义的任务的性能影响。需要对在代表使用案例的数据集上的应用程序进行端到端测试，以确定测试结果是否符合对安全性、公平性及其他属性的特定期望，以及整体有效性。有关更多信息，请参阅《Amazon Web Services 负责任的人工智能使用指南》、《Amazon Web Services 负责任的人工智能政策》、《Amazon Web Services 可接受使用政策》以及《Amazon Web Services 服务条款》。

可自定义内容审核

可自定义的内容审核设置（CCMS）允许调整与业务需求相关的控制，同时保持不可配置的基本控制，以确保负责任地使用人工智能。

这些设置支持通过以下三种配置实现内容生成：

仅安全管控
安全、敏感内容与公平性联合管控
全类别联合管控

内容审核共分为四大类别：

安全：涵盖危险活动、武器和管制物质
敏感内容：包括亵渎言论、裸露内容和欺凌行为
公平：处理偏见和文化相关问题
安全：涉及网络犯罪、恶意软件和恶意内容

无论 CCMS 配置如何，Amazon Nova 都会强制执行不可配置的基本控制，以确保负责任地使用人工智能，例如防止对儿童造成伤害和保护隐私的控制。

使用 CCMS 时，建议使用持续预训练（CPT），从预 RAI 对齐检查点（部分或完全预训练的仅文本）开始，而不是从完全对齐的生产检查点开始。这些检查点未经安全训练，也未引导至特定的 RAI 行为，因此您可以根据内容审核要求更有效地对其进行自定义。

提示

将 CCMS 与数据混合结合使用时，请考虑调整 nova_data 配置中的“rai”类别百分比，使其符合特定的内容审核要求。

可用性

CCMS 目前可供已获批准的客户在以下条件下使用：

Amazon Nova Lite 1.0 和 Pro 1.0 模型
Amazon Bedrock 按需推理
us-east-1（弗吉尼亚州北部）区域

要为 Forge 模型启用 CCMS，请联系 Amazon Web Services 客户经理。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

监督式微调

区域可用性