Kit de herramientas de IA responsable Moderación de contenido personalizable

Kit de herramientas de IA responsable y moderación de contenido

Kit de herramientas de IA responsable

Nova Forge proporciona un kit de herramientas de IA responsable que incluye datos de entrenamiento y evaluación para adaptar los modelos con las directrices de IA responsable de Amazon Nova durante el proceso de entrenamiento, y controles de tiempo de ejecución para moderar las respuestas de los modelos durante la inferencia.

Datos de entrenamiento: los casos y escenarios que enfatizan los principios de la IA responsable, los aspectos que se deben tener en cuenta en materia de seguridad y la implementación responsable de la tecnología están disponibles para la mezcla de datos a fin de adaptar los modelos de forma responsable durante el entrenamiento previo continuo.

Evaluaciones: las evaluaciones que prueban la capacidad del modelo para detectar y rechazar contenido inapropiado, dañino o incorrecto están disponibles como una tarea comparativa para determinar la diferencia entre el rendimiento del modelo base y el rendimiento del modelo personalizado.

Controles de tiempo de ejecución: de forma predeterminada, el tiempo de ejecución de Amazon Nova controla las respuestas moderadas del modelo durante la inferencia. Para modificar estos controles de tiempo de ejecución, solicite la configuración de moderación de contenido personalizable de Amazon Nova poniéndose en contacto con un administrador de cuentas de Amazon Web Services.

La seguridad es una responsabilidad compartida entre Amazon Web Services y sus clientes. Cambiar el modelo base o utilizar el entrenamiento previo continuo para mejorar el rendimiento en un caso de uso específico puede repercutir en la seguridad, la imparcialidad y otras propiedades del nuevo modelo. Un método de adaptación sólido minimiza los cambios en la seguridad, la equidad y otras protecciones integradas en los modelos base, minimizando además el impacto en el rendimiento del modelo en tareas fuera del ámbito de personalización. Es necesario realizar pruebas integrales de las aplicaciones con conjuntos de datos representativos de los casos de uso para determinar si los resultados de las pruebas cumplen con las expectativas específicas de seguridad, equidad y demás propiedades, además de la eficacia global. Para obtener más información, consulte la Guía de uso responsable de la IA de Amazon Web Services, la Política de IA responsable de Amazon Web Services, la Política de uso aceptable de Amazon Web Services y los Términos de servicio de Amazon Web Services.

Moderación de contenido personalizable

La configuración de moderación de contenido personalizable (CCMS) permite ajustar los controles en función de los requisitos empresariales y, al mismo tiempo, mantener los controles esenciales y no configurables para garantizar el uso responsable de la IA.

Estos ajustes permiten la generación de contenido por medio de tres configuraciones disponibles:

Solo seguridad
Combinación de seguridad, contenido confidencial y equidad
Todas las categorías combinadas

Las cuatro categorías de moderación de contenido son las siguientes:

Seguridad: abarca las actividades peligrosas, las armas y las sustancias controladas.
Contenido confidencial: incluye blasfemias, desnudos e intimidación.
Equidad: aborda los sesgos y los factores culturales.
Seguridad: implica ciberdelincuencia, malware y contenido malicioso.

Independientemente de la configuración de CCMS, Amazon Nova aplica controles esenciales y no configurables para garantizar el uso responsable de la IA, como los controles para evitar daños a los niños y preservar la privacidad.

Con la CCMS, recomendamos utilizar el entrenamiento previo continuo (CPT) y partir de un punto de control de adaptación previo a la RAI (PRE-TRAINING-Early, PRE-TRAINING-Mid o PRE-TRAINING-Final) en lugar del punto de control de producción totalmente adaptado Estos puntos de control no han pasado por procesos de entrenamiento en materia de seguridad ni han sido ajustados para adoptar comportamientos específicos de RAI, lo que le permite personalizarlos de forma más eficaz para adaptarlos a sus requisitos de moderación de contenido.

sugerencia

Cuando utilice la CCMS para mezclar datos, considere la posibilidad de ajustar el porcentaje de la categoría “rai” en la configuración de nova_data para adaptarlo a sus requisitos específicos de moderación de contenido.

Disponibilidad

Actualmente, la CCMS está disponible para clientes aprobados que usan:

Modelos Amazon Nova Lite 1.0 y Pro 1.0
Inferencia bajo demanda de Amazon Bedrock
La región us-east-1 (Norte de Virginia).

Para habilitar CCMS para sus modelos de Forge, póngase en contacto con un administrador de cuentas de Amazon Web Services.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Refinamiento supervisado

Disponibilidad por región