Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Ajuste los Amazon Nova modelos con ajustes supervisados
Amazon NovaLos datos de la SFT 2.0 utilizan el mismo formato de la API de Converse que en la Amazon Nova versión 1.0, con la adición de campos de contenido de razonamiento opcionales. Para ver las especificaciones de formato completas, consulte el esquema de la ReasoningContentBlockAPI de Converse.
Funciones compatibles:
Tipos de entrada: texto, imagen o vídeo en bloques de contenido de usuario
Contenido de asistente: respuestas y contenido de razonamiento solo de texto
Composición del conjunto de datos: debe ser homogéneo. Elija una de las siguientes opciones: giros de solo texto, giros de texto con imagen o giros de texto con vídeo
importante
No puedes mezclar imágenes y vídeos en el mismo conjunto de datos ni en turnos diferentes.
Limitaciones actuales:
Uso de herramientas: aunque el formato de entrada admite el uso de herramientas, actualmente no lo admite Amazon Nova 2.0 SFT. Añadir secciones de herramientas puede provocar un error en el trabajo.
Contenido de razonamiento multimodal: aunque el formato Converse admite contenido de razonamiento basado en imágenes, la SFT 2.0 no lo admite. Amazon Nova
Conjuntos de validación: es posible que la interfaz de usuario admita proporcionar un conjunto de validación, pero no se admitirá durante el entrenamiento de SFT.
Formatos multimedia compatibles:
Imágenes: PNG, JPEG, GIF
Vídeos: MOV, MKV, MP4
Ejemplos de formatos de datos
Razonamiento del contenido
El contenido de razonamiento (también denominado chain-of-thought) captura los pasos intermedios del pensamiento del modelo antes de generar una respuesta final. assistantA su vez, usa el reasoningContent campo para incluir estas pistas de razonamiento.
Cómo se calcula la pérdida:
Con contenido de razonamiento: la pérdida por entrenamiento incluye tanto las fichas de razonamiento como las de resultado final
Sin contenido razonado: la pérdida de entrenamiento se calcula únicamente sobre las fichas de producción final
Cuándo activar el modo de razonamiento: reasoning_enabled: true Configúralo en tu configuración de entrenamiento cuando desees que el modelo genere señales de pensamiento antes de producir los resultados finales o necesites mejorar el rendimiento en tareas de razonamiento complejas. reasoning_enabled: falseEstablézcalo cuando estés entrenando para realizar tareas sencillas que no se beneficien de pasos de razonamiento explícitos.
nota
Puedes activar el modo de razonamiento independientemente de si los datos de entrenamiento contienen contenido de razonamiento. Sin embargo, se recomienda incluir trazas de razonamiento en los datos de entrenamiento para que el modelo pueda aprender de estos ejemplos y mejorar la calidad del razonamiento.
Pautas de formato:
Usa texto plano para razonar el contenido.
Evite las etiquetas de marcado como
<thinking>y</thinking>a menos que su tarea lo requiera específicamente.Asegúrese de que el contenido del razonamiento sea claro y relevante para el proceso de resolución de problemas.
El contenido de razonamiento efectivo debe incluir:
Pensamientos y análisis intermedios
Deducciones lógicas y pasos de inferencia
Step-by-step enfoques de resolución de problemas
Conexiones explícitas entre los pasos y las conclusiones
Si su conjunto de datos carece de trazas de razonamiento, puede crearlas utilizando un modelo con capacidad de razonamiento como Nova Premier. Proporcione sus pares de entrada-salida al modelo y capture su proceso de razonamiento para crear un conjunto de datos con razonamiento aumentado.
Directrices de preparación del conjunto de datos
La siguiente tabla proporciona pautas para preparar el conjunto de datos de entrenamiento.
| Directriz | Description (Descripción) |
|---|---|
| Tamaño y calidad |
|
| Diversidad |
Incluya diversos ejemplos que hagan lo siguiente:
|
| Formateo de salida |
Especifique claramente el formato de salida deseado en las respuestas del asistente. Los ejemplos incluyen estructuras JSON, tablas, formato CSV o formatos personalizados específicos de su aplicación. |
| Conversaciones de varios turnos |
|
| Lista de control de calidad |
|