Refinamiento supervisado (SFT) - Amazon Nova

Refinamiento supervisado (SFT)

El proceso de entrenamiento SFT consta de dos pasos principales:

  • Preparación de datos: siga las pautas establecidas para crear, limpiar o reformatear conjuntos de datos para adaptarlos a la estructura requerida. Asegúrese de que las entradas, las salidas y la información auxiliar (como las pistas de razonamiento o los metadatos) estén adaptadas y formateadas correctamente.

  • Configuración del entrenamiento: defina cómo se entrenará el modelo. Cuando se usa Amazon SageMaker HyperPod, esta configuración se escribe en un archivo de fórmulas YAML que incluye:

    • Rutas de orígenes de datos (conjuntos de datos de entrenamiento y validación)

    • Hiperparámetros clave (épocas, ritmo de aprendizaje, tamaño del lote)

    • Componentes opcionales (parámetros de entrenamiento distribuidos, etc.)

Comparación y selección de modelos de Nova

Amazon Nova 2.0 es un modelo entrenado en un conjunto de datos más amplio y diverso que Amazon Nova 1.0. Entre las características clave se incluyen las siguientes:

  • Capacidades de razonamiento mejoradas que admiten el modo de razonamiento explícito

  • Rendimiento multilingüe más amplio en varios otros idiomas

  • Rendimiento mejorado en tareas complejas, como la codificación y el uso de herramientas

  • Gestión ampliada del contexto con mayor precisión y estabilidad en contextos más largos

Cuándo usar Nova 1.0 en lugar de Nova 2.0

Elija Amazon Nova 1.0 en las siguientes situaciones:

  • El caso de uso requiere una comprensión del lenguaje estándar sin un razonamiento avanzado.

  • El rendimiento ya se ha validado en Amazon Nova 1.0 y no se necesitan capacidades adicionales.