Refinamiento supervisado (SFT) - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Refinamiento supervisado (SFT)

El proceso de formación de la SFT consta de dos etapas principales:

  • Preparación de datos: siga las pautas establecidas para crear, limpiar o reformatear conjuntos de datos para adaptarlos a la estructura requerida. Asegúrese de que las entradas, las salidas y la información auxiliar (como las pistas de razonamiento o los metadatos) estén alineadas y formateadas correctamente.

  • Configuración del entrenamiento: defina cómo se entrenará el modelo. Cuando se usa SageMaker HyperPod, esta configuración se escribe en un archivo de recetas YAML que incluye:

    • Rutas de origen de datos (conjuntos de datos de entrenamiento y validación)

    • Hiperparámetros clave (épocas, tasa de aprendizaje, tamaño del lote)

    • Componentes opcionales (parámetros de entrenamiento distribuidos, etc.)

Comparación y selección de modelos Nova

Amazon Nova 2.0 es un modelo entrenado en un conjunto de datos más amplio y diverso que Amazon Nova 1.0. Entre las características clave se incluyen las siguientes:

  • Capacidades de razonamiento mejoradas con soporte para el modo de razonamiento explícito

  • Rendimiento multilingüe más amplio en otros idiomas

  • Rendimiento mejorado en tareas complejas, incluida la codificación y el uso de herramientas

  • Manejo ampliado del contexto con mayor precisión y estabilidad en contextos más largos

Cuándo usar Nova 1.0 frente a Nova 2.0

Elija Amazon Nova 2.0 cuando:

  • Se necesita un rendimiento superior con capacidades de razonamiento avanzadas

  • Se requiere soporte multilingüe o un manejo de tareas complejas

  • Se necesitan mejores resultados en las tareas de codificación, uso de herramientas o análisis

Elija Amazon Nova 1.0 cuando:

  • El caso de uso requiere una comprensión del lenguaje estándar sin un razonamiento avanzado

  • El rendimiento ya se ha validado en Amazon Nova 1.0 y no se necesitan capacidades adicionales