Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Preparación de los conjuntos de datos de entrenamiento para destilación
Antes de iniciar un trabajo de personalización de modelos, se debe preparar al menos un conjunto de datos de entrenamiento. Para preparar conjuntos de datos para el modelo personalizado, debe crear archivos .jsonl. Cada línea del archivo es un objeto JSON que se corresponde con un registro. Los archivos que cree deben tener el formato de destilación del modelo y modelo que elija. Los registros que contiene también deben cumplir los requisitos de tamaño.
Proporcione los datos de entrada como peticiones. Amazon Bedrock utiliza los datos de entrada para generar respuestas del modelo instructor y utiliza las respuestas generadas para refinar el modelo aprendiz. Para obtener más información sobre las entradas que utiliza Amazon Bedrock y para elegir la opción que mejor se adapte a su caso de uso, consulte Cómo funciona Destilación de modelos de Amazon Bedrock. Hay un par de opciones para preparar el conjunto de datos de entrada.
nota
Los modelos Amazon Nova tienen diferentes requisitos de destilación. Para obtener más información, consulte Destilación de modelos Amazon Nova.
Temas
Modalidades de destilación compatibles
Los modelos enumerados en Modelos y regiones compatibles con Destilación de modelos de Amazon Bedrock. solo admiten la modalidad de texto a texto.
Optimización de sus peticiones de entrada para la generación de datos sintéticos
Durante la destilación de modelos, Amazon Bedrock genera un conjunto de datos sintéticos que utiliza para refinar el modelo aprendiz para su caso de uso específico. Para obtener más información, consulte Cómo funciona Destilación de modelos de Amazon Bedrock.
Puede optimizar el proceso de generación de datos sintéticos formateando las peticiones de entrada para el caso de uso que desee. Por ejemplo, si el caso de uso de su modelo destilado fuera la generación aumentada por recuperación (RAG), formatearía las peticiones de forma diferente que si quisiera que el modelo se centrara en los casos de uso de agentes.
Los siguientes son ejemplos de cómo puede formatear las peticiones de entrada para casos de uso de RAG o agentes.