Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Prepara tus conjuntos de datos de entrenamiento para ajustarlos y continuar con el entrenamiento previo
Para preparar conjuntos de datos de entrenamiento y validación para su modelo personalizado, debe crear .jsonl
archivos en los que cada línea es un objeto JSON correspondiente a un registro. Antes de comenzar un trabajo de personalización del modelo, debe preparar como mínimo un conjunto de datos de entrenamiento. Los archivos que cree deben ajustarse al formato del método y modelo de personalización que elija. Los registros que contiene deben ajustarse a los requisitos de tamaño según el modelo.
Para obtener información sobre los requisitos del modelo, consulte. Requisitos de modelo para conjuntos de datos de entrenamiento y validación Para ver las cuotas predeterminadas que se aplican a los conjuntos de datos de entrenamiento y validación utilizados para personalizar diferentes modelos, consulte la Suma de las cuotas de los registros de entrenamiento y validación en los Amazon Bedrock endpoints and quotas en la Referencia general de AWS.
La compatibilidad con un conjunto de datos de validación y el formato del conjunto de datos de entrenamiento y validación dependen de los siguientes factores.
-
El tipo de trabajo de personalización de ajustes (ajuste preciso o formación previa continua).
-
Las modalidades de entrada y salida de los datos.
Temas
Modalidades compatibles para el ajuste fino y la formación previa continua
Requisitos de modelo para conjuntos de datos de entrenamiento y validación
Prepare los datos para ajustar con precisión los modelos de procesamiento de imágenes y texto
Prepare los datos para ajustar con precisión los modelos de generación e incrustación de imágenes
Prepare conjuntos de datos para la formación previa continua
Modalidades compatibles para el ajuste fino y la formación previa continua
En las siguientes secciones se describen las diferentes capacidades de ajuste y preentrenamiento que admite cada modelo, organizadas por sus modalidades de entrada y salida. Para obtener información sobre los modelos de ajuste fino, consulte Amazon Nova Modelos de ajuste fino. Amazon Nova
Modelos de Text-to-Text
Text-to-Text los modelos se pueden ajustar para diversas tareas basadas en texto, incluidas las aplicaciones conversacionales y no conversacionales. Para obtener información sobre la preparación de datos para ajustar los modelos, consulte. Text-to-Text Prepare los datos para ajustar los modelos text-to-text
Los siguientes modelos no conversacionales están optimizados para tareas como el resumen, la traducción y la respuesta a preguntas:
Amazon Titan Text G1 - Express
Amazon Titan Text G1 - Lite
Amazon Titan Text Premier
Cohere Command
Cohere Command Light
Meta Llama 3.1 8B Instruct
Meta Llama 3.1 70B Instruct
Los siguientes modelos conversacionales están diseñados para interacciones de un solo turno y de varios turnos. Si un modelo usa la API de Converse, el conjunto de datos de ajuste debe seguir el formato de mensaje de la API de Converse e incluir los mensajes del sistema, del usuario y del asistente. Para ver ejemplos, consulta Prepare los datos para ajustar los modelos text-to-text. Para obtener más información sobre las operaciones de la API de Converse, consulte. Mantén una conversación con las operaciones de la Converse API
Haiku de Anthropic Claude 3
MetaLlama 3.2 1B Instruct(Formato API de Converse)
MetaLlama 3.2 3B Instruct(Formato API de Converse)
MetaLlama 3.2 11B InstructVision (formato de API de Converse)
MetaLlama 3.2 90B InstructVision (formato de API de Converse)
Text-Image-to-Text & Text-to-Image modelo s
Los siguientes modelos admiten ajustes precisos para la generación de imágenes y el procesamiento de imágenes de texto. Estos modelos procesan o generan imágenes a partir de entradas textuales, o generan texto a partir de entradas textuales y de imágenes. Para obtener información sobre la preparación de datos para ajustar Text-Image-to-Text y Text-to-Image modelar modelos, consulte. Prepare los datos para ajustar con precisión los modelos de procesamiento de imágenes y texto
Amazon Titan Image Generator G1 V1
MetaLlama 3.2 11B InstructVisión
MetaLlama 3.2 90B InstructVisión
Imágenes para incrustar
Los siguientes modelos permiten realizar ajustes precisos para tareas como la clasificación y la recuperación. Estos modelos generan representaciones numéricas (incrustaciones) a partir de entradas de imágenes. Para obtener información sobre la preparación de datos para ajustar Image-to-Embeddings los modelos, consulte. Prepare los datos para ajustar con precisión los modelos de generación e incrustación de imágenes
Amazon Titan Multimodal Embeddings G1
Amazon Titan Image Generator G1 V1
Formación previa continua: Text-to-Text
Los siguientes modelos se pueden utilizar para la formación previa continua. Estos modelos permiten una formación previa continua sobre datos de dominios específicos para mejorar sus conocimientos básicos. Para obtener información sobre cómo preparar los datos para la formación previa continua de modelos, consulte. Text-to-Text Prepare conjuntos de datos para la formación previa continua
Amazon Titan Text G1 - Express
Amazon Titan Text G1 - Lite