Prepara tus conjuntos de datos de entrenamiento para ajustarlos y continuar con el entrenamiento previo - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Prepara tus conjuntos de datos de entrenamiento para ajustarlos y continuar con el entrenamiento previo

Para preparar conjuntos de datos de entrenamiento y validación para su modelo personalizado, debe crear .jsonl archivos en los que cada línea es un objeto JSON correspondiente a un registro. Antes de comenzar un trabajo de personalización del modelo, debe preparar como mínimo un conjunto de datos de entrenamiento. Los archivos que cree deben ajustarse al formato del método y modelo de personalización que elija. Los registros que contiene deben ajustarse a los requisitos de tamaño según el modelo.

Para obtener información sobre los requisitos del modelo, consulte. Requisitos de modelo para conjuntos de datos de entrenamiento y validación Para ver las cuotas predeterminadas que se aplican a los conjuntos de datos de entrenamiento y validación utilizados para personalizar diferentes modelos, consulte la Suma de las cuotas de los registros de entrenamiento y validación en los Amazon Bedrock endpoints and quotas en la Referencia general de AWS.

La compatibilidad con un conjunto de datos de validación y el formato del conjunto de datos de entrenamiento y validación dependen de los siguientes factores.

  • El tipo de trabajo de personalización de ajustes (ajuste preciso o formación previa continua).

  • Las modalidades de entrada y salida de los datos.

Para obtener información sobre los modelos de ajuste fino, consulte Modelos de ajuste finoAmazon Nova. Amazon Nova

Modalidades compatibles para el ajuste fino y la formación previa continua

En las siguientes secciones se describen las diferentes capacidades de ajuste y preentrenamiento que admite cada modelo, organizadas por sus modalidades de entrada y salida. Para obtener información sobre los modelos de ajuste fino, consulte Amazon Nova Modelos de ajuste fino. Amazon Nova

Modelos de Text-to-Text  

Text-to-Text los modelos se pueden ajustar para diversas tareas basadas en texto, incluidas las aplicaciones conversacionales y no conversacionales. Para obtener información sobre la preparación de datos para ajustar los modelos, consulte. Text-to-Text Prepare los datos para ajustar los modelos text-to-text

Los siguientes modelos no conversacionales están optimizados para tareas como el resumen, la traducción y la respuesta a preguntas:

  • Amazon Titan Text G1 - Express

  • Amazon Titan Text G1 - Lite

  • Amazon Titan Text Premier

  • Cohere Command

  • Cohere Command Light

  • Meta Llama 3.1 8B Instruct

  • Meta Llama 3.1 70B Instruct

Los siguientes modelos conversacionales están diseñados para interacciones de un solo turno y de varios turnos. Si un modelo usa la API de Converse, el conjunto de datos de ajuste debe seguir el formato de mensaje de la API de Converse e incluir los mensajes del sistema, del usuario y del asistente. Para ver ejemplos, consulta Prepare los datos para ajustar los modelos text-to-text. Para obtener más información sobre las operaciones de la API de Converse, consulte. Mantén una conversación con las operaciones de la Converse API

  • Haiku de Anthropic Claude 3

  • MetaLlama 3.2 1B Instruct(Formato API de Converse)

  • MetaLlama 3.2 3B Instruct(Formato API de Converse)

  • MetaLlama 3.2 11B InstructVision (formato de API de Converse)

  • MetaLlama 3.2 90B InstructVision (formato de API de Converse)

Text-Image-to-Text & Text-to-Image modelo s

Los siguientes modelos admiten ajustes precisos para la generación de imágenes y el procesamiento de imágenes de texto. Estos modelos procesan o generan imágenes a partir de entradas textuales, o generan texto a partir de entradas textuales y de imágenes. Para obtener información sobre la preparación de datos para ajustar Text-Image-to-Text y Text-to-Image modelar modelos, consulte. Prepare los datos para ajustar con precisión los modelos de procesamiento de imágenes y texto

  • Amazon Titan Image Generator G1 V1

  • MetaLlama 3.2 11B InstructVisión

  • MetaLlama 3.2 90B InstructVisión

Imágenes para incrustar

Los siguientes modelos permiten realizar ajustes precisos para tareas como la clasificación y la recuperación. Estos modelos generan representaciones numéricas (incrustaciones) a partir de entradas de imágenes. Para obtener información sobre la preparación de datos para ajustar Image-to-Embeddings los modelos, consulte. Prepare los datos para ajustar con precisión los modelos de generación e incrustación de imágenes

  • Amazon Titan Multimodal Embeddings G1

  • Amazon Titan Image Generator G1 V1

Formación previa continua: Text-to-Text

Los siguientes modelos se pueden utilizar para la formación previa continua. Estos modelos permiten una formación previa continua sobre datos de dominios específicos para mejorar sus conocimientos básicos. Para obtener información sobre cómo preparar los datos para la formación previa continua de modelos, consulte. Text-to-Text Prepare conjuntos de datos para la formación previa continua

  • Amazon Titan Text G1 - Express

  • Amazon Titan Text G1 - Lite