Preparación de datos para el afinamiento de los modelos de generación de contenido creativo - Amazon Nova

Preparación de datos para el afinamiento de los modelos de generación de contenido creativo

A continuación se presentan las directrices y los requisitos para preparar datos para el afinamiento de los modelos de generación de contenido creativo.

  1. La cantidad óptima de datos de entrenamiento depende de la complejidad de la tarea y del resultado deseado.

    • Aumentar la variedad y el volumen de los datos de entrenamiento puede mejorar la precisión del modelo.

    • Cuantas más imágenes utilice, más tiempo tardará en completarse el trabajo de afinamiento.

    • El número de imágenes aumenta el costo del afinamiento. Para obtener más información, consulte Precios de Amazon Bedrock.

  2. Los conjuntos de datos de entrenamiento y validación deben ser archivos JSONL, donde cada línea es un objeto JSON que corresponde a un registro. Estos nombres de archivo solo pueden estar compuestos por caracteres alfanuméricos, guiones bajos, guiones, barras y puntos.

  3. Cada registro del archivo JSONL debe incluir un atributo image-ref con el URI de Amazon S3 de una imagen y un atributo caption con una petición para la imagen. Las imágenes deben tener formato PNG o JPEG. Para ver ejemplos, consulta Formato del conjunto de datos requerido.

  4. Sus conjuntos de datos de entrenamiento y validación deben cumplir con los requisitos de tamaño que se indican en Restricciones del conjunto de datos.

  5. Su rol de servicio de Amazon Bedrock debe poder acceder a los archivos de imágenes en Amazon S3. Para obtener más información sobre la concesión de acceso, consulte Crear un rol de servicio para la personalización del modelo.

Formato del conjunto de datos requerido

A continuación, se muestra el formato requerido para sus archivos JSONL.

{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}

A continuación, se muestra un ejemplo de registro:

{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}

Restricciones del conjunto de datos

Las siguientes son las restricciones de los conjuntos de datos para el afinamiento de Amazon Nova Canvas. Amazon Nova Reel no admite el afinamiento.

Requisitos de tamaño para los conjuntos de datos de entrenamiento y validación

Mínimo

Máximo

Registros en un conjunto de datos de entrenamiento

5

10 000

Longitud de la petición de texto en el ejemplo de entrenamiento, en caracteres

3

1 024

Restricciones de tamaño de la imagen de entrada

Mínimo

Máximo

Input image size 0 50 MB
Input image height in pixels 512 4,096
Input image width in pixels 512 4,096
Input image total pixels 0 12,582,912
Input image aspect ratio 1:4 4:1

Formatos multimedia compatibles

  • PNG

  • JPEG