Preparación de datos para el afinamiento de los modelos de generación de contenido creativo
A continuación se presentan las directrices y los requisitos para preparar datos para el afinamiento de los modelos de generación de contenido creativo.
-
La cantidad óptima de datos de entrenamiento depende de la complejidad de la tarea y del resultado deseado.
-
Aumentar la variedad y el volumen de los datos de entrenamiento puede mejorar la precisión del modelo.
-
Cuantas más imágenes utilice, más tiempo tardará en completarse el trabajo de afinamiento.
-
El número de imágenes aumenta el costo del afinamiento. Para obtener más información, consulte Precios de Amazon Bedrock
.
-
-
Los conjuntos de datos de entrenamiento y validación deben ser archivos JSONL, donde cada línea es un objeto JSON que corresponde a un registro. Estos nombres de archivo solo pueden estar compuestos por caracteres alfanuméricos, guiones bajos, guiones, barras y puntos.
-
Cada registro del archivo JSONL debe incluir un atributo
image-ref
con el URI de Amazon S3 de una imagen y un atributocaption
con una petición para la imagen. Las imágenes deben tener formato PNG o JPEG. Para ver ejemplos, consulta Formato del conjunto de datos requerido. -
Sus conjuntos de datos de entrenamiento y validación deben cumplir con los requisitos de tamaño que se indican en Restricciones del conjunto de datos.
-
Su rol de servicio de Amazon Bedrock debe poder acceder a los archivos de imágenes en Amazon S3. Para obtener más información sobre la concesión de acceso, consulte Crear un rol de servicio para la personalización del modelo.
Formato del conjunto de datos requerido
A continuación, se muestra el formato requerido para sus archivos JSONL.
{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}
A continuación, se muestra un ejemplo de registro:
{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}
Restricciones del conjunto de datos
Las siguientes son las restricciones de los conjuntos de datos para el afinamiento de Amazon Nova Canvas. Amazon Nova Reel no admite el afinamiento.
Requisitos de tamaño para los conjuntos de datos de entrenamiento y validación
Mínimo |
Máximo |
|
---|---|---|
Registros en un conjunto de datos de entrenamiento |
5 |
10 000 |
Longitud de la petición de texto en el ejemplo de entrenamiento, en caracteres |
3 |
1 024 |
Restricciones de tamaño de la imagen de entrada
Mínimo |
Máximo |
|
---|---|---|
Input image size | 0 | 50 MB |
Input image height in pixels | 512 | 4,096 |
Input image width in pixels | 512 | 4,096 |
Input image total pixels | 0 | 12,582,912 |
Input image aspect ratio | 1:4 | 4:1 |
Formatos multimedia compatibles
-
PNG
-
JPEG