Préparation des données pour le peaufinage des modèles de génération de contenu créatif
Vous trouverez ci-dessous les directives et les exigences relatives à la préparation des données pour le peaufinage des modèles de génération de contenu créatif.
-
La quantité optimale de données d’entraînement dépend de la complexité de la tâche et du résultat souhaité.
-
Augmenter la variété et le volume de vos données d’entraînement peut améliorer la précision du modèle.
-
Plus vous utilisez d’images, plus le peaufinage peut prendre du temps.
-
Le nombre d’images augmente le coût du peaufinage. Pour plus d’informations, consultez Tarification Amazon Bedrock
.
-
-
Les jeux de données d’entraînement et de validation doivent être des fichiers JSONL, où chaque ligne est un objet JSON correspondant à un enregistrement. Les noms de ces fichiers ne peuvent contenir que des caractères alphanumériques, des traits de soulignement, des tirets, des barres obliques et des points.
-
Chaque enregistrement de votre JSONL doit inclure un attribut
image-refavec l’URI Amazon S3 d’une image et un attributcaptionavec une invite pour l’image. Les images doivent être au format JPEG ou PNG. Pour obtenir des exemples, veuillez consulter Format requis pour les jeux de données. -
Vos jeux de données d’entraînement et de validation doivent être conformes aux exigences de taille répertoriées dans Contraintes liées aux jeux de données.
-
Votre rôle de service Amazon Bedrock doit pouvoir accéder aux fichiers image dans Amazon S3. Pour plus d’informations sur l’octroi d’accès, consultez Créer un rôle de service pour la personnalisation du modèle.
Format requis pour les jeux de données
Vous trouverez ci-dessous le format requis pour vos fichiers JSONL.
{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}
Voici un exemple d’enregistrement :
{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}
Contraintes liées aux jeux de données
Voici les contraintes relatives aux jeux de données pour le peaufinage d’Amazon Nova Canvas. Amazon Nova Reel ne prend pas en charge le peaufinage.
Exigences de taille pour les jeux de données d’entraînement et de validation
Minimum |
Maximum |
|
|---|---|---|
Enregistrements dans un jeu de données d’entraînement |
5 |
10 000 |
Longueur de l’invite textuelle dans l’échantillon d’entraînement, en caractères |
3 |
1,024 |
Contraintes de taille des images d’entrée
Minimum |
Maximum |
|
|---|---|---|
| Input image size | 0 | 50 MB |
| Input image height in pixels | 512 | 4,096 |
| Input image width in pixels | 512 | 4,096 |
| Input image total pixels | 0 | 12,582,912 |
| Input image aspect ratio | 1:4 | 4:1 |
Formats multimédias pris en charge
-
PNG
-
JPEG