Préparation des données pour le peaufinage des modèles de génération de contenu créatif - Amazon Nova

Préparation des données pour le peaufinage des modèles de génération de contenu créatif

Vous trouverez ci-dessous les directives et les exigences relatives à la préparation des données pour le peaufinage des modèles de génération de contenu créatif.

  1. La quantité optimale de données d’entraînement dépend de la complexité de la tâche et du résultat souhaité.

    • Augmenter la variété et le volume de vos données d’entraînement peut améliorer la précision du modèle.

    • Plus vous utilisez d’images, plus le peaufinage peut prendre du temps.

    • Le nombre d’images augmente le coût du peaufinage. Pour plus d’informations, consultez Tarification Amazon Bedrock.

  2. Les jeux de données d’entraînement et de validation doivent être des fichiers JSONL, où chaque ligne est un objet JSON correspondant à un enregistrement. Les noms de ces fichiers ne peuvent contenir que des caractères alphanumériques, des traits de soulignement, des tirets, des barres obliques et des points.

  3. Chaque enregistrement de votre JSONL doit inclure un attribut image-ref avec l’URI Amazon S3 d’une image et un attribut caption avec une invite pour l’image. Les images doivent être au format JPEG ou PNG. Pour obtenir des exemples, veuillez consulter  Format requis pour les jeux de données.

  4. Vos jeux de données d’entraînement et de validation doivent être conformes aux exigences de taille répertoriées dans Contraintes liées aux jeux de données.

  5. Votre rôle de service Amazon Bedrock doit pouvoir accéder aux fichiers image dans Amazon S3. Pour plus d’informations sur l’octroi d’accès, consultez Créer un rôle de service pour la personnalisation du modèle.

Format requis pour les jeux de données

Vous trouverez ci-dessous le format requis pour vos fichiers JSONL.

{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}

Voici un exemple d’enregistrement :

{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}

Contraintes liées aux jeux de données

Voici les contraintes relatives aux jeux de données pour le peaufinage d’Amazon Nova Canvas. Amazon Nova Reel ne prend pas en charge le peaufinage.

Exigences de taille pour les jeux de données d’entraînement et de validation

Minimum

Maximum

Enregistrements dans un jeu de données d’entraînement

5

10 000

Longueur de l’invite textuelle dans l’échantillon d’entraînement, en caractères

3

1,024

Contraintes de taille des images d’entrée

Minimum

Maximum

Input image size 0 50 MB
Input image height in pixels 512 4,096
Input image width in pixels 512 4,096
Input image total pixels 0 12,582,912
Input image aspect ratio 1:4 4:1

Formats multimédias pris en charge

  • PNG

  • JPEG