Génération et édition d’images - Amazon Nova

Génération et édition d’images

Amazon Nova Canvas est disponible via l’API InvokeModel de Bedrock et prend en charge les paramètres d’inférence et les réponses de modèle suivants lors de l’exécution de l’inférence de modèle.

Format de demande et de réponse pour la génération d’images

Lorsque vous effectuez un appel InvokeModel à l’aide du modèle Amazon Nova Canvas, remplacez le champ body de la demande par le format correspondant à votre cas d’utilisation. Toutes les tâches partagent un objet imageGenerationConfig, mais chaque tâche a un objet paramètres spécifique. Les cas d’utilisation suivants sont pris en charge :

Type de tâche Valeur Champ de paramètre de tâche Catégorie de tâche Description
TEXT_IMAGE avec texte uniquement textToImageParams Génération Générez une image à l’aide d’une invite de texte.
TEXT_IMAGE avec conditionnement d’image textToImageParams Génération Fournissez une image de conditionnement d’entrée ainsi qu’une invite de texte pour générer une image conforme à la mise en page et à la composition de l’image de conditionnement.
COLOR_GUIDED_GENERATION colorGuidedGenerationParams Génération Fournissez une liste de valeurs de couleurs au format hexadécimal (par exemple #FF9800) ainsi qu’une invite textuelle et une image de référence facultative pour générer une image qui respecte la palette de couleurs spécifiée.
IMAGE_VARIATION imageVariationParams Génération Fournissez une ou plusieurs images d’entrée, avec ou sans invite textuelle, pour influencer l’image générée. Peut être utilisé pour influencer le style visuel de l’image générée (lorsqu’il est utilisé avec une invite textuelle), pour générer des variations d’une seule image (lorsqu’il est utilisé sans invite textuelle) et pour d’autres effets créatifs et contrôles.
INPAINTING inPaintingParams Modification Modifiez une image en changeant la zone à l’intérieur d’une région masquée. Peut être utilisé pour ajouter, supprimer ou remplacer des éléments d’une image.
OUTPAINTING outPaintingParams Modification Modifiez une image en changeant la zone à l’extérieur d’une région masquée. Peut être utilisé pour remplacer l’arrière-plan derrière un sujet.
BACKGROUND_REMOVAL backgroundRemovalParams Modification Supprimez automatiquement l’arrière-plan de n’importe quelle image, en le remplaçant par des pixels transparents. Peut être utile lorsque vous voulez ensuite composer l’image avec d’autres éléments dans une application d’édition d’images, une présentation ou un site web. L’arrière-plan peut également être facilement remplacé par une couleur unie à l’aide d’un code personnalisé.
VIRTUAL_TRY_ON virtualTryOnParams Modification Fournissez une image source et une image de référence, en superposant un objet de l’image de référence sur l’image source. Peut être utilisé pour visualiser des vêtements et des accessoires sur différents modèles ou dans différentes poses, modifier le style et l’apparence d’un objet, d’un article ou d’un vêtement, ou transférer des styles et des designs d’un objet à un autre.

Images d’entrée pour la génération d’images

De nombreux types de tâches nécessitent qu’une ou plusieurs images d’entrée soient incluses dans la demande. Toute image utilisée dans la demande doit être encodée sous forme de chaîne Base64. En général, les images peuvent être au format PNG ou JPEG et doivent être de 8 bits par canal de couleur (RVB). Les images PNG peuvent contenir un canal alpha supplémentaire, mais ce canal ne doit contenir aucun pixel transparent ou translucide. Pour plus de détails sur les dimensions des images d’entrée prises en charge, consultez Résolutions d’image prises en charge.

Une image de masque est une image qui indique la zone à retoucher ou à peindre. Cette image ne peut contenir que des pixels noirs et blancs purs.

Pour les demandes de retouche, la zone colorée en noir est appelée le masque et sera modifiée. Le reste de l’image de masque ne doit contenir que des pixels blancs purs. Les pixels blancs purs indiquent la zone située à l’extérieur du masque.

Pour les demandes de retouche, la zone colorée en blanc sera modifiée par le modèle.

Les images de masque ne doivent contenir aucun pixel qui ne soit ni noir pur ni blanc pur. Si vous utilisez une image JPEG comme masque, celle-ci doit être compressée à 100 % de qualité afin d’éviter l’introduction de pixels non blancs ou non noirs lors de la compression.

Pour des exemples sur la manière d’encoder ou de décoder une image vers ou à partir d’une chaîne Base64, consultez les exemples de code.

Masquer des images

Lorsque vous modifiez une image, un masque permet de définir les zones à modifier. Vous pouvez définir un masque de trois manières différentes :

  • maskPrompt : rédigez une invite de texte en langage naturel décrivant la ou les parties de l’image à masquer.

  • maskImage : une image en noir et blanc où les pixels noirs purs indiquent la zone à l’intérieur du masque et les pixels blancs purs indiquent la zone à l’extérieur du masque.

    Pour les demandes de retouche, les pixels noirs seront modifiés par le modèle. Pour les demandes de retouche, les pixels blancs seront modifiés.

  • garmentBasedMask : un masque basé sur une image qui définit une zone à remplacer avec quelques options de style limitées.

Vous pouvez utiliser un outil de retouche photo pour dessiner des masques ou les créer à l’aide de votre propre code personnalisé. Sinon, utilisez le champ maskPrompt pour permettre au modèle de déduire le masque.

Résolutions d’image prises en charge

Vous pouvez spécifier n’importe quelle résolution de sortie pour une tâche de génération, à condition qu’elle respecte les exigences suivantes :

  • Chaque côté doit être compris entre 320 et 4 096 pixels inclus.

  • Chaque côté doit être divisible par 16.

  • Le rapport d’aspect doit être compris entre 1:4 et 4:1. Autrement dit, un côté ne peut pas être plus de 4 fois plus long que l’autre.

  • Le nombre total de pixels doit être inférieur à 4 194 304.

La plupart de ces contraintes s’appliquent également aux images d’entrée. Cependant, les côtés des images n’ont pas besoin d’être divisibles par 16.