Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Services d'imagerie par IA pour la stabilité
Vous pouvez utiliser Stability AI Image Services avec Amazon Bedrock pour accéder à neuf outils de retouche d'image spécialisés conçus pour accélérer les flux de travail créatifs professionnels. Avec Stability AI Image Services, vous pouvez générer des images à partir d'une esquisse, restructurer et relooker une image existante, ou supprimer et remplacer des objets dans une image.
Cette section décrit comment effectuer des appels d'inférence vers Stability AI Image Services à l'aide du InvokeModel. Cette section fournit également des exemples de code en Python et des exemples d'images avant et après l'utilisation de Stability AI Image Services.
Les services d'imagerie Stability AI sont disponibles dans les catégories suivantes :
Édition ‐ Services de retouche d'image basés sur l'IA, y compris la peinture à l'aide de masques (remplissage génératif) ou de mots. Comprend des outils pour le placement de produits et la publicité, ainsi que des outils de base tels que la suppression de l'arrière-plan.
Contrôle ‐ Peut prendre des instructions, des cartes et d'autres guides. Ces services tirent parti ControlNets de technologies similaires basées sur des modèles de diffusion stable.
Note
En vous abonnant à n'importe quel service de modification ou de contrôle Stability AI Image Service, vous êtes automatiquement inscrit aux neuf services d'imagerie Stability AI disponibles.
Rubriques
Demande et réponse
Le corps de la demande est transmis dans le body
champ d'une demande à InvokeModel.
Modèle de champ du corps de la demande d'invocation
Lorsque vous passez un InvokeModel appel à l'aide de Stability AI Image Services, remplissez le champ body avec un objet JSON semblable à celui ci-dessous.
{ 'prompt': 'Create an image of a panda' }
Modèle : réponse à l'invocation, corps du corps du corps
Lorsque vous passez un InvokeModel appel à l'aide de Stability AI Image Services, la réponse est la suivante :
{ 'seeds': [2130420379], 'finish_reasons': [null], 'images': ['...'] }
seeds — (chaîne) Liste des graines utilisées pour générer des images pour le modèle.
-
finish_reasons — Enum indiquant si la demande a été filtrée ou non.
null
indiquera que la demande a été acceptée. Valeurs possibles actuelles :"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null
. -
images — Liste des images générées au format de chaîne base64.
Pour plus d'informations, consultez https://platform.us.stability. ai/docs/api-reference#tag/v1génération
Modifier
La section suivante décrit les services d'édition de Stability AI Image Services.
Inpaint modifie les images de manière intelligente en remplissant ou en remplaçant les zones spécifiées par un nouveau contenu basé sur le contenu d'une image de masque.
Inpaint possède les paramètres obligatoires suivants :
prompt ‐ Ce que vous souhaitez voir dans l'image de sortie. Un message descriptif fort qui définit clairement les éléments, les couleurs et les sujets permettra d'obtenir de meilleurs résultats. Pour contrôler le poids d'un mot donné, utilisez le format (mot:poids), où le mot est le mot dont vous souhaitez contrôler le poids et le poids est une valeur. Une valeur comprise entre 0 et 1,0 réduit l'accent sur le mot et une valeur comprise entre 1,1 et 2 met l'accent sur le mot. Par exemple : le ciel était net (bleu : 0,3) et (vert : 1,8) refléterait un ciel bleu et vert, mais plus vert que bleu. Minimum 0 et maximum 10 000 caractères.
image ‐ (chaîne) L'image Base64 à peindre. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
Les paramètres suivants sont facultatifs :
style_preset ‐ (string) Oriente le modèle d'image vers un style particulier. Enum : modèle 3D, film analogique, anime, cinématique, bande dessinée, art numérique, amélioration, art fantastique, isométrique, dessin au trait, low-poly, composé de modelage, néon-punk, origami, photographique, pixel-art, texture des carreaux.
negative_prompt ‐ (string) Un texte de présentation décrivant ce que vous ne souhaitez pas voir dans l'image de sortie. Il s'agit d'une fonctionnalité avancée. 10 000 caractères maximum.
seed ‐ (nombre) Une valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une valeur de départ aléatoire.) Plage de 0 à 4294967294. Par défaut, 0.
output_format ‐ (string) Indique le type de contenu de l'image générée. Enum : jpeg, png, webp. PNG par défaut.
mask ‐ (string) Contrôle l'intensité du processus de peinture par pixel, soit via une deuxième image (passée dans ce paramètre), soit via le canal alpha du paramètre image.
Transmission d'un masque ‐ L'image transmise à ce paramètre doit être une image en noir et blanc qui représente, à chaque pixel, l'intensité de la peinture en fonction du degré d'obscurité ou de lumière du pixel donné. Les pixels entièrement noirs ne représentent aucune résistance à la peinture, tandis que les pixels entièrement blancs représentent une résistance maximale. Si la taille du masque est différente de celle du paramètre de l'image, il sera automatiquement redimensionné.
Support du canal alpha ‐ Si vous ne fournissez pas de masque explicite, celui-ci sera dérivé du canal alpha du paramètre d'image. Les pixels transparents seront peints tandis que les pixels opaques seront préservés. Si une image avec un canal alpha est fournie avec un masque, le masque aura la priorité.
grow_mask ‐ Agrandit les bords du masque vers l'extérieur dans toutes les directions selon le nombre de pixels spécifié. La zone étendue autour du masque sera floue, ce qui facilitera la transition entre le contenu peint et l'image d'origine. Plage comprise entre 0 et 20. Par défaut 5. Essayez ce paramètre si vous remarquez des joints ou des aspérités autour du contenu peint. Notez qu'une croissance excessive peut masquer les détails les plus fins du masque et and/or fusionner les régions masquées voisines.
Le tableau suivant montre les images d'entrée et de sortie d'une opération Inpaint.
Entrée |
Mask |
Output |
---|---|---|
![]() |
![]() |
![]() |
« Man in Metropolis » généré par Stable Image Ultra, instructions et modifications par Sanwal Yousaf. Sous licence CC BY 4.0 |
La fonction Rechercher et recolorer vous permet de modifier la couleur d'un objet spécifique dans une image à l'aide d'une invite. Ce service est une version spécifique d'inpainting qui ne nécessite pas de masque. Il segmentera automatiquement l'objet et le recolorera en utilisant les couleurs demandées dans l'invite.
Search and Recolor possède les paramètres obligatoires suivants :
prompt ‐ Ce que vous souhaitez voir dans l'image de sortie. Un message descriptif fort qui définit clairement les éléments, les couleurs et les sujets permettra d'obtenir de meilleurs résultats. Pour contrôler le poids d'un mot donné, utilisez le format (mot:poids), où le mot est le mot dont vous souhaitez contrôler le poids et le poids est une valeur. Une valeur comprise entre 0 et 1,0 réduit l'accent sur le mot et une valeur comprise entre 1,1 et 2 met l'accent sur le mot. Par exemple : le ciel était net (bleu : 0,3) et (vert : 1,8) refléterait un ciel bleu et vert, mais plus vert que bleu. Minimum 0 et maximum 10 000 caractères.
image ‐ (chaîne) L'image Base64 à recolorer. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
select_prompt ‐ (chaîne) Brève description des éléments à rechercher dans l'image. 10 000 caractères maximum.
Les paramètres suivants sont facultatifs :
style_preset ‐ (string) Oriente le modèle d'image vers un style particulier. Enum : modèle 3D, film analogique, anime, cinématique, bande dessinée, art numérique, amélioration, art fantastique, isométrique, dessin au trait, low-poly, composé de modelage, néon-punk, origami, photographique, pixel-art, texture des carreaux.
negative_prompt ‐ (string) Un texte de présentation décrivant ce que vous ne souhaitez pas voir dans l'image de sortie. Il s'agit d'une fonctionnalité avancée. 10 000 caractères maximum.
seed ‐ (nombre) Une valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une valeur de départ aléatoire.) Plage de 0 à 4294967294. Par défaut, 0.
output_format ‐ (string) Indique le type de contenu de l'image générée. Enum : jpeg, png, webp. PNG par défaut.
grow_mask ‐ Agrandit les bords du masque vers l'extérieur dans toutes les directions selon le nombre de pixels spécifié. La zone étendue autour du masque sera floue, ce qui facilitera la transition entre le contenu peint et l'image d'origine. Plage comprise entre 0 et 20. Par défaut 5. Essayez ce paramètre si vous remarquez des joints ou des aspérités autour du contenu peint. Notez qu'une croissance excessive peut masquer les détails les plus fins du masque et and/or fusionner les régions masquées voisines.
Le tableau suivant montre les images d'entrée et de sortie d'une opération de recherche et de recoloration à l'aide de l'invite suivante : veste rose.
Entrée |
Output |
---|---|
![]() |
![]() |
« Man wearing puffer jacket » généré par Stable Image Ultra, instructions et modifications par Sanwal Yousaf. Sous licence CC BY 4.0 |
La fonction Rechercher et remplacer vous permet d'utiliser une invite de recherche pour identifier un objet à remplacer dans un langage simple. Le service segmente automatiquement l'objet et le remplace par l'objet demandé dans l'invite sans avoir besoin de masque.
Search and Replace possède les paramètres obligatoires suivants :
prompt ‐ Ce que vous souhaitez voir dans l'image de sortie. Un message descriptif fort qui définit clairement les éléments, les couleurs et les sujets permettra d'obtenir de meilleurs résultats. Pour contrôler le poids d'un mot donné, utilisez le format (mot:poids), où le mot est le mot dont vous souhaitez contrôler le poids et le poids est une valeur. Une valeur comprise entre 0 et 1,0 réduit l'accent sur le mot et une valeur comprise entre 1,1 et 2 met l'accent sur le mot. Par exemple : le ciel était net (bleu : 0,3) et (vert : 1,8) refléterait un ciel bleu et vert, mais plus vert que bleu. Minimum 0 et maximum 10 000 caractères.
image ‐ (chaîne) L'image Base64 à recolorer. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
search_prompt ‐ (string) Brève description de ce qu'il faut incruster dans l'image. 10 000 caractères maximum.
Les paramètres suivants sont facultatifs :
style_preset ‐ (string) Oriente le modèle d'image vers un style particulier. Enum : modèle 3D, film analogique, anime, cinématique, bande dessinée, art numérique, amélioration, art fantastique, isométrique, dessin au trait, low-poly, composé de modelage, néon-punk, origami, photographique, pixel-art, texture des carreaux.
negative_prompt ‐ (string) Un texte de présentation décrivant ce que vous ne souhaitez pas voir dans l'image de sortie. Il s'agit d'une fonctionnalité avancée. 10 000 caractères maximum.
seed ‐ (nombre) Une valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une valeur de départ aléatoire.) Plage de 0 à 4294967294. Par défaut, 0.
output_format ‐ (string) Indique le type de contenu de l'image générée. Enum : jpeg, png, webp. PNG par défaut.
grow_mask ‐ Agrandit les bords du masque vers l'extérieur dans toutes les directions selon le nombre de pixels spécifié. La zone étendue autour du masque sera floue, ce qui facilitera la transition entre le contenu peint et l'image d'origine. Plage comprise entre 0 et 20. Par défaut 5. Essayez ce paramètre si vous remarquez des joints ou des aspérités autour du contenu peint. Notez qu'une croissance excessive peut masquer les détails les plus fins du masque et and/or fusionner les régions masquées voisines.
Le tableau suivant montre les images d'entrée et de sortie d'une opération de recherche et de remplacement à l'aide de l'invite suivante : jacket.
Entrée |
Output |
---|---|
![]() |
![]() |
« Mannequin féminine portant un pull d'automne » généré par Stable Image Ultra. Invitations et modifications de Sanwal Yousaf. Sous licence CC BY 4.0 |
L'effacement vous permet de supprimer les éléments indésirables à l'aide de masques d'image, tout en préservant intelligemment la cohérence de l'arrière-plan.
Erase possède les paramètres obligatoires suivants :
image ‐ (chaîne) L'image Base64 à effacer. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
Les paramètres suivants sont facultatifs :
seed ‐ (nombre) Une valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une valeur de départ aléatoire.) Plage de 0 à 4294967294. Par défaut, 0.
output_format ‐ (string) Indique le type de contenu de l'image générée. Enum : jpeg, png, webp. PNG par défaut.
mask ‐ (string) Contrôle l'intensité du processus de peinture par pixel, soit via une deuxième image (passée dans ce paramètre), soit via le canal alpha du paramètre image.
Transmission d'un masque ‐ L'image transmise à ce paramètre doit être une image en noir et blanc qui représente, à chaque pixel, l'intensité de la peinture en fonction du degré d'obscurité ou de lumière du pixel donné. Les pixels entièrement noirs ne représentent aucune résistance à la peinture, tandis que les pixels entièrement blancs représentent une résistance maximale. Si la taille du masque est différente de celle du paramètre de l'image, il sera automatiquement redimensionné.
Support du canal alpha ‐ Si vous ne fournissez pas de masque explicite, celui-ci sera dérivé du canal alpha du paramètre d'image. Les pixels transparents seront peints tandis que les pixels opaques seront préservés. Si une image avec un canal alpha est fournie avec un masque, le masque aura la priorité.
grow_mask ‐ Agrandit les bords du masque vers l'extérieur dans toutes les directions selon le nombre de pixels spécifié. La zone étendue autour du masque sera floue, ce qui facilitera la transition entre le contenu peint et l'image d'origine. Plage comprise entre 0 et 20. Par défaut 5. Essayez ce paramètre si vous remarquez des joints ou des aspérités autour du contenu peint. Notez qu'une croissance excessive peut masquer les détails les plus fins du masque et and/or fusionner les régions masquées voisines.
Note
Pour des résultats d'effacement optimaux, assurez-vous que votre masque définit avec précision les zones à supprimer. Si aucun masque explicite n'est fourni, le service utilisera le canal alpha de l'image d'entrée. Le masque aura la priorité si les deux sont fournis.
Le tableau suivant montre les images d'entrée et de sortie d'une opération d'effacement.
Entrée |
Mask |
Output |
---|---|---|
![]() |
![]() |
![]() |
« Students Desk » généré par Stable Image Ultra. Invitations et modifications de Sanwal Yousaf. Sous licence CC BY 4.0 |
Supprimer l'arrière-plan vous permet d'isoler les sujets de l'arrière-plan avec précision.
Les paramètres requis pour Supprimer l'arrière-plan sont les suivants :
image ‐ (chaîne) L'image Base64 dont vous souhaitez supprimer l'arrière-plan. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
Les paramètres suivants sont facultatifs :
output_format ‐ (string) Indique le type de contenu de l'image générée. Enum : jpeg, png, webp. PNG par défaut.
Le tableau suivant montre les images d'entrée et de sortie d'une opération de suppression de l'arrière-plan.
Entrée |
Output |
---|---|
![]() |
![]() |
« Mannequin féminine portant un pull d'automne » généré par Stable Image Ultra. Invitations et modifications de Sanwal Yousaf. Sous licence CC BY 4.0 |
Contrôle
La section suivante décrit le contrôle Stability AI Image Services.
Améliorez vos croquis dessinés à la main pour obtenir des résultats raffinés avec un contrôle précis. Pour les images autres que des esquisses, Control Sketch permet de manipuler en détail l'apparence finale en exploitant les lignes de contour et les arêtes de l'image.
Control Sketch possède les paramètres obligatoires suivants :
prompt ‐ Ce que vous souhaitez voir dans l'image de sortie. Un message descriptif fort qui définit clairement les éléments, les couleurs et les sujets permettra d'obtenir de meilleurs résultats. Pour contrôler le poids d'un mot donné, utilisez le format (mot:poids), où le mot est le mot dont vous souhaitez contrôler le poids et le poids est une valeur. Une valeur comprise entre 0 et 1,0 réduit l'accent sur le mot et une valeur comprise entre 1,1 et 2 met l'accent sur le mot. Par exemple : le ciel était net (bleu : 0,3) et (vert : 1,8) refléterait un ciel bleu et vert, mais plus vert que bleu. Minimum 0 et maximum 10 000 caractères.
image ‐ (chaîne) L'image Base64 de l'esquisse. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
Les paramètres suivants sont facultatifs :
control_strength ‐ (nombre) L'influence ou le contrôle de l'image sur la génération. Représenté sous la forme d'un flottant compris entre 0 et 1, où 0 représente l'influence la plus faible et 1 le maximum. Valeur par défaut : 0,7.
negative_prompt ‐ (string) Un texte de présentation décrivant ce que vous ne souhaitez pas voir dans l'image de sortie. Il s'agit d'une fonctionnalité avancée. 10 000 caractères maximum.
seed ‐ (nombre) Une valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une valeur de départ aléatoire.) Plage de 0 à 4294967294. Par défaut, 0.
output_format ‐ (string) Indique le type de contenu de l'image générée. Enum : jpeg, png, webp. PNG par défaut.
style_preset ‐ Oriente le modèle d'image vers un style particulier. Enum : modèle 3D, film analogique, anime, cinématique, bande dessinée, art numérique, amélioration, art fantastique, isométrique, dessin au trait, low-poly, composé de modelage, néon-punk, origami, photographique, pixel-art, texture des carreaux.
Le tableau suivant montre les images d'entrée et de sortie d'un appel Control Sketch à l'aide de l'invite suivante : une maison avec en arrière-plan des montagnes et une rivière qui coule à proximité.
Entrée |
Output |
---|---|
![]() |
![]() |
« Croquis d'une maison, de montagnes et de rivière » de Sanwal Yousaf. Sous licence CC BY 4.0 |
La structure de contrôle vous permet de générer des images tout en conservant la structure d'une image d'entrée. Cela est particulièrement utile pour les scénarios de création de contenu avancés tels que la recréation de scènes ou le rendu de personnages à partir de modèles.
La structure de contrôle possède les paramètres obligatoires suivants :
prompt ‐ Ce que vous souhaitez voir dans l'image de sortie. Un message descriptif fort qui définit clairement les éléments, les couleurs et les sujets permettra d'obtenir de meilleurs résultats. Pour contrôler le poids d'un mot donné, utilisez le format (mot:poids), où le mot est le mot dont vous souhaitez contrôler le poids et le poids est une valeur. Une valeur comprise entre 0 et 1,0 réduit l'accent sur le mot et une valeur comprise entre 1,1 et 2 met l'accent sur le mot. Par exemple : le ciel était net (bleu : 0,3) et (vert : 1,8) refléterait un ciel bleu et vert, mais plus vert que bleu. Minimum 0 et maximum 10 000 caractères.
image ‐ (chaîne) L'image Base64 de l'esquisse. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
Les paramètres suivants sont facultatifs :
control_strength ‐ (nombre) L'influence ou le contrôle de l'image sur la génération. Représenté sous la forme d'un flottant compris entre 0 et 1, où 0 représente l'influence la plus faible et 1 le maximum. Valeur par défaut : 0,7.
negative_prompt ‐ (string) Un texte de présentation décrivant ce que vous ne souhaitez pas voir dans l'image de sortie. Il s'agit d'une fonctionnalité avancée. 10 000 caractères maximum.
seed ‐ (nombre) Une valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une valeur de départ aléatoire.) Plage de 0 à 4294967294. Par défaut, 0.
output_format ‐ (string) Indique le type de contenu de l'image générée. Enum : jpeg, png, webp. PNG par défaut.
style_preset ‐ Oriente le modèle d'image vers un style particulier. Enum : modèle 3D, film analogique, anime, cinématique, bande dessinée, art numérique, amélioration, art fantastique, isométrique, dessin au trait, low-poly, composé de modelage, néon-punk, origami, photographique, pixel-art, texture des carreaux.
Le tableau suivant montre les images d'entrée et de sortie d'une opération de structure de contrôle à l'aide de l'invite suivante : structure surréaliste avec des étincelles générées par le mouvement qui éclairent la scène.
Entrée |
Output |
---|---|
![]() |
![]() |
« Personne assise sur une boîte brune » |
Le guide de style vous permet d'extraire des éléments stylistiques d'une image d'entrée et de l'utiliser pour guider la création d'une image de sortie en fonction de l'invite. Le résultat est une nouvelle image dans le même style que l'image d'entrée.
Le guide de style comporte les paramètres obligatoires suivants :
prompt ‐ Ce que vous souhaitez voir dans l'image de sortie. Un message descriptif fort qui définit clairement les éléments, les couleurs et les sujets permettra d'obtenir de meilleurs résultats. Pour contrôler le poids d'un mot donné, utilisez le format (mot:poids), où le mot est le mot dont vous souhaitez contrôler le poids et le poids est une valeur. Une valeur comprise entre 0 et 1,0 réduit l'accent sur le mot et une valeur comprise entre 1,1 et 2 met l'accent sur le mot. Par exemple : le ciel était net (bleu : 0,3) et (vert : 1,8) refléterait un ciel bleu et vert, mais plus vert que bleu. Minimum 0 et maximum 10 000 caractères.
image ‐ (chaîne) L'image Base64 de l'esquisse. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
Les paramètres suivants sont facultatifs :
aspect_ratio ‐ (string) Contrôle le rapport hauteur/largeur de l'image générée. Ce paramètre n'est valide que pour les text-to-image demandes. Par défaut 1:1. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Par défaut 1:1.
negative_prompt ‐ (string) Un texte de présentation décrivant ce que vous ne souhaitez pas voir dans l'image de sortie. Il s'agit d'une fonctionnalité avancée. 10 000 caractères maximum.
seed ‐ (nombre) Une valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une valeur de départ aléatoire.) Plage de 0 à 4294967294. Par défaut, 0.
output_format ‐ (string) Indique le type de contenu de l'image générée. Enum : jpeg, png, webp. PNG par défaut.
fidélité ‐ (nombre) Dans quelle mesure le style de l'image de sortie ressemble au style de l'image d'entrée. Plage de 0 à 1. Par défaut, 0,5.
style_preset ‐ Oriente le modèle d'image vers un style particulier. Enum : modèle 3D, film analogique, anime, cinématique, bande dessinée, art numérique, amélioration, art fantastique, isométrique, dessin au trait, low-poly, composé de modelage, néon-punk, origami, photographique, pixel-art, texture des carreaux.
Le tableau suivant montre les images d'entrée et de sortie d'un appel du Guide de style à l'aide de l'invite suivante : plan large d'une métropole moderne.
Entrée |
Output |
---|---|
![]() |
![]() |
« Peinture abstraite » |
Le transfert de style vous permet d'appliquer les caractéristiques visuelles des images de style de référence aux images cibles. Alors que le service Style Guide extrait des éléments stylistiques d'une image d'entrée et les utilise pour guider la création d'une image de sortie en fonction de l'invite, Style Transfer transforme spécifiquement le contenu existant tout en préservant la composition d'origine. Cet outil permet de créer un contenu cohérent sur plusieurs actifs.
Style Transfer possède les paramètres obligatoires suivants :
init_image ‐ (string) Une image Base64 contenant le sujet que vous souhaitez redéfinir. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
style_image ‐ (string) Une image Base64 contenant le sujet que vous souhaitez relooker. Chaque côté de l'image doit mesurer au moins 64 pixels. Le nombre total de pixels ne peut pas dépasser 9 437 184 pixels. Le rapport hauteur/largeur de l'image doit être compris entre 1:2,5 et 2, 5:1. Formats pris en charge : jpeg, png, webp.
Les paramètres suivants sont facultatifs :
prompt ‐ (chaîne) Ce que vous souhaitez voir dans l'image de sortie. Un message descriptif fort qui définit clairement les éléments, les couleurs et les sujets permettra d'obtenir de meilleurs résultats. Pour contrôler le poids d'un mot donné, utilisez le format (mot:poids), où le mot est le mot dont vous souhaitez contrôler le poids et le poids est une valeur. Une valeur comprise entre 0 et 1,0 réduit l'accent sur le mot et une valeur comprise entre 1,1 et 2 met l'accent sur le mot. Par exemple : le ciel était net (bleu : 0,3) et (vert : 1,8) refléterait un ciel bleu et vert, mais plus vert que bleu.
negative_prompt ‐ (string) Un texte de présentation décrivant ce que vous ne souhaitez pas voir dans l'image de sortie. Il s'agit d'une fonctionnalité avancée. 10 000 caractères maximum.
seed ‐ (nombre) Une valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une valeur de départ aléatoire.) Plage de 0 à 4294967294. Par défaut, 0.
output_format ‐ (string) Indique le type de contenu de l'image générée. Enum : jpeg, png, webp. PNG par défaut.
composition_fidelity ‐ (number) Dans quelle mesure le style de l'image de sortie ressemble au style de l'image d'entrée. Plage comprise entre 0 et 1. Par défaut 0,9.
style_strength ‐ (nombre) Parfois appelé débruitage, ce paramètre contrôle l'influence du paramètre style_image sur l'image générée. Une valeur de 0 produirait une image identique à l'entrée. Une valeur de 1 serait comme si vous n'aviez transmis aucune image. Plage comprise entre 0 et 1. Par défaut 1.
change_strength ‐ (number) Dans quelle mesure l'image d'origine doit changer. Plage comprise entre 0,1 et 1. Par défaut 0,9.
Le tableau suivant montre les images d'entrée et de sortie d'un appel Style Transfer.
Entrée |
Style |
Output |
---|---|---|
![]() |
![]() |
![]() |
« Statue de femme debout » |
« Blue Bright Lights » |