Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Demande et réponse de Stable Image Core
Le corps de la demande est transmis dans le body champ d'une demande à InvokeModel.
Modèle de champ du corps de la demande d'invocation
Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stability AI Stable Diffusion Stable Image Core, remplissez le champ body avec un objet JSON semblable à celui ci-dessous.
{
'prompt': 'Create an image of a panda'
}
Modèle : réponse à l'invocation, corps du corps du corps
Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stability AI Stable Diffusion Stable Image Core, la réponse est la suivante :
{
'seeds': [2130420379],
'finish_reasons': [null],
'images': ['...']
}
seeds — (chaîne) Liste des graines utilisées pour générer des images pour le modèle.
-
finish_reasons — Enum indiquant si la demande a été filtrée ou non. nullindiquera que la demande a été acceptée. Valeurs possibles actuelles :"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
-
images — Liste des images générées au format de chaîne base64.
Pour plus d'informations, consultez https://platform.us.stability. ai/docs/api-reference#tag/v1génération.
- Text to image
-
Le modèle Stable Image Core possède les paramètres d'inférence suivants pour un appel d'inférence texte-image.
text_prompts (obligatoire) : tableau d’invites de texte à utiliser pour la génération. Chaque élément est un objet JSON qui contient une invite et une pondération pour l’invite.
Champs facultatifs
aspect_ratio — (chaîne) Contrôle le rapport hauteur/largeur de l'image générée. Ce paramètre n'est valide que pour les text-to-image demandes. Par défaut 1:1. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.
-
style_preset — (chaîne) Guide le modèle d'image vers un style particulier. Enum : modèle 3D, film analogique, anime, cinématique, bande dessinée, art numérique, amélioration, art fantastique, isométrique, dessin au trait, low-poly, composé de modelage, néon-punk, origami, photographique, pixel-art, texture des carreaux.
-
output_format — Spécifie le format de l'image de sortie. Formats pris en charge : JPEG, PNG. Dimensions prises en charge : hauteur 640 à 1 536 pixels, largeur 640 à 1 536 pixels.
-
seed — (nombre) Valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une valeur de départ aléatoire.) Plage : 0 à 4294967295.
-
negative_prompt — Mots clés indiquant ce que vous ne souhaitez pas voir dans l'image de sortie. Maximum : 10 000 caractères.
import boto3
import json
import base64
import io
from PIL import Image
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='us.stability.stable-image-core-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.'
})
)
output_body = json.loads(response["body"].read().decode("utf-8"))
base64_output_image = output_body["images"][0]
image_data = base64.b64decode(base64_output_image)
image = Image.open(io.BytesIO(image_data))
image.save("image.png")