Demande et réponse de Stable Image Core

Le corps de la demande est transmis dans le body champ d'une demande à InvokeModel.

Modèle de champ du corps de la demande d'invocation

Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stability AI Stable Diffusion Stable Image Core, remplissez le champ body avec un objet JSON qui ressemble à ce qui suit.


{
        'prompt': 'Create an image of a panda'
    }

Champ body des réponses à l’invocation du modèle

Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stability AI Stable Diffusion Stable Image Core, la réponse est la suivante


{
        'seeds': [2130420379], 
        'finish_reasons': [null], 
        'images': ['...']
    }

seeds : (chaîne) liste des amorces permettant de générer des images pour le modèle.
finish_reasons : Enum indiquant si la demande a été filtrée ou non. null indiquera que la demande a été acceptée. Valeurs possibles actuelles : "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
images : liste des images générées au format de chaîne Base64.

Pour plus d'informations, voir https://platform.us.stability.ai/docs/api-reference# tag/v1generation.

Text to image

Le modèle Stable Image Core comporte les paramètres d’inférence suivants pour un appel d’inférence texte vers image.

prompt (Obligatoire) — (chaîne) Ce que vous souhaitez voir dans l'image de sortie. Une invite descriptive forte qui définit clairement les éléments, les couleurs et les sujets permettra d’obtenir de meilleurs résultats.

Minimum	Maximum
0	10 000 caractères

Champs facultatifs

aspect_ratio : (chaîne) contrôle les proportions de l’image générée. Ce paramètre est valable uniquement pour les demandes texte vers image. Valeur par défaut : 1:1. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.
output_format : spécifie le format de l’image de sortie. Formats pris en charge : JPEG, PNG. Dimensions prises en charge : hauteur 640 à 1 536 pixels, largeur 640 à 1 536 pixels.
seed : (nombre) valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une amorce aléatoire.) Plage de valeurs : de 0 à 4 294 967 295.
negative_prompt : mots clés indiquant ce que vous ne souhaitez pas voir dans l’image de sortie. Maximum : 10 000 caractères.



     import boto3
     import json
     import base64
     import io
     from PIL import Image
     
     bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
     response = bedrock.invoke_model(
         modelId='stability.stable-image-core-v1:1',
         body=json.dumps({
             'prompt': 'A car made out of vegetables.'
         })
     )
     output_body = json.loads(response["body"].read().decode("utf-8"))
     base64_output_image = output_body["images"][0]
     image_data = base64.b64decode(base64_output_image)
     image = Image.open(io.BytesIO(image_data))
     image.save("image.png")

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Stable Diffusion 3.5 Large

Services d’imagerie Stability AI