Stability.ai Diffusion stable 3,5 L

Le modèle Stable Diffusion 3.5 Large utilise 8 milliards de paramètres et prend en charge une sortie de résolution de 1 mégapixel pour la génération de texte vers image et d’image vers image.

Le corps de la demande est transmis dans le body champ d'une demande à InvokeModel.

Modèle de champ du corps de la demande d'invocation

Lorsque vous effectuez un InvokeModel appel à l'aide d'un modèle Stable Diffusion 3.5 Large, remplissez le champ body avec un objet JSON qui ressemble à ce qui suit.

prompt : (chaîne) description textuelle de l’image de sortie souhaitée. 10 000 caractères maximum.

Minimum	Maximum
0	10 000

Champ body des réponses à l’invocation du modèle

Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stable Diffusion 3.5 Large, la réponse est la suivante


{
    'seeds': [2130420379], 
    "finish_reasons":[null], 
    "images":["..."]
}

Une réponse dont le motif final n'est pas null le cas ressemblera à ce qui suit :


{
    "finish_reasons":["Filter reason: prompt"]
}

seeds : (chaîne) liste des amorces permettant de générer des images pour le modèle.
finish_reasons : Enum indiquant si la demande a été filtrée ou non. null indiquera que la demande a été acceptée. Valeurs possibles actuelles : "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
images : liste des images générées au format de chaîne Base64.

Text to image

Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d'inférence texte-image.

prompt (string) — Description textuelle de l'image de sortie souhaitée. 10 000 caractères maximum.

Minimum	Maximum
0	10 000

Paramètres facultatifs

aspect_ratio (string) — Contrôle le rapport hauteur/largeur de l'image générée. Valable uniquement pour les demandes texte vers image. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Valeur par défaut : 1:1.
mode (string) (GenerationMode) - Par défaut : text-to-image. Enum : image vers image ou texte vers image. Détermine s’il s’agit d’une génération de texte vers image ou d’image vers image, ce qui a une incidence sur les paramètres requis :
- texte vers image ne nécessite que le paramètre d’invite.
- image vers image nécessite les paramètres prompt, image et strength.

seed (number) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4 294 967 294. 0 par défaut (amorce aléatoire).

Minimum	Maximum	Par défaut
0	4294967294	0

negative_prompt (string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.

Minimum	Maximum
0	10 000

output_format (string) — Format de l'image de sortie. Enum : jpeg, png, webp. Valeur par défaut : png.



import boto3
import json

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.'
    })
)

Image to image

Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d'inférence image à image.

prompt (string) — Description textuelle de l'image de sortie souhaitée. 10 000 caractères maximum.

Minimum	Maximum
0	10 000

image (chaîne) — image Base64-encoded d'entrée. Minimum 64 pixels par côté. Formats pris en charge : jpeg, png, webp.
mode (string) (GenerationMode) - Par défaut : text-to-image. Enum : image vers image ou texte vers image. Détermine s’il s’agit d’une génération de texte vers image ou d’image vers image, ce qui a une incidence sur les paramètres requis :
- texte vers image ne nécessite que le paramètre d’invite.
- image vers image nécessite les paramètres prompt, image et strength.

force (nombre) — Contrôle l'influence de l'image d'entrée sur la sortie. Plage de valeurs : de 0 à 1. La valeur 0 préserve l’image d’entrée, la valeur 1 ignore l’image d’entrée.

Minimum	Maximum
0	1

seed (number) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4 294 967 294. 0 par défaut (amorce aléatoire).

Minimum	Maximum	Par défaut
0	4294967294	0

negative_prompt (string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.

Minimum	Maximum
0	10 000

output_format (string) — Format de l'image de sortie. Enum : jpeg, png, webp. Valeur par défaut : png.



import boto3
import base64
import json

# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
    image_base64 = base64.b64encode(image_file.read()).decode('utf-8')

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.',
        'image': image_base64,
        'strength': 0.7
    })
)

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Stable Image Ultra

Stable Image Core