Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Stability.ai Stable Diffusion 3.5 Large
Le modèle Stable Diffusion 3.5 Large utilise 8 milliards de paramètres et prend en charge une résolution de sortie text-to-image et de image-to-image génération de 1 mégapixel.
Le corps de la demande est transmis dans le body champ d'une demande à InvokeModel.
Modèle de champ du corps de la demande d'invocation
Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stable Diffusion 3.5 Large, remplissez le champ body avec un objet JSON semblable à celui ci-dessous.
Champ body des réponses à l’invocation du modèle
Lorsque vous passez un appel InvokeModel à l’aide d’un modèle Stable Diffusion 3.5 Large, la réponse est similaire à la suivante :
{
'seeds': [2130420379],
"finish_reasons":[null],
"images":["..."]
}
Une réponse dont la raison finale n’est pas null ressemblera à ce qui suit :
{
"finish_reasons":["Filter reason: prompt"]
}
seeds : (chaîne) liste des amorces permettant de générer des images pour le modèle.
-
finish_reasons : Enum indiquant si la demande a été filtrée ou non. null indiquera que la demande a été acceptée. Valeurs possibles actuelles : "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
-
images : liste des images générées au format de chaîne Base64.
- Text to image
-
Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d' text-to-imageinférence.
Paramètres facultatifs
-
aspect_ratio (string) — Contrôle le rapport hauteur/largeur de l'image générée. Valable uniquement pour text-to-image les demandes. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Valeur par défaut : 1:1.
-
mode (string) (GenerationMode) - Par défaut : text-to-image. Enum : image-to-image ou. text-to-image Contrôle s'il s'agit d'une image-to-image génération text-to-image ou, ce qui influe sur les paramètres requis :
-
text-to-image nécessite uniquement le paramètre prompt.
-
image-to-image nécessite les paramètres d'invite, d'image et d'intensité.
-
seed (number) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4 294 967 294. 0 par défaut (amorce aléatoire).
| Minimum |
Maximum |
Par défaut |
| 0 |
4294967294 |
0 |
-
negative_prompt (string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.
-
output_format (string) — Format de l'image de sortie. Enum : jpeg, png, webp. Valeur par défaut : png.
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.'
})
)
- Image to image
-
Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d' image-to-imageinférence.
-
prompt (string) — Description textuelle de l'image de sortie souhaitée. 10 000 caractères maximum.
-
image (chaîne) — Image d'entrée codée en Base64. Minimum 64 pixels par côté. Formats pris en charge : jpeg, png, webp.
-
mode (string) (GenerationMode) - Par défaut : text-to-image. Enum : image-to-image ou. text-to-image Contrôle s'il s'agit d'une image-to-image génération text-to-image ou, ce qui influe sur les paramètres requis :
-
text-to-image nécessite uniquement le paramètre prompt.
-
image-to-image nécessite les paramètres d'invite, d'image et d'intensité.
-
force (nombre) — Contrôle l'influence de l'image d'entrée sur la sortie. Plage de valeurs : de 0 à 1. La valeur 0 préserve l’image d’entrée, la valeur 1 ignore l’image d’entrée.
-
seed (number) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4 294 967 294. 0 par défaut (amorce aléatoire).
| Minimum |
Maximum |
Par défaut |
| 0 |
4294967294 |
0 |
-
negative_prompt (string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.
-
output_format (string) — Format de l'image de sortie. Enum : jpeg, png, webp. Valeur par défaut : png.
import boto3
import base64
import json
# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
image_base64 = base64.b64encode(image_file.read()).decode('utf-8')
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.',
'image': image_base64,
'strength': 0.7
})
)