Stability.ai Stable Diffusion 3.5 Large - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Stability.ai Stable Diffusion 3.5 Large

Le modèle Stable Diffusion 3.5 Large utilise 8 milliards de paramètres et prend en charge une résolution de sortie text-to-image et de image-to-image génération de 1 mégapixel.

Le corps de la demande est transmis dans le body champ d'une demande à InvokeModel.

Modèle de champ du corps de la demande d'invocation

Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stable Diffusion 3.5 Large, remplissez le champ body avec un objet JSON semblable à celui ci-dessous.

  • prompt : (chaîne) description textuelle de l’image de sortie souhaitée. 10 000 caractères maximum.

    Minimum Maximum

    0

    10 000

Champ body des réponses à l’invocation du modèle

Lorsque vous passez un appel InvokeModel à l’aide d’un modèle Stable Diffusion 3.5 Large, la réponse est similaire à la suivante :

{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }

Une réponse dont la raison finale n’est pas null ressemblera à ce qui suit :

{ "finish_reasons":["Filter reason: prompt"] }
  • seeds : (chaîne) liste des amorces permettant de générer des images pour le modèle.

  • finish_reasons : Enum indiquant si la demande a été filtrée ou non. null indiquera que la demande a été acceptée. Valeurs possibles actuelles : "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.

  • images : liste des images générées au format de chaîne Base64.

Text to image

Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d' text-to-imageinférence.

  • prompt (string) — Description textuelle de l'image de sortie souhaitée. 10 000 caractères maximum.

    Minimum Maximum
    0 10 000

Paramètres facultatifs

  • aspect_ratio (string) — Contrôle le rapport hauteur/largeur de l'image générée. Valable uniquement pour text-to-image les demandes. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Valeur par défaut : 1:1.

  • mode (string) (GenerationMode) - Par défaut : text-to-image. Enum : image-to-image ou. text-to-image Contrôle s'il s'agit d'une image-to-image génération text-to-image ou, ce qui influe sur les paramètres requis :

    • text-to-image nécessite uniquement le paramètre prompt.

    • image-to-image nécessite les paramètres d'invite, d'image et d'intensité.

  • seed (number) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4 294 967 294. 0 par défaut (amorce aléatoire).

    Minimum Maximum Par défaut
    0 4294967294 0
  • negative_prompt (string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.

    Minimum Maximum
    0 10 000
  • output_format (string) — Format de l'image de sortie. Enum : jpeg, png, webp. Valeur par défaut : png.

import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
Image to image

Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d' image-to-imageinférence.

  • prompt (string) — Description textuelle de l'image de sortie souhaitée. 10 000 caractères maximum.

    Minimum Maximum
    0 10 000
  • image (chaîne) — Image d'entrée codée en Base64. Minimum 64 pixels par côté. Formats pris en charge : jpeg, png, webp.

  • mode (string) (GenerationMode) - Par défaut : text-to-image. Enum : image-to-image ou. text-to-image Contrôle s'il s'agit d'une image-to-image génération text-to-image ou, ce qui influe sur les paramètres requis :

    • text-to-image nécessite uniquement le paramètre prompt.

    • image-to-image nécessite les paramètres d'invite, d'image et d'intensité.

  • force (nombre) — Contrôle l'influence de l'image d'entrée sur la sortie. Plage de valeurs : de 0 à 1. La valeur 0 préserve l’image d’entrée, la valeur 1 ignore l’image d’entrée.

    Minimum Maximum
    0 1
  • seed (number) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4 294 967 294. 0 par défaut (amorce aléatoire).

    Minimum Maximum Par défaut
    0 4294967294 0
  • negative_prompt (string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.

    Minimum Maximum
    0 10 000
  • output_format (string) — Format de l'image de sortie. Enum : jpeg, png, webp. Valeur par défaut : png.

import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )