Stability.ai Stable Diffusion 3.5 Large - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Stability.ai Stable Diffusion 3.5 Large

Le modèle Stable Diffusion 3.5 Large utilise 8 milliards de paramètres et prend en charge une résolution de sortie text-to-image et de image-to-image génération de 1 mégapixel.

Le corps de la demande est transmis dans le body champ d'une demande à InvokeModel.

Modèle de champ du corps de la demande d'invocation

Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stable Diffusion 3.5 Large, remplissez le champ body avec un objet JSON semblable à celui ci-dessous.

  • prompt — (chaîne) Description textuelle de l'image de sortie souhaitée. 10 000 caractères maximum.

    Minimum Maximum

    0

    10 000

Modèle : réponse à l'invocation, corps du corps du corps

Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stable Diffusion 3.5 Large, la réponse est la suivante :

{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }

Une réponse dont la raison finale ne l'est pas null ressemblera à ce qui suit :

{ "finish_reasons":["Filter reason: prompt"] }
  • seeds — (chaîne) Liste des graines utilisées pour générer des images pour le modèle.

  • finish_reasons — Enum indiquant si la demande a été filtrée ou non. nullindiquera que la demande a été acceptée. Valeurs possibles actuelles :"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.

  • images — Liste des images générées au format de chaîne base64.

Text to image

Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d' text-to-imageinférence.

  • prompt(string) — Description textuelle de l'image de sortie souhaitée. 10 000 caractères maximum.

    Minimum Maximum
    0 10 000

Paramètres facultatifs

  • aspect_ratio(chaîne) — Contrôle le rapport hauteur/largeur de l'image générée. Valable uniquement pour text-to-image les demandes. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Par défaut 1:1.

  • mode(string) (GenerationMode) - Par défaut : text-to-image. Enum : image-to-image ou. text-to-image Contrôle s'il s'agit d'une image-to-image génération text-to-image ou, ce qui affecte les paramètres requis :

    • text-to-image nécessite uniquement le paramètre prompt.

    • image-to-image nécessite les paramètres d'invite, d'image et d'intensité.

  • seed(nombre) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4294967294. Par défaut, 0 (graine aléatoire).

    Minimum Maximum Par défaut
    0 4294967294 0
  • negative_prompt(string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.

    Minimum Maximum
    0 10 000
  • cfg_scale(nombre) — Contrôle le respect du texte d'invite. Des valeurs plus élevées augmentent l'adhérence rapide. Plage de 1 à 10. Par défaut 4.

    Minimum Maximum Par défaut
    1 10 4
  • style_preset(string) — Applique un style visuel spécifique. Enum : modèle 3D, film analogique, anime, cinématique, bande dessinée, art numérique, amélioration, art fantastique, isométrique, dessin au trait, low-poly, composé de modelage, néon-punk, origami, photographique, pixel-art, texture des carreaux.

  • output_format(string) — Format d'image de sortie. Enum : jpeg, png, webp. PNG par défaut.

import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
Image to image

Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d' image-to-imageinférence.

  • prompt(string) — Description textuelle de l'image de sortie souhaitée. 10 000 caractères maximum.

    Minimum Maximum
    0 10 000
  • image(string) — Image d'entrée codée en Base64. 64 pixels minimum par côté. Formats pris en charge : jpeg, png, webp.

  • mode(string) (GenerationMode) - Par défaut : text-to-image. Enum : image-to-image ou. text-to-image Contrôle s'il s'agit d'une image-to-image génération text-to-image ou, ce qui influe sur les paramètres requis :

    • text-to-image nécessite uniquement le paramètre prompt.

    • image-to-image nécessite les paramètres d'invite, d'image et d'intensité.

  • strength(nombre) — Contrôle l'influence de l'image d'entrée sur la sortie. Plage de 0 à 1. La valeur 0 préserve l'image d'entrée, la valeur de 1 ignore l'image d'entrée.

    Minimum Maximum
    0 1
  • seed(nombre) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4294967294. Par défaut, 0 (graine aléatoire).

    Minimum Maximum Par défaut
    0 4294967294 0
  • negative_prompt(string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.

    Minimum Maximum
    0 10 000
  • cfg_scale(nombre) — Contrôle le respect du texte d'invite. Des valeurs plus élevées augmentent l'adhérence rapide. Plage de 1 à 10. Par défaut 4.

    Minimum Maximum Par défaut
    1 10 4
  • style_preset(string) — Applique un style visuel spécifique. Enum : modèle 3D, film analogique, anime, cinématique, bande dessinée, art numérique, amélioration, art fantastique, isométrique, dessin au trait, low-poly, composé de modelage, néon-punk, origami, photographique, pixel-art, texture des carreaux.

  • output_format(string) — Format d'image de sortie. Enum : jpeg, png, webp. PNG par défaut.

import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )