Stable Image Ultra : demande et réponse - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Stable Image Ultra : demande et réponse

Le corps de la demande est transmis dans le body champ d'une demande à une InvokeModelopération.

Modèle de champ du corps de la demande d'invocation

Lorsque vous effectuez un InvokeModel appel à l'aide d'un modèle Stable Image Ultra, remplissez le champ body avec un objet JSON semblable à celui ci-dessous.

  • prompt : (chaîne) ce que vous souhaitez voir dans l’image de sortie. Une invite descriptive forte qui définit clairement les éléments, les couleurs et les sujets permettra d’obtenir de meilleurs résultats.

    Minimum Maximum

    0

    10 000

Champ body des réponses à l’invocation du modèle

Lorsque vous passez un appel InvokeModel à l’aide d’un modèle Stable Image Ultra, la réponse est similaire à la suivante :

{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }

Une réponse dont la raison finale n’est pas null ressemblera à ce qui suit :

{ "finish_reasons":["Filter reason: prompt"] }
  • seeds : (chaîne) liste des amorces permettant de générer des images pour le modèle.

  • finish_reasons : Enum indiquant si la demande a été filtrée ou non. null indiquera que la demande a été acceptée. Valeurs possibles actuelles : "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.

  • images : liste des images générées au format de chaîne Base64.

Pour plus d'informations, consultez https://platform.us.stability. ai/docs/api-reference#tag/v1génération.

Text to image

Le modèle Stability.ai Stable Image Ultra possède les paramètres d'inférence suivants pour un appel d' text-to-imageinférence.

  • prompt : (chaîne) ce que vous souhaitez voir dans l’image de sortie. Une invite descriptive forte qui définit clairement les éléments, les couleurs et les sujets permettra d’obtenir de meilleurs résultats.

    Minimum Maximum

    0

    10 000

Champs facultatifs

  • aspect_ratio : (chaîne) contrôle les proportions de l’image générée. Ce paramètre n'est valide que pour les text-to-image demandes. Valeur par défaut : 1:1. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.

  • mode — Réglé sur text-to-image. Par défaut : text-to-image. Énumération : text-to-image.

  • output_format : spécifie le format de l’image de sortie. Formats pris en charge : JPEG, PNG. Dimensions prises en charge : hauteur 640 à 1 536 pixels, largeur 640 à 1 536 pixels.

  • seed : (nombre) valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une amorce aléatoire.) Plage de valeurs : de 0 à 4 294 967 295.

  • negative_prompt : mots clés indiquant ce que vous ne souhaitez pas voir dans l’image de sortie. Maximum : 10 000 caractères.

import boto3 import json import base64 import io from PIL import Image bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='stability.sd3-ultra-v1:1', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) ) output_body = json.loads(response["body"].read().decode("utf-8")) base64_output_image = output_body["images"][0] image_data = base64.b64decode(base64_output_image) image = Image.open(io.BytesIO(image_data)) image.save("image.png")
Image to image

Le modèle Stability.ai Stable Image Ultra possède les paramètres d'inférence suivants pour un appel d' image-to-imageinférence.

  • prompt : (chaîne) ce que vous souhaitez voir dans l’image de sortie. Une invite descriptive forte qui définit clairement les éléments, les couleurs et les sujets permettra d’obtenir de meilleurs résultats.

    Minimum Maximum

    0

    10 000

Champs facultatifs

  • image : (chaîne) image Base64 à utiliser comme point de départ pour la génération. Formats pris en charge : JPEG, PNG, WebP.

  • force : (nombre) niveau d’influence du paramètre d’image sur l’image générée. Les images dont les valeurs d’intensité sont faibles ressembleront davantage à l’image d’origine. Plage de valeurs : de 0,0 à 1,0. Valeur par défaut : 0,35.

  • aspect_ratio : (chaîne) contrôle les proportions de l’image générée. Ce paramètre n'est valide que pour les text-to-image demandes. Valeur par défaut : 1:1. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.

  • output_format : spécifie le format de l’image de sortie. Formats pris en charge : JPEG, PNG. Dimensions prises en charge : hauteur 640 à 1 536 pixels, largeur 640 à 1 536 pixels.

  • seed : (nombre) valeur spécifique utilisée pour indiquer le « caractère aléatoire » de la génération. (Omettez ce paramètre ou transmettez 0 pour utiliser une amorce aléatoire.) Plage de valeurs : de 0 à 4 294 967 295.

  • negative_prompt : mots clés indiquant ce que vous ne souhaitez pas voir dans l’image de sortie. Maximum : 10 000 caractères.

import boto3 import json import base64 import io from PIL import Image bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='stability.sd3-ultra-v1:1', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) ) output_body = json.loads(response["body"].read().decode("utf-8")) base64_output_image = output_body["images"][0] image_data = base64.b64decode(base64_output_image) image = Image.open(io.BytesIO(image_data)) image.save("image.png")