Stability.ai Stable Diffusion 3.5 Large

Il modello Stable Diffusion 3.5 Large utilizza 8 miliardi di parametri e supporta l'output con risoluzione di 1 megapixel per la generazione text-to-image e image-to-image la generazione.

Il corpo della richiesta viene passato nel body campo di una richiesta a. InvokeModel

Campo del corpo della richiesta per l’invocazione del modello

Quando effettui una InvokeModel chiamata utilizzando un modello Stable Diffusion 3.5 Large, riempi il campo body con un oggetto JSON simile al seguente.

prompt: (stringa) descrizione testuale dell’immagine di output desiderata. Massimo 10.000 caratteri.

Minimo	Massimo
0	10.000

Campo del corpo delle risposte per l’invocazione del modello

Quando effettui una chiamata InvokeModel utilizzando un modello Stable Diffusion 3.5 Large, la risposta è simile alla seguente.


{
    'seeds': [2130420379], 
    "finish_reasons":[null], 
    "images":["..."]
}

Una risposta con una “finish reason” diversa da null avrà il seguente aspetto:


{
    "finish_reasons":["Filter reason: prompt"]
}

seeds: (stringa) elenco dei seed utilizzati per generare immagini per il modello.
finish_reasons: enum che indica se la richiesta è stata filtrata o meno. null indica che la richiesta è andata a buon fine. Valori correnti possibili: "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
images: un elenco di immagini generate in formato stringa base64.

Text to image

Il modello Stability.ai Stable Diffusion 3.5 Large ha i seguenti parametri di inferenza per una chiamata di inferenza. text-to-image

prompt (string) — Descrizione testuale dell'immagine di output desiderata. Massimo 10.000 caratteri.

Minimo	Massimo
0	10.000

Parametri opzionali

aspect_ratio (string) — Controlla le proporzioni dell'immagine generata. Valido solo per le richieste text-to-image. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Impostazione predefinita 1:1.
mode (string) (GenerationMode) - Predefinito: text-to-image. Enum: image-to-image o text-to-image. Controlla se si tratta di una image-to-image generazione text-to-image o, il che influisce sui parametri richiesti:
- text-to-image richiede solo il parametro prompt.
- image-to-image richiede i parametri prompt, image e strength.

seed (number) — Valore per controllare la casualità nella generazione. Intervallo compreso tra 0 e 4294967294. Impostazione predefinita: 0 (seed casuale).

Minimo	Massimo	Predefinita
0	4294967294	0

negative_prompt (string) — Testo che descrive gli elementi da escludere dall'immagine di output. Massimo 10.000 caratteri.

Minimo	Massimo
0	10.000

output_format (string) — Formato dell'immagine di output. Enum: jpeg, png, webp. Impostazione predefinita: png.



import boto3
import json

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.'
    })
)

Image to image

Il modello Stability.ai Stable Diffusion 3.5 Large ha i seguenti parametri di inferenza per una chiamata di inferenza. image-to-image

prompt (string) — Descrizione testuale dell'immagine di output desiderata. Massimo 10.000 caratteri.

Minimo	Massimo
0	10.000

image (string) — Immagine di input con codifica Base64. Minimo 64 pixel per lato. Formati supportati: jpeg, png, webp.
mode (string) () - PredefinitoGenerationMode:. text-to-image Enum: image-to-image o text-to-image. Controlla se si tratta di una image-to-image generazione text-to-image o, il che influisce sui parametri richiesti:
- text-to-image richiede solo il parametro prompt.
- image-to-image richiede i parametri prompt, image e strength.

forza (numero) — Controlla l'influenza dell'immagine in ingresso sull'output. Intervallo compreso tra 0 e 1. Il valore 0 preserva l’immagine di input, il valore 1 ignora l’immagine di input.

Minimo	Massimo
0	1

seed (number) — Valore per controllare la casualità nella generazione. Intervallo compreso tra 0 e 4294967294. Impostazione predefinita: 0 (seed casuale).

Minimo	Massimo	Predefinita
0	4294967294	0

negative_prompt (string) — Testo che descrive gli elementi da escludere dall'immagine di output. Massimo 10.000 caratteri.

Minimo	Massimo
0	10.000

output_format (string) — Formato dell'immagine di output. Enum: jpeg, png, webp. Impostazione predefinita: png.



import boto3
import base64
import json

# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
    image_base64 = base64.b64encode(image_file.read()).decode('utf-8')

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.',
        'image': image_base64,
        'strength': 0.7
    })
)

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Stable Image Ultra

Stable Image Core