Stability.ai Stabile Diffusion 3.5 Groß

Das Modell Stable Diffusion 3.5 Large verwendet 8 Milliarden Parameter und unterstützt die Ausgabe mit einer Auflösung von 1 Megapixel für die Text-zu-Bild- und Bild-zu-Bild-Generierung.

Der Hauptteil der Anfrage wird im body Feld einer Anfrage an übergeben InvokeModel.

Feld für den Hauptteil der Modellaufrufanforderung

Wenn Sie mit einem Stable Diffusion 3.5 Large-Modell einen InvokeModel Anruf tätigen, füllen Sie das Textfeld mit einem JSON-Objekt, das wie folgt aussieht.

prompt – (Zeichenfolge) Textbeschreibung des gewünschten Ausgabebildes Maximal 10.000 Zeichen.

Minimum	Maximum
0	10.000

Textfeld für Modellaufrufantworten

Wenn Sie mit einem Stable Diffusion 3.5 Large-Modell einen InvokeModel Anruf tätigen, sieht die Antwort wie folgt aus


{
    'seeds': [2130420379], 
    "finish_reasons":[null], 
    "images":["..."]
}

Eine Antwort mit einem abschließenden Grund, der dies nicht istnull, sieht wie folgt aus:


{
    "finish_reasons":["Filter reason: prompt"]
}

seeds – (Zeichenfolge) Seed-Liste zum Generieren von Bildern für das Modell
finish_reasons – Aufzählung, die angibt, ob die Anforderung gefiltert wurde oder nicht. null gibt an, dass die Anforderung erfolgreich war. Aktuelle mögliche Werte: "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
images – Eine Liste generierter Bilder im base64-Zeichenfolgenformat.

Text to image

Das Modell Stability.ai Stable Diffusion 3.5 Large hat die folgenden Inferenzparameter für einen Text-zu-Bild-Inferenzaufruf.

prompt (string) — Textbeschreibung des gewünschten Ausgabebildes. Maximal 10.000 Zeichen.

Minimum	Maximum
0	10.000

Optionale Parameter

aspect_ratio (string) — Steuert das Seitenverhältnis des generierten Bildes. Dieser Parameter ist nur für Text-zu-Bild-Anfragen gültig. Aufzählung: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Standard: 1:1
mode (string) (GenerationMode) — Standard: Text-zu-Bild. Enum: Bild-zu-Bild oder Text-zu-Bild. Steuert, ob es sich um eine Text-zu-Bild- oder Bild-zu-Bild-Generierung handelt, was sich darauf auswirkt, welche Parameter erforderlich sind:
- Für Text-zu-Bild ist nur der Prompt-Parameter erforderlich.
- Für Bild-zu-Bild sind die Parameter prompt, image und strength erforderlich.

seed (number) — Wert zur Steuerung der Zufälligkeit bei der Generierung. Der Bereich liegt zwischen 0 und 4294967294. Standard 0 (zufälliger Startwert).

Minimum	Maximum	Standard
0	4294967294	0

negative_prompt (string) — Text, der Elemente beschreibt, die aus dem Ausgabebild ausgeschlossen werden sollen. Maximal 10.000 Zeichen.

Minimum	Maximum
0	10.000

output_format (string) — Ausgabebildformat. Aufzählung: jpeg, png, webp. Standard: png



import boto3
import json

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.'
    })
)

Image to image

Das Modell Stability.ai Stable Diffusion 3.5 Large verfügt über die folgenden Inferenzparameter für einen Bild-zu-Bild-Inferenzaufruf.

prompt (string) — Textbeschreibung des gewünschten Ausgabebildes. Maximal 10.000 Zeichen.

Minimum	Maximum
0	10.000

image (string) — Base64-encoded Eingabebild. Mindestens 64 Pixel pro Seite. Unterstützte Formate: JPEG, PNG, WebP.
mode (string) (GenerationMode) — Standard: Text-zu-Bild. Enum: Bild-zu-Bild oder Text-zu-Bild. Steuert, ob es sich um eine Text-zu-Bild- oder Bild-zu-Bild-Generierung handelt, was sich darauf auswirkt, welche Parameter erforderlich sind:
- Für Text-zu-Bild ist nur der Prompt-Parameter erforderlich.
- Für Bild-zu-Bild sind die Parameter prompt, image und strength erforderlich.

strength (number) — Steuert den Einfluss des Eingabebilds auf die Ausgabe. Der Bereich liegt zwischen 0 und 1. Bei einem Wert von 0 wird das Eingabebild beibehalten, bei einem Wert von 1 wird das Eingabebild ignoriert.

Minimum	Maximum
0	1

seed (number) — Wert zur Steuerung der Zufälligkeit bei der Generierung. Der Bereich liegt zwischen 0 und 4294967294. Standard 0 (zufälliger Startwert).

Minimum	Maximum	Standard
0	4294967294	0

negative_prompt (string) — Text, der Elemente beschreibt, die aus dem Ausgabebild ausgeschlossen werden sollen. Maximal 10.000 Zeichen.

Minimum	Maximum
0	10.000

output_format (string) — Ausgabebildformat. Aufzählung: jpeg, png, webp. Standard: png



import boto3
import base64
import json

# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
    image_base64 = base64.b64encode(image_file.read()).decode('utf-8')

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.',
        'image': image_base64,
        'strength': 0.7
    })
)

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Stable Image Ultra

Stable Image Core