Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Stability.ai Stable Diffusion 3.5 Groß
Das Modell Stable Diffusion 3.5 Large verwendet 8 Milliarden Parameter und unterstützt die Ausgabe text-to-image und image-to-image Generierung mit einer Auflösung von 1 Megapixel.
Der Text der Anfrage wird im body
Feld einer Anfrage an InvokeModelübergeben.
Feld für den Hauptteil der Modellaufrufanforderung
Wenn Sie mit einem Stable Diffusion 3.5 Large-Modell einen InvokeModel Anruf tätigen, füllen Sie das Textfeld mit einem JSON-Objekt, das wie das folgende aussieht.
Textfeld „Modellaufruf“, „Antworten“
Wenn Sie einen InvokeModel
Anruf mit einem Stable Diffusion 3.5 Large-Modell tätigen, sieht die Antwort wie folgt aus
{
'seeds': [2130420379],
"finish_reasons":[null],
"images":["..."]
}
Eine Antwort mit einem abschließenden Grund, der dies nicht istnull
, sieht wie folgt aus:
{
"finish_reasons":["Filter reason: prompt"]
}
seeds — (Zeichenfolge) Liste der Ausgangswerte, die zur Generierung von Bildern für das Modell verwendet wurden.
-
finish_reasons — Aufzählung, die angibt, ob die Anfrage gefiltert wurde oder nicht. null
gibt an, dass die Anfrage erfolgreich war. Aktuell mögliche Werte:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null
.
-
images — Eine Liste generierter Bilder im Base64-String-Format.
- Text to image
-
Das Modell Stability.ai Stable Diffusion 3.5 Large hat die folgenden Inferenzparameter für einen text-to-image Inferenzaufruf.
Optionale Parameter
-
aspect_ratio
(string) — Steuert das Seitenverhältnis des generierten Bildes. Gilt nur für text-to-image Anfragen. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Standard 1:1.
-
mode
(string) (GenerationMode) — Standard: text-to-image. Enum: image-to-image oder text-to-image. Steuert, ob es sich um eine text-to-image image-to-image Oder-Generation handelt, was sich darauf auswirkt, welche Parameter erforderlich sind:
-
text-to-image benötigt nur den Prompt-Parameter.
-
image-to-image benötigt die Parameter prompt, image und strength.
-
seed
(Zahl) — Wert zur Steuerung der Zufälligkeit bei der Generierung. Bereich 0 bis 4294967294. Standard 0 (zufälliger Startwert).
Minimum |
Maximum |
Standard |
0 |
4294967294 |
0 |
-
negative_prompt
(string) — Text, der Elemente beschreibt, die aus dem Ausgabebild ausgeschlossen werden sollen. Maximal 10.000 Zeichen.
-
cfg_scale
(Zahl) — Steuert die Einhaltung des Aufforderungstextes. Höhere Werte erhöhen die Einhaltung der Eingabeaufforderung. Bereich 1 bis 10. Standard 4.
Minimum |
Maximum |
Standard |
1 |
10 |
4 |
-
style_preset
(string) — Wendet einen bestimmten visuellen Stil an. Enum: 3D-Modell, Analogfilm, Anime, Film, Comic, digitale Kunst, Enhance, Fantasy-Art, Isometrie, Line-Art, Low-Poly, Modeling-Compound, Neon-Punk, Origami, Fotografie, Pixel-Art, Kacheltextur.
-
output_format
(string) — Ausgabebildformat. Enum: JPEG, PNG, Webp. Standard-PNG.
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='us.stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.'
})
)
- Image to image
-
Das Modell Stability.ai Stable Diffusion 3.5 Large hat die folgenden Inferenzparameter für einen image-to-image Inferenzaufruf.
-
prompt
(string) — Textbeschreibung des gewünschten Ausgabebildes. Maximal 10.000 Zeichen.
-
image
(string) — Base64-kodiertes Eingabebild. Mindestens 64 Pixel pro Seite. Unterstützte Formate: JPEG, PNG, Webp.
-
mode
(string) (GenerationMode) — Standard: text-to-image. Enum: image-to-image oder text-to-image. Steuert, ob es sich um eine text-to-image image-to-image Oder-Generation handelt, was sich darauf auswirkt, welche Parameter erforderlich sind:
-
text-to-image benötigt nur den Prompt-Parameter.
-
image-to-image benötigt die Parameter prompt, image und strength.
-
strength
(Zahl) — Steuert den Einfluss des Eingabebilds auf die Ausgabe. Bereich 0 bis 1. Bei einem Wert von 0 wird das Eingabebild beibehalten, bei einem Wert von 1 wird das Eingabebild ignoriert.
-
seed
(Zahl) — Wert zur Steuerung der Zufälligkeit bei der Generierung. Bereich 0 bis 4294967294. Standard 0 (zufälliger Startwert).
Minimum |
Maximum |
Standard |
0 |
4294967294 |
0 |
-
negative_prompt
(string) — Text, der Elemente beschreibt, die aus dem Ausgabebild ausgeschlossen werden sollen. Maximal 10.000 Zeichen.
-
cfg_scale
(Zahl) — Steuert die Einhaltung des Aufforderungstextes. Höhere Werte erhöhen die Einhaltung der Eingabeaufforderung. Bereich 1 bis 10. Standard 4.
Minimum |
Maximum |
Standard |
1 |
10 |
4 |
-
style_preset
(string) — Wendet einen bestimmten visuellen Stil an. Enum: 3D-Modell, Analogfilm, Anime, Film, Comic, digitale Kunst, Enhance, Fantasy-Art, Isometrie, Line-Art, Low-Poly, Modeling-Compound, Neon-Punk, Origami, Fotografie, Pixel-Art, Kacheltextur.
-
output_format
(string) — Ausgabebildformat. Enum: JPEG, PNG, Webp. Standard-PNG.
import boto3
import base64
import json
# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
image_base64 = base64.b64encode(image_file.read()).decode('utf-8')
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='us.stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.',
'image': image_base64,
'strength': 0.7
})
)