Stability.ai Stable Diffusion 3.5 Groß - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Stability.ai Stable Diffusion 3.5 Groß

Das Modell Stable Diffusion 3.5 Large verwendet 8 Milliarden Parameter und unterstützt die Ausgabe text-to-image und image-to-image Generierung mit einer Auflösung von 1 Megapixel.

Der Text der Anfrage wird im body Feld einer Anfrage an InvokeModelübergeben.

Feld für den Hauptteil der Modellaufrufanforderung

Wenn Sie mit einem Stable Diffusion 3.5 Large-Modell einen InvokeModel Anruf tätigen, füllen Sie das Textfeld mit einem JSON-Objekt, das wie das folgende aussieht.

  • prompt — (Zeichenfolge) Textbeschreibung des gewünschten Ausgabebildes. Maximal 10.000 Zeichen.

    Minimum Maximum

    0

    10.000

Textfeld „Modellaufruf“, „Antworten“

Wenn Sie einen InvokeModel Anruf mit einem Stable Diffusion 3.5 Large-Modell tätigen, sieht die Antwort wie folgt aus

{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }

Eine Antwort mit einem abschließenden Grund, der dies nicht istnull, sieht wie folgt aus:

{ "finish_reasons":["Filter reason: prompt"] }
  • seeds — (Zeichenfolge) Liste der Ausgangswerte, die zur Generierung von Bildern für das Modell verwendet wurden.

  • finish_reasons — Aufzählung, die angibt, ob die Anfrage gefiltert wurde oder nicht. nullgibt an, dass die Anfrage erfolgreich war. Aktuell mögliche Werte:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.

  • images — Eine Liste generierter Bilder im Base64-String-Format.

Text to image

Das Modell Stability.ai Stable Diffusion 3.5 Large hat die folgenden Inferenzparameter für einen text-to-image Inferenzaufruf.

  • prompt(string) — Textbeschreibung des gewünschten Ausgabebildes. Maximal 10.000 Zeichen.

    Minimum Maximum
    0 10.000

Optionale Parameter

  • aspect_ratio(string) — Steuert das Seitenverhältnis des generierten Bildes. Gilt nur für text-to-image Anfragen. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Standard 1:1.

  • mode(string) (GenerationMode) — Standard: text-to-image. Enum: image-to-image oder text-to-image. Steuert, ob es sich um eine text-to-image image-to-image Oder-Generation handelt, was sich darauf auswirkt, welche Parameter erforderlich sind:

    • text-to-image benötigt nur den Prompt-Parameter.

    • image-to-image benötigt die Parameter prompt, image und strength.

  • seed(Zahl) — Wert zur Steuerung der Zufälligkeit bei der Generierung. Bereich 0 bis 4294967294. Standard 0 (zufälliger Startwert).

    Minimum Maximum Standard
    0 4294967294 0
  • negative_prompt(string) — Text, der Elemente beschreibt, die aus dem Ausgabebild ausgeschlossen werden sollen. Maximal 10.000 Zeichen.

    Minimum Maximum
    0 10.000
  • cfg_scale(Zahl) — Steuert die Einhaltung des Aufforderungstextes. Höhere Werte erhöhen die Einhaltung der Eingabeaufforderung. Bereich 1 bis 10. Standard 4.

    Minimum Maximum Standard
    1 10 4
  • style_preset(string) — Wendet einen bestimmten visuellen Stil an. Enum: 3D-Modell, Analogfilm, Anime, Film, Comic, digitale Kunst, Enhance, Fantasy-Art, Isometrie, Line-Art, Low-Poly, Modeling-Compound, Neon-Punk, Origami, Fotografie, Pixel-Art, Kacheltextur.

  • output_format(string) — Ausgabebildformat. Enum: JPEG, PNG, Webp. Standard-PNG.

import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
Image to image

Das Modell Stability.ai Stable Diffusion 3.5 Large hat die folgenden Inferenzparameter für einen image-to-image Inferenzaufruf.

  • prompt(string) — Textbeschreibung des gewünschten Ausgabebildes. Maximal 10.000 Zeichen.

    Minimum Maximum
    0 10.000
  • image(string) — Base64-kodiertes Eingabebild. Mindestens 64 Pixel pro Seite. Unterstützte Formate: JPEG, PNG, Webp.

  • mode(string) (GenerationMode) — Standard: text-to-image. Enum: image-to-image oder text-to-image. Steuert, ob es sich um eine text-to-image image-to-image Oder-Generation handelt, was sich darauf auswirkt, welche Parameter erforderlich sind:

    • text-to-image benötigt nur den Prompt-Parameter.

    • image-to-image benötigt die Parameter prompt, image und strength.

  • strength(Zahl) — Steuert den Einfluss des Eingabebilds auf die Ausgabe. Bereich 0 bis 1. Bei einem Wert von 0 wird das Eingabebild beibehalten, bei einem Wert von 1 wird das Eingabebild ignoriert.

    Minimum Maximum
    0 1
  • seed(Zahl) — Wert zur Steuerung der Zufälligkeit bei der Generierung. Bereich 0 bis 4294967294. Standard 0 (zufälliger Startwert).

    Minimum Maximum Standard
    0 4294967294 0
  • negative_prompt(string) — Text, der Elemente beschreibt, die aus dem Ausgabebild ausgeschlossen werden sollen. Maximal 10.000 Zeichen.

    Minimum Maximum
    0 10.000
  • cfg_scale(Zahl) — Steuert die Einhaltung des Aufforderungstextes. Höhere Werte erhöhen die Einhaltung der Eingabeaufforderung. Bereich 1 bis 10. Standard 4.

    Minimum Maximum Standard
    1 10 4
  • style_preset(string) — Wendet einen bestimmten visuellen Stil an. Enum: 3D-Modell, Analogfilm, Anime, Film, Comic, digitale Kunst, Enhance, Fantasy-Art, Isometrie, Line-Art, Low-Poly, Modeling-Compound, Neon-Punk, Origami, Fotografie, Pixel-Art, Kacheltextur.

  • output_format(string) — Ausgabebildformat. Enum: JPEG, PNG, Webp. Standard-PNG.

import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )