Stability.ai Difusi Stabil 3.5 Besar

Model Stable Diffusion 3.5 Large menggunakan 8 miliar parameter dan mendukung output resolusi 1 megapiksel untuk pembuatan text-to-image dan image-to-image.

Badan permintaan diteruskan di body bidang permintaan ke InvokeModel.

Bidang badan permintaan pemanggilan model

Saat Anda melakukan InvokeModel panggilan menggunakan model Stable Diffusion 3.5 Large, isi bidang tubuh dengan objek JSON yang terlihat seperti berikut ini.

prompt — (string) Deskripsi teks dari gambar output yang diinginkan. Maksimal 10.000 karakter.

Minimum	Maksimum
0	10.000

Bidang tubuh respons pemanggilan model

Saat Anda melakukan InvokeModel panggilan menggunakan model Stable Diffusion 3.5 Large, responsnya terlihat seperti berikut


{
    'seeds': [2130420379], 
    "finish_reasons":[null], 
    "images":["..."]
}

Tanggapan dengan alasan akhir yang tidaknull, akan terlihat seperti berikut:


{
    "finish_reasons":["Filter reason: prompt"]
}

seed — (string) Daftar benih yang digunakan untuk menghasilkan gambar untuk model.
finish_reasons - Enum menunjukkan apakah permintaan itu disaring atau tidak. nullakan menunjukkan bahwa permintaan itu berhasil. Nilai yang mungkin saat ini:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
gambar - Daftar gambar yang dihasilkan dalam format string base64.

Text to image

Model Stability.ai Stable Diffusion 3.5 Large memiliki parameter inferensi berikut untuk panggilan inferensi teks-ke-gambar.

prompt (string) — Deskripsi teks dari gambar output yang diinginkan. Maksimal 10.000 karakter.

Minimum	Maksimum
0	10.000

Parameter opsional

aspect_ratio (string) - Mengontrol rasio aspek dari gambar yang dihasilkan. Hanya berlaku untuk permintaan text-to-image. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Standar 1:1.
mode (string) (GenerationMode) - Default: teks-ke-gambar. Enum: gambar-ke-gambar atau teks-ke-gambar. Mengontrol apakah ini adalah pembuatan text-to-image atau image-to-image, yang memengaruhi parameter mana yang diperlukan:
- text-to-image hanya membutuhkan parameter prompt.
- image-to-image membutuhkan parameter prompt, image, dan strength.

seed (number) — Nilai untuk mengontrol keacakan dalam generasi. Rentang 0 hingga 4294967294. Default 0 (benih acak).

Minimum	Maksimum	Default
0	4294967294	0

negative_prompt (string) - Teks yang menjelaskan elemen untuk dikecualikan dari gambar output. Maksimal 10.000 karakter.

Minimum	Maksimum
0	10.000

output_format (string) - Format gambar keluaran. Enum: jpeg, png, webp. Default png.



import boto3
import json

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.'
    })
)

Image to image

Model Stability.ai Stable Diffusion 3.5 Large memiliki parameter inferensi berikut untuk panggilan inferensi gambar-ke-gambar.

prompt (string) — Deskripsi teks dari gambar output yang diinginkan. Maksimal 10.000 karakter.

Minimum	Maksimum
0	10.000

image (string) — gambar Base64-encoded masukan. Minimal 64 piksel per sisi. Format yang didukung: jpeg, png, webp.
mode (string) (GenerationMode) - Default: teks-ke-gambar. Enum: gambar-ke-gambar atau teks-ke-gambar. Mengontrol apakah ini adalah pembuatan text-to-image atau image-to-image, yang memengaruhi parameter mana yang diperlukan:
- text-to-image hanya membutuhkan parameter prompt.
- image-to-image membutuhkan parameter prompt, image, dan strength.

kekuatan (angka) — Mengontrol pengaruh gambar input pada output. Rentang 0 hingga 1. Nilai 0 mempertahankan gambar input, nilai 1 mengabaikan gambar input.

Minimum	Maksimum
0	1

seed (number) — Nilai untuk mengontrol keacakan dalam generasi. Rentang 0 hingga 4294967294. Default 0 (benih acak).

Minimum	Maksimum	Default
0	4294967294	0

negative_prompt (string) - Teks yang menjelaskan elemen untuk dikecualikan dari gambar output. Maksimal 10.000 karakter.

Minimum	Maksimum
0	10.000

output_format (string) - Format gambar keluaran. Enum: jpeg, png, webp. Default png.



import boto3
import base64
import json

# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
    image_base64 = base64.b64encode(image_file.read()).decode('utf-8')

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.',
        'image': image_base64,
        'strength': 0.7
    })
)

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Gambar Stabil Ultra

Inti Gambar Stabil