Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Stability.ai Difusi Stabil 3.5 Besar
Model Stable Diffusion 3.5 Large menggunakan 8 miliar parameter dan mendukung output resolusi 1 megapiksel untuk text-to-image dan image-to-image generasi.
Badan permintaan diteruskan di body
bidang permintaan ke InvokeModel.
Bidang badan permintaan pemanggilan model
Saat Anda melakukan InvokeModel panggilan menggunakan model Stable Diffusion 3.5 Large, isi bidang tubuh dengan objek JSON yang terlihat seperti di bawah ini.
Bidang tubuh respons pemanggilan model
Saat Anda melakukan InvokeModel
panggilan menggunakan model Stable Diffusion 3.5 Large, responsnya terlihat seperti di bawah ini
{
'seeds': [2130420379],
"finish_reasons":[null],
"images":["..."]
}
Tanggapan dengan alasan akhir yang tidaknull
, akan terlihat seperti di bawah ini:
{
"finish_reasons":["Filter reason: prompt"]
}
seed — (string) Daftar benih yang digunakan untuk menghasilkan gambar untuk model.
-
finish_reasons - Enum menunjukkan apakah permintaan itu disaring atau tidak. null
akan menunjukkan bahwa permintaan itu berhasil. Nilai yang mungkin saat ini:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null
.
-
gambar - Daftar gambar yang dihasilkan dalam format string base64.
- Text to image
-
Model Stability.ai Stable Diffusion 3.5 Large memiliki parameter inferensi berikut untuk panggilan inferensi. text-to-image
Parameter opsional
-
aspect_ratio
(string) — Mengontrol rasio aspek dari gambar yang dihasilkan. Hanya berlaku untuk text-to-image permintaan. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Standar 1:1.
-
mode
(string) (GenerationMode) - Default: text-to-image. Enum: image-to-image atau text-to-image. Mengontrol apakah ini adalah image-to-image generasi text-to-image atau generasi, yang memengaruhi parameter mana yang diperlukan:
-
text-to-image hanya membutuhkan parameter prompt.
-
image-to-image membutuhkan parameter prompt, gambar, dan kekuatan.
-
seed
(angka) — Nilai untuk mengontrol keacakan dalam generasi. Rentang 0 hingga 4294967294. Default 0 (benih acak).
Minimum |
Maksimum |
Default |
0 |
4294967294 |
0 |
-
negative_prompt
(string) — Teks yang menjelaskan elemen untuk dikecualikan dari gambar output. Maksimal 10.000 karakter.
Minimum |
Maksimum |
0 |
10.000 |
-
cfg_scale
(nomor) — Mengontrol kepatuhan pada teks prompt. Nilai yang lebih tinggi meningkatkan kepatuhan yang cepat. Rentang 1 hingga 10. Default 4.
Minimum |
Maksimum |
Default |
1 |
10 |
4 |
-
style_preset
(string) - Menerapkan gaya visual tertentu. Enum: model 3D, film analog, anime, sinematik, buku komik, seni digital, peningkatan, seni fantasi, isometrik, seni garis, poli rendah, senyawa pemodelan, neon-punk, origami, fotografi, seni piksel, tekstur ubin.
-
output_format
(string) - Format gambar keluaran. Enum: jpeg, png, webp. Default png.
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='us.stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.'
})
)
- Image to image
-
Model Stability.ai Stable Diffusion 3.5 Large memiliki parameter inferensi berikut untuk panggilan inferensi. image-to-image
-
prompt
(string) — Deskripsi teks dari gambar output yang diinginkan. Maksimal 10.000 karakter.
Minimum |
Maksimum |
0 |
10.000 |
-
image
(string) - Gambar masukan yang dikodekan Base64. Minimal 64 piksel per sisi. Format yang didukung: jpeg, png, webp.
-
mode
(string) (GenerationMode) - Default: text-to-image. Enum: image-to-image atau text-to-image. Mengontrol apakah ini adalah image-to-image generasi text-to-image atau generasi, yang memengaruhi parameter mana yang diperlukan:
-
text-to-image hanya membutuhkan parameter prompt.
-
image-to-image membutuhkan parameter prompt, gambar, dan kekuatan.
-
strength
(angka) — Mengontrol pengaruh gambar input pada output. Rentang 0 hingga 1. Nilai 0 mempertahankan gambar input, nilai 1 mengabaikan gambar input.
-
seed
(angka) — Nilai untuk mengontrol keacakan dalam generasi. Rentang 0 hingga 4294967294. Default 0 (benih acak).
Minimum |
Maksimum |
Default |
0 |
4294967294 |
0 |
-
negative_prompt
(string) — Teks yang menjelaskan elemen untuk dikecualikan dari gambar output. Maksimal 10.000 karakter.
Minimum |
Maksimum |
0 |
10.000 |
-
cfg_scale
(nomor) — Mengontrol kepatuhan pada teks prompt. Nilai yang lebih tinggi meningkatkan kepatuhan yang cepat. Rentang 1 hingga 10. Default 4.
Minimum |
Maksimum |
Default |
1 |
10 |
4 |
-
style_preset
(string) - Menerapkan gaya visual tertentu. Enum: model 3D, film analog, anime, sinematik, buku komik, seni digital, peningkatan, seni fantasi, isometrik, seni garis, poli rendah, senyawa pemodelan, neon-punk, origami, fotografi, seni piksel, tekstur ubin.
-
output_format
(string) - Format gambar keluaran. Enum: jpeg, png, webp. Default png.
import boto3
import base64
import json
# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
image_base64 = base64.b64encode(image_file.read()).decode('utf-8')
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='us.stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.',
'image': image_base64,
'strength': 0.7
})
)