Stability.ai Difusi Stabil 3.5 Besar - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Stability.ai Difusi Stabil 3.5 Besar

Model Stable Diffusion 3.5 Large menggunakan 8 miliar parameter dan mendukung output resolusi 1 megapiksel untuk text-to-image dan image-to-image generasi.

Badan permintaan diteruskan di body bidang permintaan ke InvokeModel.

Bidang badan permintaan pemanggilan model

Saat Anda melakukan InvokeModel panggilan menggunakan model Stable Diffusion 3.5 Large, isi bidang tubuh dengan objek JSON yang terlihat seperti di bawah ini.

  • prompt — (string) Deskripsi teks dari gambar output yang diinginkan. Maksimal 10.000 karakter.

    Minimum Maksimum

    0

    10.000

Bidang tubuh respons pemanggilan model

Saat Anda melakukan InvokeModel panggilan menggunakan model Stable Diffusion 3.5 Large, responsnya terlihat seperti di bawah ini

{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }

Tanggapan dengan alasan akhir yang tidaknull, akan terlihat seperti di bawah ini:

{ "finish_reasons":["Filter reason: prompt"] }
  • seed — (string) Daftar benih yang digunakan untuk menghasilkan gambar untuk model.

  • finish_reasons - Enum menunjukkan apakah permintaan itu disaring atau tidak. nullakan menunjukkan bahwa permintaan itu berhasil. Nilai yang mungkin saat ini:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.

  • gambar - Daftar gambar yang dihasilkan dalam format string base64.

Text to image

Model Stability.ai Stable Diffusion 3.5 Large memiliki parameter inferensi berikut untuk panggilan inferensi. text-to-image

  • prompt(string) — Deskripsi teks dari gambar output yang diinginkan. Maksimal 10.000 karakter.

    Minimum Maksimum
    0 10.000

Parameter opsional

  • aspect_ratio(string) — Mengontrol rasio aspek dari gambar yang dihasilkan. Hanya berlaku untuk text-to-image permintaan. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Standar 1:1.

  • mode(string) (GenerationMode) - Default: text-to-image. Enum: image-to-image atau text-to-image. Mengontrol apakah ini adalah image-to-image generasi text-to-image atau generasi, yang memengaruhi parameter mana yang diperlukan:

    • text-to-image hanya membutuhkan parameter prompt.

    • image-to-image membutuhkan parameter prompt, gambar, dan kekuatan.

  • seed(angka) — Nilai untuk mengontrol keacakan dalam generasi. Rentang 0 hingga 4294967294. Default 0 (benih acak).

    Minimum Maksimum Default
    0 4294967294 0
  • negative_prompt(string) — Teks yang menjelaskan elemen untuk dikecualikan dari gambar output. Maksimal 10.000 karakter.

    Minimum Maksimum
    0 10.000
  • cfg_scale(nomor) — Mengontrol kepatuhan pada teks prompt. Nilai yang lebih tinggi meningkatkan kepatuhan yang cepat. Rentang 1 hingga 10. Default 4.

    Minimum Maksimum Default
    1 10 4
  • style_preset(string) - Menerapkan gaya visual tertentu. Enum: model 3D, film analog, anime, sinematik, buku komik, seni digital, peningkatan, seni fantasi, isometrik, seni garis, poli rendah, senyawa pemodelan, neon-punk, origami, fotografi, seni piksel, tekstur ubin.

  • output_format(string) - Format gambar keluaran. Enum: jpeg, png, webp. Default png.

import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
Image to image

Model Stability.ai Stable Diffusion 3.5 Large memiliki parameter inferensi berikut untuk panggilan inferensi. image-to-image

  • prompt(string) — Deskripsi teks dari gambar output yang diinginkan. Maksimal 10.000 karakter.

    Minimum Maksimum
    0 10.000
  • image(string) - Gambar masukan yang dikodekan Base64. Minimal 64 piksel per sisi. Format yang didukung: jpeg, png, webp.

  • mode(string) (GenerationMode) - Default: text-to-image. Enum: image-to-image atau text-to-image. Mengontrol apakah ini adalah image-to-image generasi text-to-image atau generasi, yang memengaruhi parameter mana yang diperlukan:

    • text-to-image hanya membutuhkan parameter prompt.

    • image-to-image membutuhkan parameter prompt, gambar, dan kekuatan.

  • strength(angka) — Mengontrol pengaruh gambar input pada output. Rentang 0 hingga 1. Nilai 0 mempertahankan gambar input, nilai 1 mengabaikan gambar input.

    Minimum Maksimum
    0 1
  • seed(angka) — Nilai untuk mengontrol keacakan dalam generasi. Rentang 0 hingga 4294967294. Default 0 (benih acak).

    Minimum Maksimum Default
    0 4294967294 0
  • negative_prompt(string) — Teks yang menjelaskan elemen untuk dikecualikan dari gambar output. Maksimal 10.000 karakter.

    Minimum Maksimum
    0 10.000
  • cfg_scale(nomor) — Mengontrol kepatuhan pada teks prompt. Nilai yang lebih tinggi meningkatkan kepatuhan yang cepat. Rentang 1 hingga 10. Default 4.

    Minimum Maksimum Default
    1 10 4
  • style_preset(string) - Menerapkan gaya visual tertentu. Enum: model 3D, film analog, anime, sinematik, buku komik, seni digital, peningkatan, seni fantasi, isometrik, seni garis, poli rendah, senyawa pemodelan, neon-punk, origami, fotografi, seni piksel, tekstur ubin.

  • output_format(string) - Format gambar keluaran. Enum: jpeg, png, webp. Default png.

import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )