本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Stability.ai 稳定扩散 3.5 大号
Stable Diffusion 3.5 Large 型号使用 80 亿个参数,并支持 100 万像素分辨率的输出 text-to-image和 image-to-image生成。
请求正文在请求body
字段中传递给InvokeModel。
模型调用请求正文字段
当您使用 Stable Diffusion 3.5 大型模型 InvokeModel 拨打电话时,请使用如下所示的 JSON 对象填充正文字段。
-
pro mpt —(字符串)所需输出图像的文本描述。最多 1 万个字符。
最小值 最大值 0
10000
模型调用响应正文字段
当你使用 Stable Diffusion 3.5 Large 模型InvokeModel
拨打电话时,响应如下所示
{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }
完成原因非 null
的响应将类似于以下内容:
{ "finish_reasons":["Filter reason: prompt"] }
seeds –(字符串)用于为模型生成图像的种子列表。
-
finish_reasons – 表示请求是否被过滤的枚举。
null
表示请求成功。当前可能的值:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null
。 -
images – 以 base64 字符串格式生成的图像列表。
- Text to image
-
Stability.ai Stable Diffusion 3.5 大型模型具有以下用于推理调用的 text-to-image推理参数。
-
prompt
(字符串)-所需输出图像的文本描述。最多 1 万个字符。最小值 最大值 0 10000
可选参数
-
aspect_ratio
(字符串)-控制生成图像的纵横比。仅对 text-to-image请求有效。枚举:16:9、1:1、21:9、2:3、3:2、4:5、5:4、9:16、9:21。默认为 1:1。 -
mode
(字符串)(GenerationMode)-默认: text-to-image。枚举: image-to-image或。 text-to-image控制这是 text-to-image还是层 image-to-image代,这会影响需要哪些参数:-
text-to-image 只需要提示参数。
-
image-to-image 需要提示、图像和强度参数。
-
-
seed
(数字)-用于控制生成中随机性的值。范围 0 到 4294967294。默认 0(随机种子)。最小值 最大值 Default 0 4294967294 0 -
negative_prompt
(字符串)-描述要从输出图像中排除的元素的文本。最多 1 万个字符。最小值 最大值 0 10000 -
cfg_scale
(数字)-控制对提示文本的遵守情况。值越高,依从性越高。范围 1 到 10。默认值 4。最小值 最大值 Default 1 10 4 -
style_preset
(字符串)-应用特定的视觉风格。枚举:3D 模型、模拟电影、动漫、电影、漫画书、数字艺术、增强、幻想艺术、等距、线条艺术、低多边形、建模化合物、霓虹朋克、折纸、摄影、像素艺术、瓷砖纹理。 -
output_format
(字符串)-输出图像格式。枚举:jpeg、png、webp。默认 png。
import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
-
- Image to image
-
Stability.ai Stable Diffusion 3.5 大型模型具有以下用于推理调用的 image-to-image推理参数。
-
prompt
(字符串)-所需输出图像的文本描述。最多 1 万个字符。最小值 最大值 0 10000 -
image
(字符串)— Base64 编码的输入图像。每边最少 64 像素。支持的格式:jpeg、png、webp。 -
mode
(字符串)(GenerationMode)-默认: text-to-image。枚举: image-to-image或。 text-to-image控制这是 text-to-image还是层 image-to-image代,这会影响需要哪些参数:-
text-to-image 只需要提示参数。
-
image-to-image 需要提示、图像和强度参数。
-
-
strength
(数字)-控制输入图像对输出的影响。范围 0 到 1。值为 0 会保留输入图像,值为 1 会忽略输入图像。最小值 最大值 0 1 -
seed
(数字)-用于控制生成中随机性的值。范围 0 到 4294967294。默认 0(随机种子)。最小值 最大值 Default 0 4294967294 0 -
negative_prompt
(字符串)-描述要从输出图像中排除的元素的文本。最多 1 万个字符。最小值 最大值 0 10000 -
cfg_scale
(数字)-控制对提示文本的遵守情况。值越高,依从性越高。范围 1 到 10。默认值 4。最小值 最大值 Default 1 10 4 -
style_preset
(字符串)-应用特定的视觉风格。枚举:3D 模型、模拟电影、动漫、电影、漫画书、数字艺术、增强、幻想艺术、等距、线条艺术、低多边形、建模化合物、霓虹朋克、折纸、摄影、像素艺术、瓷砖纹理。 -
output_format
(字符串)-输出图像格式。枚举:jpeg、png、webp。默认 png。
import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )
-