Stability.ai 稳定扩散 3.5 大号 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Stability.ai 稳定扩散 3.5 大号

Stable Diffusion 3.5 Large 型号使用 80 亿个参数,并支持 100 万像素分辨率的输出 text-to-image和 image-to-image生成。

请求正文在请求body字段中传递给InvokeModel

模型调用请求正文字段

当您使用 Stable Diffusion 3.5 大型模型 InvokeModel 拨打电话时,请使用如下所示的 JSON 对象填充正文字段。

  • pro mpt —(字符串)所需输出图像的文本描述。最多 1 万个字符。

    最小值 最大值

    0

    10000

模型调用响应正文字段

当你使用 Stable Diffusion 3.5 Large 模型InvokeModel拨打电话时,响应如下所示

{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }

完成原因非 null 的响应将类似于以下内容:

{ "finish_reasons":["Filter reason: prompt"] }
  • seeds –(字符串)用于为模型生成图像的种子列表。

  • finish_reasons – 表示请求是否被过滤的枚举。null 表示请求成功。当前可能的值:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null

  • images – 以 base64 字符串格式生成的图像列表。

Text to image

Stability.ai Stable Diffusion 3.5 大型模型具有以下用于推理调用的 text-to-image推理参数。

  • prompt(字符串)-所需输出图像的文本描述。最多 1 万个字符。

    最小值 最大值
    0 10000

可选参数

  • aspect_ratio(字符串)-控制生成图像的纵横比。仅对 text-to-image请求有效。枚举:16:9、1:1、21:9、2:3、3:2、4:5、5:4、9:16、9:21。默认为 1:1。

  • mode(字符串)(GenerationMode)-默认: text-to-image。枚举: image-to-image或。 text-to-image控制这是 text-to-image还是层 image-to-image代,这会影响需要哪些参数:

    • text-to-image 只需要提示参数。

    • image-to-image 需要提示、图像和强度参数。

  • seed(数字)-用于控制生成中随机性的值。范围 0 到 4294967294。默认 0(随机种子)。

    最小值 最大值 Default
    0 4294967294 0
  • negative_prompt(字符串)-描述要从输出图像中排除的元素的文本。最多 1 万个字符。

    最小值 最大值
    0 10000
  • cfg_scale(数字)-控制对提示文本的遵守情况。值越高,依从性越高。范围 1 到 10。默认值 4。

    最小值 最大值 Default
    1 10 4
  • style_preset(字符串)-应用特定的视觉风格。枚举:3D 模型、模拟电影、动漫、电影、漫画书、数字艺术、增强、幻想艺术、等距、线条艺术、低多边形、建模化合物、霓虹朋克、折纸、摄影、像素艺术、瓷砖纹理。

  • output_format(字符串)-输出图像格式。枚举:jpeg、png、webp。默认 png。

import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
Image to image

Stability.ai Stable Diffusion 3.5 大型模型具有以下用于推理调用的 image-to-image推理参数。

  • prompt(字符串)-所需输出图像的文本描述。最多 1 万个字符。

    最小值 最大值
    0 10000
  • image(字符串)— Base64 编码的输入图像。每边最少 64 像素。支持的格式:jpeg、png、webp。

  • mode(字符串)(GenerationMode)-默认: text-to-image。枚举: image-to-image或。 text-to-image控制这是 text-to-image还是层 image-to-image代,这会影响需要哪些参数:

    • text-to-image 只需要提示参数。

    • image-to-image 需要提示、图像和强度参数。

  • strength(数字)-控制输入图像对输出的影响。范围 0 到 1。值为 0 会保留输入图像,值为 1 会忽略输入图像。

    最小值 最大值
    0 1
  • seed(数字)-用于控制生成中随机性的值。范围 0 到 4294967294。默认 0(随机种子)。

    最小值 最大值 Default
    0 4294967294 0
  • negative_prompt(字符串)-描述要从输出图像中排除的元素的文本。最多 1 万个字符。

    最小值 最大值
    0 10000
  • cfg_scale(数字)-控制对提示文本的遵守情况。值越高,依从性越高。范围 1 到 10。默认值 4。

    最小值 最大值 Default
    1 10 4
  • style_preset(字符串)-应用特定的视觉风格。枚举:3D 模型、模拟电影、动漫、电影、漫画书、数字艺术、增强、幻想艺术、等距、线条艺术、低多边形、建模化合物、霓虹朋克、折纸、摄影、像素艺术、瓷砖纹理。

  • output_format(字符串)-输出图像格式。枚举:jpeg、png、webp。默认 png。

import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )