Stability.ai Stable Diffusion 3.5 Large - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Stability.ai Stable Diffusion 3.5 Large

Stable Diffusion 3.5 Large モデルは、80 億個のパラメータを使用し、text-to-imageへの出力とimage-to-image出力をサポートします。

リクエスト本文は、InvokeModel へのリクエストの bodyフィールドに渡されます。

モデル呼び出しリクエストの body フィールド

Stable Diffusion 3.5 Large モデルを使用して InvokeModel 呼び出しを行うときは、本文フィールドに次のような JSON オブジェクトを入力します。

  • prompt – (文字列) 目的の出力イメージのテキスト説明。最大 10,000 文字。

    最小値 最大値

    0

    10,000

モデル呼び出しレスポンスの body フィールド

Stable Diffusion 3.5 Large モデルを使用してInvokeModel呼び出しを行うと、レスポンスは次のようになります。

{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }

null ではない終了理由のレスポンスは、以下のようになります。

{ "finish_reasons":["Filter reason: prompt"] }
  • seeds – (文字列) モデルの画像生成に使用されるシードのリストです。

  • finish_reasons – リクエストがフィルタリングされたかどうかを示す列挙型です。null はリクエストが成功したことを示します。現在の可能な値: "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null

  • images – base64 文字列形式で生成された画像のリストです。

Text to image

Stability.ai Stable Diffusion 3.5 Large モデルには、text-to-image推論呼び出しに対して次の推論パラメータがあります。

  • prompt (文字列) – 目的の出力イメージのテキスト説明。最大 10,000 文字。

    最小値 最大値
    0 10,000

任意指定のパラメータ

  • aspect_ratio (文字列) – 生成された画像のアスペクト比を制御します。text-to-imageリクエストにのみ有効です。列挙型: 16:9、1:1、21:9、2:3、3:2、4:5、5:4、9:16、9:21。デフォルトは 1:1 です。

  • mode (文字列) (GenerationMode) - デフォルト: text-to-image。列挙型: image-to-image または text-to-image。これがtext-to-imageへの生成かimage-to-image生成かを制御します。これは、必要なパラメータに影響します。

    • text-to-image にはプロンプトパラメータのみが必要です。

    • image-to-image には、プロンプト、画像、および強度パラメータが必要です。

  • seed (数値) – 生成時のランダム性を制御する値。範囲は 0~4294967294 です。デフォルトは 0 (ランダムシード) です。

    最小値 最大値 デフォルト値
    0 4294967294 0
  • negative_prompt (文字列) – 出力イメージから除外する要素を説明するテキスト。最大 10,000 文字。

    最小値 最大値
    0 10,000
  • cfg_scale (数値) – プロンプトテキストへの準拠を制御します。値を大きくすると、プロンプトの準拠性が向上します。範囲は 1~10 です。デフォルトは 4 です。

    最小値 最大値 デフォルト値
    1 10 4
  • style_preset (文字列) – 特定のビジュアルスタイルを適用します。列挙型: 3d モデル、アナログフィルム、アニメーション、映像、コミックブック、デジタルアート、拡張、ファンタジーアート、等角、ラインアート、低ポリ、モデリング複合、ネオンパンク、折り紙、写真、ピクセルアート、タイルテクスチャ。

  • output_format (文字列) – 出力イメージ形式。列挙型: jpeg、png、webp。デフォルトの png。

import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
Image to image

Stability.ai Stable Diffusion 3.5 Large モデルには、image-to-image 推論呼び出し用の次の推論パラメータがあります。

  • prompt (文字列) – 目的の出力イメージのテキスト説明。最大 10,000 文字。

    最小値 最大値
    0 10,000
  • image (文字列) – Base64-encodedされた入力イメージ。1 辺あたり 64 ピクセル以上。サポートされている形式: jpeg、png、webp。

  • mode (文字列) (GenerationMode) - デフォルト: text-to-image。列挙型: image-to-image または text-to-image。これがtext-to-imageへの生成かimage-to-image生成かを制御します。これは、必要なパラメータに影響します。

    • text-to-image にはプロンプトパラメータのみが必要です。

    • image-to-image には、プロンプト、画像、および強度パラメータが必要です。

  • strength (数値) – 入力イメージの出力への影響を制御します。範囲は 0~1 です。値 0 は入力イメージを保持し、値 1 は入力イメージを無視します。

    最小値 最大値
    0 1
  • seed (数値) – 生成時のランダム性を制御する値。範囲は 0~4294967294 です。デフォルトは 0 (ランダムシード) です。

    最小値 最大値 デフォルト値
    0 4294967294 0
  • negative_prompt (文字列) – 出力イメージから除外する要素を説明するテキスト。最大 10,000 文字。

    最小値 最大値
    0 10,000
  • cfg_scale (数値) – プロンプトテキストへの準拠を制御します。値を大きくすると、プロンプトの準拠性が向上します。範囲は 1~10 です。デフォルトは 4 です。

    最小値 最大値 デフォルト値
    1 10 4
  • style_preset (文字列) – 特定のビジュアルスタイルを適用します。列挙型: 3d モデル、アナログフィルム、アニメーション、映像、コミックブック、デジタルアート、拡張、ファンタジーアート、等角、ラインアート、低ポリ、モデリング複合、ネオンパンク、折り紙、写真、ピクセルアート、タイルテクスチャ。

  • output_format (文字列) – 出力イメージ形式。列挙型: jpeg、png、webp。デフォルトの png。

import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )