Stability.ai Stable Diffusion 3.5 Large

Stable Diffusion 3.5 Large 모델은 80억 개의 파라미터를 사용하며 text-to-image 및 image-to-image 생성을 위해 1메가픽셀 해상도 출력을 지원합니다.

요청 본문은 InvokeModel 요청의 body 필드에 전달됩니다.

모델 간접 호출 요청 본문 필드

Stable Diffusion 3.5 Large 모델을 사용하여 InvokeModel을 호출하는 경우 본문 필드를 다음과 같은 JSON 객체로 채웁니다.

prompt - (문자열) 원하는 출력 이미지의 텍스트 설명입니다. 최대 10,000자.

최소	최대
0	10,000

모델 간접 호출 응답 본문 필드

Stable Diffusion 3.5 Large 모델을 사용하여 InvokeModel 호출하는 경우 응답은 다음과 같습니다.


{
    'seeds': [2130420379], 
    "finish_reasons":[null], 
    "images":["..."]
}

완료 이유가가 아닌 응답null은 다음과 같습니다.


{
    "finish_reasons":["Filter reason: prompt"]
}

seeds - (문자열) 모델의 이미지를 생성하는 데 사용되는 시드 목록입니다.
finish_reasons – 요청이 필터링되었는지 여부를 나타내는 열거형입니다. null은 요청이 성공했음을 나타냅니다. 현재 가능한 값: "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
images - base64 문자열 형식으로 생성된 이미지 목록입니다.

Text to image

Stability.ai Stable Diffusion 3.5 Large 모델에는 text-to-image 추론 직접 호출을 위한 다음의 추론 파라미터가 포함되어 있습니다.

프롬프트(문자열) - 원하는 출력 이미지의 텍스트 설명입니다. 최대 10,000자.

최소	최대
0	10,000

선택적 파라미터

aspect_ratio(문자열) - 생성된 이미지의 종횡비를 제어합니다. 이 파라미터는 text-to-image 요청에만 유효합니다. 열거형: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. 기본값은 1:1입니다.
mode(문자열)(GenerationMode) - 기본값: text-to-image. 열거형: image-to-image 또는 text-to-image입니다. text-to-image 생성인지, image-to-image 생성인지를 제어하며, 이에 따라 필요한 매개변수가 결정됩니다.
- text-to-image에는 프롬프트 파라미터만 필요합니다.
- image-to-image에는 프롬프트, 이미지 및 강도 파라미터가 필요합니다.

seed(숫자) - 생성 시 무작위성을 제어하는 값입니다. 범위는 0~4294967294입니다. 기본값은 0(랜덤 시드)입니다.

최소	최대	기본값
0	4294967294	0

negative_prompt(문자열) - 출력 이미지에서 제외할 요소를 설명하는 텍스트입니다. 최대 10,000자.

최소	최대
0	10,000

output_format(문자열) - 이미지 형식을 출력합니다. 열거형: jpeg, png, webp. 기본값은 png입니다.



import boto3
import json

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.'
    })
)

Image to image

Stability.ai Diffusion 3.5 모델에는 image-to-image 추론 직접 호출용으로 다음과 같은 추론 파라미터가 포함되어 있습니다.

프롬프트(문자열) - 원하는 출력 이미지의 텍스트 설명입니다. 최대 10,000자.

최소	최대
0	10,000

image(문자열) Base64-encoded 입력 이미지입니다. 측면당 최소 64픽셀입니다. 지원되는 형식: jpeg, png, webp.
mode(문자열)(GenerationMode) - 기본값: text-to-image. 열거형: image-to-image 또는 text-to-image입니다. text-to-image 생성인지, image-to-image 생성인지를 제어하며, 이에 따라 필요한 매개변수가 결정됩니다.
- text-to-image에는 프롬프트 파라미터만 필요합니다.
- image-to-image에는 프롬프트, 이미지 및 강도 파라미터가 필요합니다.

strength(숫자) - 출력에 대한 입력 이미지의 영향을 제어합니다. 범위는 0~1입니다. 값이 0이면 입력 이미지가 보존되고 값이 1이면 입력 이미지가 무시됩니다.

최소	최대
0	1

seed(숫자) - 생성 시 무작위성을 제어하는 값입니다. 범위는 0~4294967294입니다. 기본값은 0(랜덤 시드)입니다.

최소	최대	기본값
0	4294967294	0

negative_prompt(문자열) - 출력 이미지에서 제외할 요소를 설명하는 텍스트입니다. 최대 10,000자.

최소	최대
0	10,000

output_format(문자열) - 이미지 형식을 출력합니다. 열거형: jpeg, png, webp. 기본값은 png입니다.



import boto3
import base64
import json

# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
    image_base64 = base64.b64encode(image_file.read()).decode('utf-8')

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.',
        'image': image_base64,
        'strength': 0.7
    })
)

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

Stable Image Ultra

Stable Image Core