기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Stability.ai Stable Diffusion 3.5 라지
Stable Diffusion 3.5 Large 모델은 80억 개의 파라미터를 사용하며 text-to-image 및 image-to-image 생성을 위해 1메가픽셀 해상도 출력을 지원합니다.
요청 본문은 InvokeModel에 대한 요청의 body
필드에 전달됩니다.
모델 간접 호출 요청 본문 필드
Stable Diffusion 3.5 Large 모델을 사용하여 InvokeModel을 호출하는 경우 본문 필드를 아래와 같은 JSON 객체로 채웁니다.
-
prompt - (문자열) 원하는 출력 이미지의 텍스트 설명입니다. 최대 10,000자.
최소 Maximum 0
10,000
모델 간접 호출 응답 본문 필드
Stable Diffusion 3.5 Large 모델을 사용하여 InvokeModel
호출하는 경우 응답은 다음과 같습니다.
{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }
종료 이유가 null
이 아닌 응답은 다음과 같은 모습입니다.
{ "finish_reasons":["Filter reason: prompt"] }
seeds - (문자열) 모델의 이미지를 생성하는 데 사용되는 시드 목록입니다.
-
finish_reasons – 요청이 필터링되었는지 여부를 나타내는 열거형입니다.
null
은 요청이 성공했음을 나타냅니다. 현재 가능한 값:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null
. -
images - base64 문자열 형식으로 생성된 이미지 목록입니다.
- Text to image
-
Stability.ai Stable Diffusion 3.5 Large 모델에는 text-to-image 추론 호출에 대한 다음과 같은 추론 파라미터가 있습니다.
-
prompt
(문자열) - 원하는 출력 이미지의 텍스트 설명입니다. 최대 10,000자.최소 Maximum 0 10,000
선택적 파라미터
-
aspect_ratio
(문자열) - 생성된 이미지의 종횡비를 제어합니다. text-to-image 요청에만 유효합니다. 열거형: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. 기본값: 1:1. -
mode
(문자열) (GenerationMode) - 기본값: text-to-image. 열거형: image-to-image 또는 text-to-image. text-to-image 생성인지 image-to-image 생성인지를 제어하여 필요한 파라미터에 영향을 줍니다.-
text-to-image에는 프롬프트 파라미터만 필요합니다.
-
image-to-image에는 프롬프트, 이미지 및 강도 파라미터가 필요합니다.
-
-
seed
(숫자) - 생성 시 무작위성을 제어하는 값입니다. 범위는 0~4294967294입니다. 기본값 0(랜덤 시드).최소 Maximum 기본값 0 4294967294 0 -
negative_prompt
(문자열) - 출력 이미지에서 제외할 요소를 설명하는 텍스트입니다. 최대 10,000자.최소 Maximum 0 10,000 -
cfg_scale
(숫자) - 프롬프트 텍스트 준수를 제어합니다. 값이 높을수록 프롬프트 준수가 증가합니다. 범위는 1~10입니다. 기본값 4.최소 Maximum 기본값 1 10 4 -
style_preset
(문자열) - 특정 시각적 스타일을 적용합니다. 열거형: 3d-model, analog-film, anime, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, Neon-punk, origami, photoic, pixel-art, tile-texture. -
output_format
(문자열) - 이미지 형식을 출력합니다. 열거형: jpeg, png, webp. 기본 png.
import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
-
- Image to image
-
Stability.ai Stable Diffusion 3.5 Large 모델에는 image-to-image 추론 호출에 대한 다음과 같은 추론 파라미터가 있습니다.
-
prompt
(문자열) - 원하는 출력 이미지의 텍스트 설명입니다. 최대 10,000자.최소 Maximum 0 10,000 -
image
(문자열) Base64-encoded 입력 이미지입니다. 측면당 최소 64픽셀. 지원되는 형식: jpeg, png, webp. -
mode
(문자열) (GenerationMode) - 기본값: text-to-image. 열거형: image-to-image 또는 text-to-image. text-to-image 생성인지 image-to-image 생성인지를 제어하여 필요한 파라미터에 영향을 줍니다.-
text-to-image에는 프롬프트 파라미터만 필요합니다.
-
image-to-image에는 프롬프트, 이미지 및 강도 파라미터가 필요합니다.
-
-
strength
(숫자) - 입력 이미지가 출력에 미치는 영향을 제어합니다. 범위는 0~1입니다. 값이 0이면 입력 이미지가 보존되고 값이 1이면 입력 이미지가 무시됩니다.최소 Maximum 0 1 -
seed
(숫자) - 생성 시 무작위성을 제어하는 값입니다. 범위는 0~4294967294입니다. 기본값 0(랜덤 시드).최소 Maximum 기본값 0 4294967294 0 -
negative_prompt
(문자열) - 출력 이미지에서 제외할 요소를 설명하는 텍스트입니다. 최대 10,000자.최소 Maximum 0 10,000 -
cfg_scale
(숫자) - 프롬프트 텍스트 준수를 제어합니다. 값이 높을수록 프롬프트 준수가 증가합니다. 범위는 1~10입니다. 기본값 4.최소 Maximum 기본값 1 10 4 -
style_preset
(문자열) - 특정 시각적 스타일을 적용합니다. 열거형: 3d-model, analog-film, anime, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, Neon-punk, origami, photoic, pixel-art, tile-texture. -
output_format
(문자열) - 이미지 형식을 출력합니다. 열거형: jpeg, png, webp. 기본 png.
import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='us.stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )
-