기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
안정성 AI 이미지 서비스
Amazon Bedrock과 함께 Stability AI Image Services를 사용하여 전문적인 크리에이티브 워크플로를 가속화하도록 설계된 9가지 특수 이미지 편집 도구에 액세스할 수 있습니다. Stability AI Image Services를 사용하면 스케치에서 이미지를 생성하거나, 기존 이미지를 재구성 및 다시 스타일화하거나, 이미지 내의 객체를 제거 및 교체할 수 있습니다.
이 섹션에서는 InvokeModel을 사용하여 Stability AI Image Services를 추론 호출하는 방법을 설명합니다. 또한이 섹션에서는 Python의 코드 예제와 Stability AI Image Services 사용 전후의 이미지 예제를 제공합니다.
안정성 AI 이미지 서비스는 다음 범주에서 사용할 수 있습니다.
편집 - 마스크(생성 채우기) 또는 단어를 사용한 인페인팅을 포함한 AI 기반 이미지 편집 서비스입니다. 제품 배치 및 광고를 위한 도구와 배경 제거와 같은 기본 도구를 포함합니다.
제어 - 프롬프트, 맵 및 기타 가이드를 사용할 수 있습니다. 이러한 서비스는 안정적인 확산 모델을 기반으로 구축된 ControlNets 유사한 기술을 활용합니다.
참고
편집 또는 제어 Stability AI Image Service를 구독하면 사용 가능한 9개의 모든 Stability AI Image Services에 자동으로 등록됩니다.
요청 및 응답
요청 본문은 InvokeModel에 대한 요청의 body
필드에 전달됩니다.
모델 간접 호출 요청 본문 필드
Stability AI Image Services를 사용하여 InvokeModel을 호출할 때 본문 필드를 아래와 같은 JSON 객체로 채웁니다.
{ 'prompt': 'Create an image of a panda' }
모델 간접 호출 응답 본문 필드
Stability AI Image Services를 사용하여 InvokeModel을 호출하면 응답은 다음과 같습니다.
{ 'seeds': [2130420379], 'finish_reasons': [null], 'images': ['...'] }
seeds - (문자열) 모델의 이미지를 생성하는 데 사용되는 시드 목록입니다.
-
finish_reasons – 요청이 필터링되었는지 여부를 나타내는 열거형입니다.
null
은 요청이 성공했음을 나타냅니다. 현재 가능한 값:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null
. -
images - base64 문자열 형식으로 생성된 이미지 목록입니다.
자세한 내용은 https://platform.us.stability.ai/docs/api-reference#tag/v1generation
Edit
다음 섹션에서는 안정성 AI 이미지 서비스 편집에 대해 설명합니다.
Inpaint는 마스크 이미지의 내용을 기반으로 지정된 영역을 채우거나 새 콘텐츠로 대체하여 이미지를 지능적으로 수정합니다.
Inpaint에는 다음과 같은 필수 파라미터가 있습니다.
프롬프트 - 출력 이미지에서 보려는 내용입니다. 요소, 색상 및 주제를 명확하게 정의하는 강력하고 설명적인 프롬프트를 사용하면 더 나은 결과를 얻을 수 있습니다. 지정된 단어의 가중치를 제어하려면 형식(word:weight)을 사용합니다. 여기서 단어는 가중치를 제어하려는 단어이고 가중치는 값입니다. 값 0과 1.0은 단어를 강조 표시하지 않고 1.1과 2 사이의 값은 단어를 강조했습니다. 예: 하늘이 선명하고(blue:0.3) (green:1.8) 파란색과 녹색이지만 파란색보다 녹색인 하늘을 전달합니다. 최소 0자 및 최대 10,000자.
image ‐ (string) 인페인트할 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
다음 파라미터는 선택적입니다.
style_preset ‐ (문자열) 이미지 모델을 특정 스타일로 안내합니다. 열거형: 3d-model, analog-film, anime, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, Neon-punk, origami, photoic, pixel-art, tile-texture.
negative_prompt ‐ (문자열) 출력 이미지에서 보고 싶지 않은 내용을 설명하는 텍스트 흐림입니다. 이는 고급 기능입니다. 최대 10,000자.
seed ‐ (number) 생성의 '무작위성'을 안내하는 데 사용되는 특정 값입니다. (임의 시드를 사용하려면 이 파라미터를 생략하거나 0을 전달합니다.) 범위는 0~4294967294입니다. 기본값은 0입니다.
output_format ‐ (문자열) 생성된 이미지의 콘텐츠 유형을 대체합니다. 열거형: jpeg, png, webp. 기본 png.
mask ‐ (문자열) 두 번째 이미지(이 파라미터로 전달됨) 또는 이미지 파라미터의 알파 채널을 통해 픽셀 단위로 인페인팅 프로세스의 강도를 제어합니다.
마스크 통과 -이 파라미터에 전달되는 이미지는 지정된 픽셀이 얼마나 어둡거나 밝는지에 따라 어떤 픽셀에서든 인페인팅 강도를 나타내는 검은색 및 흰색 이미지여야 합니다. 완전히 검은색 픽셀은 인페인팅 강도를 나타내지 않는 반면 완전히 흰색 픽셀은 최대 강도를 나타냅니다. 마스크의 크기가 이미지 파라미터와 다른 경우 마스크의 크기가 자동으로 조정됩니다.
알파 채널 지원 - 명시적 마스크를 제공하지 않으면 이미지 파라미터의 알파 채널에서 마스크가 파생됩니다. 투명 픽셀은 페인팅되고 불투명 픽셀은 보존됩니다. 알파 채널이 있는 이미지가 마스크와 함께 제공되는 경우 마스크가 우선합니다.
grow_mask - 지정된 픽셀 수만큼 마스크 가장자리를 모든 방향으로 바깥쪽으로 자릅니다. 마스크 주위의 확장된 영역이 흐려져 인페인팅된 콘텐츠와 원본 이미지 간의 전환을 원활하게 하는 데 도움이 될 수 있습니다. 범위는 0~20입니다. 기본값 5. 인페인팅된 콘텐츠 주위에 심이나 거친 엣지가 보이면이 파라미터를 사용해 보세요. 과도한 증가는 마스크의 세부 정보를 가리거나 근처의 마스킹된 리전을 병합할 수 있습니다.
다음 표에는 Inpaint 작업의 입력 및 출력 이미지가 나와 있습니다.
입력 |
Mask |
출력 |
---|---|---|
![]() |
![]() |
![]() |
Stable Image Ultra에서 생성한 “Man in metropolis”, Sanwal Yousaf에서 만든 프롬프트 및 편집. CC BY 4.0 |
검색 및 색상 변경을 사용하면 프롬프트를 사용하여 이미지에서 특정 객체의 색상을 변경할 수 있습니다. 이 서비스는 마스크가 필요하지 않은 특정 버전의 인페인팅입니다. 자동으로 객체를 분할하고 프롬프트에서 요청한 색상을 사용하여 다시 색상을 지정합니다.
Search 및 Recolor에는 다음과 같은 필수 파라미터가 있습니다.
프롬프트 - 출력 이미지에서 보려는 내용입니다. 요소, 색상 및 주제를 명확하게 정의하는 강력하고 설명적인 프롬프트를 사용하면 더 나은 결과를 얻을 수 있습니다. 지정된 단어의 가중치를 제어하려면 형식(word:weight)을 사용합니다. 여기서 단어는 가중치를 제어하려는 단어이고 가중치는 값입니다. 값 0과 1.0은 단어를 강조 표시하지 않고 1.1과 2 사이의 값은 단어를 강조했습니다. 예: 하늘이 선명하고(blue:0.3) (green:1.8) 파란색과 녹색이지만 파란색보다 녹색인 하늘을 전달합니다. 최소 0자 및 최대 10,000자.
image ‐ (문자열) 다시 색상을 지정할 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
select_prompt ‐ (문자열) 이미지에서 검색할 항목에 대한 간략한 설명입니다. 최대 10,000자.
다음 파라미터는 선택적입니다.
style_preset ‐ (문자열) 이미지 모델을 특정 스타일로 안내합니다. 열거형: 3d-model, analog-film, anime, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, Neon-punk, origami, photoic, pixel-art, tile-texture.
negative_prompt ‐ (문자열) 출력 이미지에서 보고 싶지 않은 내용을 설명하는 텍스트 흐림입니다. 이는 고급 기능입니다. 최대 10,000자.
seed ‐ (number) 생성의 '무작위성'을 안내하는 데 사용되는 특정 값입니다. (임의 시드를 사용하려면 이 파라미터를 생략하거나 0을 전달합니다.) 범위는 0~4294967294입니다. 기본값은 0입니다.
output_format ‐ (문자열) 생성된 이미지의 콘텐츠 유형을 대체합니다. 열거형: jpeg, png, webp. 기본 png.
grow_mask - 마스크 가장자리를 지정된 픽셀 수만큼 모든 방향으로 바깥쪽으로 자릅니다. 마스크 주위의 확장된 영역이 흐려져 인페인팅된 콘텐츠와 원본 이미지 간의 전환을 원활하게 하는 데 도움이 될 수 있습니다. 범위는 0~20입니다. 기본값 5. 인페인팅된 콘텐츠 주위에 심이나 거친 엣지가 보이면이 파라미터를 사용해 보세요. 과도한 증가는 마스크의 세부 정보를 가리거나 근처의 마스킹된 리전을 병합할 수 있습니다.
다음 표에는 분홍색 자켓 프롬프트를 사용한 검색 및 리컬러 작업의 입력 및 출력 이미지가 나와 있습니다.
입력 |
출력 |
---|---|
![]() |
![]() |
Stable Image Ultra에서 생성한 “퍼포머 재킷을 착용한 남성”, Sanwal Yousaf에서 프롬프트 및 편집. CC BY 4.0 |
검색 및 대체를 사용하면 검색 프롬프트를 사용하여 대체할 간단한 언어로 객체를 식별할 수 있습니다. 서비스는 자동으로 객체를 분할하고 마스크 없이 프롬프트에서 요청된 객체로 바꿉니다.
검색 및 교체에는 다음과 같은 필수 파라미터가 있습니다.
프롬프트 - 출력 이미지에서 보려는 내용입니다. 요소, 색상 및 주제를 명확하게 정의하는 강력하고 설명적인 프롬프트를 사용하면 더 나은 결과를 얻을 수 있습니다. 지정된 단어의 가중치를 제어하려면 형식(word:weight)을 사용합니다. 여기서 단어는 가중치를 제어하려는 단어이고 가중치는 값입니다. 값 0과 1.0은 단어를 강조 표시하지 않고 1.1과 2 사이의 값은 단어를 강조했습니다. 예: 하늘이 선명하고(blue:0.3) (green:1.8) 파란색과 녹색이지만 파란색보다 녹색인 하늘을 전달합니다. 최소 0자 및 최대 10,000자.
image ‐ (문자열) 다시 색상을 지정할 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
search_prompt ‐ (문자열) 이미지에서 인페인트할 항목에 대한 간략한 설명입니다. 최대 10,000자.
다음 파라미터는 선택적입니다.
style_preset ‐ (문자열) 이미지 모델을 특정 스타일로 안내합니다. 열거형: 3d-model, analog-film, anime, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, Neon-punk, origami, photoic, pixel-art, tile-texture.
negative_prompt ‐ (문자열) 출력 이미지에서 보고 싶지 않은 내용을 설명하는 텍스트 흐림입니다. 이는 고급 기능입니다. 최대 10,000자.
seed ‐ (number) 생성의 '무작위성'을 안내하는 데 사용되는 특정 값입니다. (임의 시드를 사용하려면 이 파라미터를 생략하거나 0을 전달합니다.) 범위는 0~4294967294입니다. 기본값은 0입니다.
output_format ‐ (문자열) 생성된 이미지의 콘텐츠 유형을 대체합니다. 열거형: jpeg, png, webp. 기본 png.
grow_mask - 마스크 가장자리를 지정된 픽셀 수만큼 모든 방향으로 바깥쪽으로 자릅니다. 마스크 주위의 확장된 영역이 흐려져 인페인팅된 콘텐츠와 원본 이미지 간의 전환을 원활하게 하는 데 도움이 될 수 있습니다. 범위는 0~20입니다. 기본값 5. 인페인팅된 콘텐츠 주위에 심이나 거친 엣지가 보이면이 파라미터를 사용해 보세요. 과도한 증가는 마스크의 세부 정보를 가리거나 근처의 마스킹된 리전을 병합할 수 있습니다.
다음 표에는 다음 프롬프트를 사용한 검색 및 교체 작업의 입력 및 출력 이미지가 나와 있습니다.
입력 |
출력 |
---|---|
![]() |
![]() |
Stable Image Ultra에서 생성한 "Female model wearing Fall". Sanwal Yousaf의 프롬프트 및 편집. CC BY 4.0 |
지우기를 사용하면 배경 일관성을 지능적으로 유지하면서 이미지 마스크를 사용하여 원치 않는 요소를 제거할 수 있습니다.
지우기에는 다음과 같은 필수 파라미터가 있습니다.
image ‐ (string) 삭제할 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
다음 파라미터는 선택적입니다.
seed ‐ (number) 생성의 '무작위성'을 안내하는 데 사용되는 특정 값입니다. (임의 시드를 사용하려면 이 파라미터를 생략하거나 0을 전달합니다.) 범위는 0~4294967294입니다. 기본값은 0입니다.
output_format ‐ (문자열) 생성된 이미지의 콘텐츠 유형을 대체합니다. 열거형: jpeg, png, webp. 기본 png.
mask ‐ (문자열) 두 번째 이미지(이 파라미터로 전달됨) 또는 이미지 파라미터의 알파 채널을 통해 픽셀 단위로 인페인팅 프로세스의 강도를 제어합니다.
마스크 통과 -이 파라미터에 전달되는 이미지는 주어진 픽셀이 얼마나 어둡거나 밝는지에 따라 어떤 픽셀에서든 인페인팅 강도를 나타내는 검은색 및 흰색 이미지여야 합니다. 완전히 검은색 픽셀은 인페인팅 강도를 나타내지 않는 반면 완전히 흰색 픽셀은 최대 강도를 나타냅니다. 마스크의 크기가 이미지 파라미터와 다른 경우 마스크의 크기가 자동으로 조정됩니다.
알파 채널 지원 - 명시적 마스크를 제공하지 않으면 이미지 파라미터의 알파 채널에서 마스크가 파생됩니다. 투명 픽셀은 페인팅되고 불투명 픽셀은 보존됩니다. 알파 채널이 있는 이미지가 마스크와 함께 제공되는 경우 마스크가 우선합니다.
grow_mask - 마스크 가장자리를 지정된 픽셀 수만큼 모든 방향으로 바깥쪽으로 자릅니다. 마스크 주위의 확장된 영역이 흐려져 인페인팅된 콘텐츠와 원본 이미지 간의 전환을 원활하게 하는 데 도움이 될 수 있습니다. 범위는 0~20입니다. 기본값 5. 인페인팅된 콘텐츠 주위에 심이나 거친 엣지가 보이면이 파라미터를 사용해 보세요. 과도한 증가는 마스크의 세부 정보를 가리거나 근처의 마스킹된 리전을 병합할 수 있습니다.
참고
최적의 지우기 결과를 얻으려면 마스크가 제거할 영역을 정확하게 정의해야 합니다. 명시적 마스크가 제공되지 않은 경우 서비스는 입력 이미지의 알파 채널을 사용합니다. 둘 다 제공된 경우 마스크가 우선합니다.
다음 표에는 지우기 작업의 입력 및 출력 이미지가 나와 있습니다.
입력 |
Mask |
출력 |
---|---|---|
![]() |
![]() |
![]() |
Stable Image Ultra에서 생성한 “학생 데스크”입니다. Sanwal Yousaf의 프롬프트 및 편집. CC BY 4.0 |
배경 제거를 사용하면 배경에서 주제를 정확하게 격리할 수 있습니다.
백그라운드 제거에는 다음과 같은 필수 파라미터가 있습니다.
image ‐ (string) 배경을 제거할 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
다음 파라미터는 선택적입니다.
output_format ‐ (문자열) 생성된 이미지의 콘텐츠 유형을 대체합니다. 열거형: jpeg, png, webp. 기본 png.
다음 표에는 배경 제거 작업의 입력 및 출력 이미지가 나와 있습니다.
입력 |
출력 |
---|---|
![]() |
![]() |
Stable Image Ultra에서 생성한 “가을을을 착용한 여성 모델”입니다. Sanwal Yousaf의 프롬프트 및 편집. CC BY 4.0 |
컨트롤
다음 섹션에서는 제어 안정성 AI 이미지 서비스에 대해 설명합니다.
정확한 제어를 통해 대략적인 수작업 스케치를 정교한 출력으로 업그레이드합니다. 스케치가 아닌 이미지의 경우 Control Sketch를 사용하면 이미지 내의 윤곽선과 엣지를 활용하여 최종 모양을 세부적으로 조작할 수 있습니다.
Control Sketch에는 다음과 같은 필수 파라미터가 있습니다.
프롬프트 - 출력 이미지에서 보려는 내용입니다. 요소, 색상 및 주제를 명확하게 정의하는 강력하고 설명적인 프롬프트를 사용하면 더 나은 결과를 얻을 수 있습니다. 지정된 단어의 가중치를 제어하려면 형식(word:weight)을 사용합니다. 여기서 단어는 가중치를 제어하려는 단어이고 가중치는 값입니다. 값 0과 1.0은 단어를 강조 표시하지 않고 1.1과 2 사이의 값은 단어를 강조했습니다. 예: 하늘이 선명하고(blue:0.3) (green:1.8) 파란색과 녹색이지만 파란색보다 녹색인 하늘을 전달합니다. 최소 0자 및 최대 10,000자.
image ‐ (string) 스케치의 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
다음 파라미터는 선택적입니다.
control_ strength ‐ (숫자) 이미지가 생성에 미치는 영향 또는 제어 정도입니다. 0에서 1 사이의 부동 소수점으로 표시됩니다. 여기서 0은 최소 영향이고 1은 최대 영향입니다. 기본값은 0.7입니다.
negative_prompt ‐ (문자열) 출력 이미지에서 보고 싶지 않은 내용을 설명하는 텍스트 흐림입니다. 이는 고급 기능입니다. 최대 10,000자.
seed ‐ (number) 생성의 '무작위성'을 안내하는 데 사용되는 특정 값입니다. (임의 시드를 사용하려면 이 파라미터를 생략하거나 0을 전달합니다.) 범위는 0~4294967294입니다. 기본값은 0입니다.
output_format ‐ (문자열) 생성된 이미지의 콘텐츠 유형을 대체합니다. 열거형: jpeg, png, webp. 기본 png.
style_preset - 이미지 모델을 특정 스타일로 안내합니다. 열거형: 3d-model, analog-film, anime, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, Neon-punk, origami, photoic, pixel-art, tile-texture.
다음 표에는 산 배경과 근처로 흐르는 강이 있는 집이라는 프롬프트를 사용한 Control Sketch 호출의 입력 및 출력 이미지가 나와 있습니다.
입력 |
출력 |
---|---|
![]() |
![]() |
Sanwal Yousaf의 ‘하우스, 산, 강 스케치’. CC BY 4.0 |
제어 구조를 사용하면 입력 이미지의 구조를 유지하면서 이미지를 생성할 수 있습니다. 이는 장면을 다시 생성하거나 모델에서 캐릭터를 렌더링하는 등의 고급 콘텐츠 생성 시나리오에 특히 유용합니다.
제어 구조에는 다음과 같은 필수 파라미터가 있습니다.
프롬프트 - 출력 이미지에서 보려는 내용입니다. 요소, 색상 및 주제를 명확하게 정의하는 강력하고 설명적인 프롬프트를 사용하면 더 나은 결과를 얻을 수 있습니다. 지정된 단어의 가중치를 제어하려면 형식(word:weight)을 사용합니다. 여기서 단어는 가중치를 제어하려는 단어이고 가중치는 값입니다. 값 0과 1.0은 단어를 강조 표시하지 않고 1.1과 2 사이의 값은 단어를 강조했습니다. 예: 하늘이 선명하고(블루:0.3) (그린:1.8) 파란색과 녹색이지만 파란색보다 녹색인 하늘을 전달합니다. 최소 0자 및 최대 10,000자.
image ‐ (string) 스케치의 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
다음 파라미터는 선택적입니다.
control_ strength ‐ (숫자) 이미지가 생성에 미치는 영향 또는 제어 정도입니다. 0에서 1 사이의 부동 소수점으로 표시됩니다. 여기서 0은 가장 적은 영향을 나타내고 1은 최대값입니다. 기본값은 0.7입니다.
negative_prompt ‐ (문자열) 출력 이미지에서 보고 싶지 않은 내용을 설명하는 텍스트 흐림입니다. 이는 고급 기능입니다. 최대 10,000자.
seed ‐ (number) 생성의 '무작위성'을 안내하는 데 사용되는 특정 값입니다. (임의 시드를 사용하려면 이 파라미터를 생략하거나 0을 전달합니다.) 범위는 0~4294967294입니다. 기본값은 0입니다.
output_format ‐ (문자열) 생성된 이미지의 콘텐츠 유형을 대체합니다. 열거형: jpeg, png, webp. 기본 png.
style_preset - 이미지 모델을 특정 스타일로 안내합니다. 열거형: 3d-model, analog-film, anime, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, Neon-punk, origami, photoic, pixel-art, tile-texture.
다음 표에는 모션이 생성된 초현실 구조가 장면을 비추는 프롬프트를 사용하는 제어 구조 작업의 입력 및 출력 이미지가 나와 있습니다.
입력 |
출력 |
---|---|
![]() |
![]() |
Pawel L |
스타일 가이드를 사용하면 입력 이미지에서 스타일 요소를 추출하고 이를 사용하여 프롬프트를 기반으로 출력 이미지를 생성할 수 있습니다. 그 결과 입력 이미지와 동일한 스타일의 새 이미지가 생성됩니다.
스타일 가이드에는 다음과 같은 필수 파라미터가 있습니다.
프롬프트 - 출력 이미지에서 보려는 내용입니다. 요소, 색상 및 주제를 명확하게 정의하는 강력하고 설명적인 프롬프트를 사용하면 더 나은 결과를 얻을 수 있습니다. 지정된 단어의 가중치를 제어하려면 형식(word:weight)을 사용합니다. 여기서 단어는 가중치를 제어하려는 단어이고 가중치는 값입니다. 값 0과 1.0은 단어를 강조 표시하지 않고 1.1과 2 사이의 값은 단어를 강조했습니다. 예: 하늘이 선명하고(블루:0.3) (그린:1.8) 파란색과 녹색이지만 파란색보다 녹색인 하늘을 전달합니다. 최소 0자 및 최대 10,000자.
image ‐ (string) 스케치의 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
다음 파라미터는 선택적입니다.
aspect_ratio ‐ (문자열) 생성된 이미지의 종횡비를 제어합니다. 이 파라미터는 텍스트 투 이미지 요청에만 유효합니다. 기본값: 1:1. 열거형: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. 기본값: 1:1.
negative_prompt ‐ (문자열) 출력 이미지에서 보고 싶지 않은 내용을 설명하는 텍스트 흐림입니다. 이는 고급 기능입니다. 최대 10,000자.
seed ‐ (number) 생성의 '무작위성'을 안내하는 데 사용되는 특정 값입니다. (임의 시드를 사용하려면 이 파라미터를 생략하거나 0을 전달합니다.) 범위는 0~4294967294입니다. 기본값은 0입니다.
output_format ‐ (문자열) 생성된 이미지의 콘텐츠 유형을 대체합니다. 열거형: jpeg, png, webp. 기본 png.
fidelity ‐ (숫자) 출력 이미지의 스타일이 입력 이미지의 스타일과 얼마나 유사한지. 범위는 0~1입니다. 기본값은 0.5입니다.
style_preset - 이미지 모델을 특정 스타일로 안내합니다. 열거형: 3d-model, analog-film, anime, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, Neon-punk, origami, photoic, pixel-art, tile-texture.
다음 표에는 최신 대도시의 와이드 샷 프롬프트를 사용한 스타일 가이드 호출의 입력 및 출력 이미지가 나와 있습니다.
스타일 전송을 사용하면 참조 스타일 이미지의 시각적 특성을 대상 이미지에 적용할 수 있습니다. 스타일 가이드 서비스는 입력 이미지에서 스타일 요소를 추출하여 프롬프트를 기반으로 출력 이미지를 생성하는 데 사용하는 동안 스타일 전송은 원래 구성을 유지하면서 기존 콘텐츠를 특별히 변환합니다. 이 도구는 여러 자산에서 일관된 콘텐츠를 생성하는 데 도움이 됩니다.
스타일 전송에는 다음과 같은 필수 파라미터가 있습니다.
init_image ‐ (문자열) 스타일을 바꾸려는 제목이 포함된 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
style_image ‐ (문자열) 다시 스타일할 주제가 포함된 Base64 이미지입니다. 이미지의 모든 측면은 64픽셀 이상이어야 합니다. 총 픽셀 수는 9,437,184픽셀을 초과할 수 없습니다. 이미지 종횡비는 1:2.5에서 2.5:1 사이여야 합니다. 지원되는 형식: jpeg, png, webp.
다음 파라미터는 선택적입니다.
프롬프트 ‐ (문자열) 출력 이미지에서 보려는 내용입니다. 요소, 색상 및 주제를 명확하게 정의하는 강력하고 설명적인 프롬프트를 사용하면 더 나은 결과를 얻을 수 있습니다. 지정된 단어의 가중치를 제어하려면 형식(word:weight)을 사용합니다. 여기서 단어는 가중치를 제어하려는 단어이고 가중치는 값입니다. 값 0과 1.0은 단어를 강조 표시하지 않고 1.1과 2 사이의 값은 단어를 강조했습니다. 예: 하늘이 선명하고(블루:0.3) (그린:1.8) 파란색과 녹색이지만 파란색보다 녹색인 하늘을 전달합니다.
negative_prompt ‐ (문자열) 출력 이미지에서 보고 싶지 않은 내용을 설명하는 텍스트 흐림입니다. 이는 고급 기능입니다. 최대 10,000자.
seed ‐ (number) 생성의 '무작위성'을 안내하는 데 사용되는 특정 값입니다. (임의 시드를 사용하려면 이 파라미터를 생략하거나 0을 전달합니다.) 범위는 0~4294967294입니다. 기본값은 0입니다.
output_format ‐ (문자열) 생성된 이미지의 콘텐츠 유형을 대체합니다. 열거형: jpeg, png, webp. 기본 png.
composition_fidelity ‐ (숫자) 출력 이미지의 스타일이 입력 이미지의 스타일과 얼마나 유사한지. 범위는 0에서 1 사이입니다. 기본값은 0.9입니다.
style_ strength ‐ (숫자) 노이즈 제거라고도 하는이 파라미터는 style_image 파라미터가 생성된 이미지에 미치는 영향을 제어합니다. 값이 0이면 입력과 동일한 이미지가 생성됩니다. 값이 1이면 이미지를 전혀 전달하지 않은 것처럼 됩니다. 범위는 0에서 1 사이입니다. 기본값 1.
change_ strength ‐ (숫자) 원본 이미지가 얼마나 변경되어야 하는지. 범위는 0.1~1입니다. 기본값은 0.9입니다.
다음 표에는 스타일 전송 호출의 입력 및 출력 이미지가 나와 있습니다.
입력 |
스타일 |
출력 |
---|---|---|
![]() |
![]() |
![]() |
Simon Berger |
Pixabay |