As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Serviços de imagem de IA de estabilidade
Você pode usar o Stability AI Image Services com o Amazon Bedrock para acessar nove ferramentas especializadas de edição de imagens projetadas para acelerar fluxos de trabalho criativos profissionais. Com o Stability AI Image Services, você pode gerar imagens a partir de um esboço, reestruturar e reestilizar uma imagem existente ou remover e substituir objetos dentro de uma imagem.
Esta seção descreve como fazer chamadas de inferência para Stability AI Image Services usando o. InvokeModel Esta seção também fornece exemplos de código em Python e exemplos de imagens antes e depois do uso do Stability AI Image Services.
Os Stability AI Image Services estão disponíveis nas seguintes categorias:
Editar ‐ Serviços de edição de imagens baseados em IA, incluindo pintura embutida com máscaras (preenchimento generativo) ou com palavras. Inclui ferramentas para colocação de produtos e publicidade, bem como ferramentas básicas, como remoção de plano de fundo.
Controle ‐ Pode receber instruções, mapas e outros guias. Esses serviços utilizam ControlNets tecnologias similares baseadas em modelos de difusão estável.
nota
A assinatura de qualquer edição ou controle do Stability AI Image Service inscreve você automaticamente em todos os nove Stability AI Image Services disponíveis.
Solicitação e reposta
O corpo da solicitação é passado no body
campo de uma solicitação para InvokeModel.
Campo do corpo da solicitação de invocação do modelo
Ao fazer uma InvokeModel chamada usando o Stability AI Image Services, preencha o campo body com um objeto JSON semelhante ao mostrado abaixo.
{ 'prompt': 'Create an image of a panda' }
Campo de corpo de respostas de invocação do modelo
Quando você faz uma InvokeModel chamada usando o Stability AI Image Services, a resposta se parece com a seguinte
{ 'seeds': [2130420379], 'finish_reasons': [null], 'images': ['...'] }
seeds: (string) lista de propagações usadas para gerar imagens para o modelo.
-
finish_reasons: enumeração indicando se a solicitação foi filtrada ou não.
null
indicará que a solicitação foi bem-sucedida. Valores atuais possíveis:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null
. -
images: uma lista de imagens geradas no formato de string base64.
Para obter mais informações, consulte https://platform.us.stability. ai/docs/api-reference#tag/v1 geração
Edite
A seção a seguir descreve a edição Stability AI Image Services.
O Inpaint modifica imagens de forma inteligente preenchendo ou substituindo áreas especificadas por um novo conteúdo com base no conteúdo de uma imagem de máscara.
O Inpaint tem os seguintes parâmetros necessários:
prompt ‐ O que você deseja ver na imagem de saída. Um prompt forte e descritivo que define claramente os elementos, as cores e os assuntos proporcionará melhores resultados. Para controlar o peso de uma determinada palavra, use o formato (palavra:peso), em que palavra é a palavra da qual você gostaria de controlar o peso e peso é um valor. Um valor 0 e 1,0 não enfatizou a palavra e um valor entre 1,1 e 2 enfatizou a palavra. Por exemplo: o céu estava nítido (azul: 0,3) e (verde: 1,8) transmitiria um céu azul e verde, mas mais verde do que azul. Mínimo de 0 e máximo de 10000 caracteres.
image ‐ (string) A imagem Base64 a ser pintada. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
Os seguintes parâmetros são opcionais:
style_preset ‐ (string) guia o modelo de imagem em direção a um estilo específico. Enum: modelo 3D, filme analógico, anime, cinematográfico, história em quadrinhos, arte digital, aprimoramento, arte de fantasia, isométrico, arte linear, low-poly, composto de modelagem, neon-punk, origami, fotográfico, pixel-art, textura de azulejos.
negative_prompt ‐ (string) Uma sinopse de texto descrevendo o que você não deseja ver na imagem de saída. Este é um recurso avançado. Máximo de 10000 caracteres.
seed ‐ (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma propagação aleatória.) Intervalo de 0 a 4294967294. Padrão 0.
output_format ‐ (string) Dita o tipo de conteúdo da imagem gerada. Enumeração: jpeg, png, webp. PNG padrão.
mask ‐ (string) Controla a intensidade do processo de pintura por pixel, seja por meio de uma segunda imagem (passada para esse parâmetro) ou por meio do canal alfa do parâmetro de imagem.
Inserindo uma máscara ‐ A imagem passada para esse parâmetro deve ser uma imagem em preto e branco que represente, em qualquer pixel, a intensidade da pintura com base no quão escuro ou claro é o pixel em questão. Os pixels totalmente pretos não representam a intensidade da pintura embutida, enquanto os pixels totalmente brancos representam a força máxima. Caso a máscara tenha um tamanho diferente do parâmetro da imagem, ela será redimensionada automaticamente.
Alpha Channel Support ‐ Se você não fornecer uma máscara explícita, uma será derivada do canal alfa do parâmetro de imagem. Os pixels transparentes serão pintados enquanto os pixels opacos serão preservados. Caso uma imagem com um canal alfa seja fornecida junto com uma máscara, a máscara terá precedência.
grow_mask ‐ Aumenta as bordas da máscara para fora em todas as direções pelo número especificado de pixels. A área expandida ao redor da máscara ficará desfocada, o que pode ajudar a suavizar a transição entre o conteúdo pintado e a imagem original. Intervalo entre 0 e 20. Padrão 5. Experimente esse parâmetro se você notar costuras ou bordas ásperas ao redor do conteúdo pintado. Observe que o crescimento excessivo pode obscurecer detalhes finos na and/or mesclagem de máscaras nas regiões mascaradas próximas.
A tabela a seguir mostra as imagens de entrada e saída de uma operação do Inpaint.
Entrada |
Mask |
Resultado |
---|---|---|
![]() |
![]() |
![]() |
“Homem na metrópole” gerado pelo Stable Image Ultra, instruções e edições de Sanwal Yousaf. Licenciado sob CC BY 4.0 |
Pesquisar e recolorir permite que você altere a cor de um objeto específico em uma imagem usando um prompt. Esse serviço é uma versão específica da pintura embutida que não requer máscara. Ele segmentará automaticamente o objeto e o recolorirá usando as cores solicitadas no prompt.
O Search and Recolor tem os seguintes parâmetros obrigatórios:
prompt ‐ O que você deseja ver na imagem de saída. Um prompt forte e descritivo que define claramente os elementos, as cores e os assuntos proporcionará melhores resultados. Para controlar o peso de uma determinada palavra, use o formato (palavra:peso), em que palavra é a palavra da qual você gostaria de controlar o peso e peso é um valor. Um valor 0 e 1,0 não enfatizou a palavra e um valor entre 1,1 e 2 enfatizou a palavra. Por exemplo: o céu estava nítido (azul: 0,3) e (verde: 1,8) transmitiria um céu azul e verde, mas mais verde do que azul. Mínimo de 0 e máximo de 10000 caracteres.
image ‐ (string) A imagem Base64 a ser recolorida. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
select_prompt ‐ (string) Breve descrição do que pesquisar na imagem. Máximo de 10000 caracteres.
Os seguintes parâmetros são opcionais:
style_preset ‐ (string) guia o modelo de imagem em direção a um estilo específico. Enum: modelo 3D, filme analógico, anime, cinematográfico, história em quadrinhos, arte digital, aprimoramento, arte de fantasia, isométrico, arte linear, low-poly, composto de modelagem, neon-punk, origami, fotográfico, pixel-art, textura de azulejos.
negative_prompt ‐ (string) Uma sinopse de texto descrevendo o que você não deseja ver na imagem de saída. Este é um recurso avançado. Máximo de 10000 caracteres.
seed ‐ (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma propagação aleatória.) Intervalo de 0 a 4294967294. Padrão 0.
output_format ‐ (string) Dita o tipo de conteúdo da imagem gerada. Enumeração: jpeg, png, webp. PNG padrão.
grow_mask ‐ Aumenta as bordas da máscara para fora em todas as direções pelo número especificado de pixels. A área expandida ao redor da máscara ficará desfocada, o que pode ajudar a suavizar a transição entre o conteúdo pintado e a imagem original. Intervalo entre 0 e 20. Padrão 5. Experimente esse parâmetro se você notar costuras ou bordas ásperas ao redor do conteúdo pintado. Observe que o crescimento excessivo pode obscurecer detalhes finos na and/or mesclagem de máscaras nas regiões mascaradas próximas.
A tabela a seguir mostra as imagens de entrada e saída de uma operação de pesquisa e recoloração usando o seguinte prompt: pink jacket.
Entrada |
Resultado |
---|---|
![]() |
![]() |
“Homem vestindo jaqueta” gerado pelo Stable Image Ultra, instruções e edições de Sanwal Yousaf. Licenciado sob CC BY 4.0 |
Pesquisar e substituir permite que você use um prompt de pesquisa para identificar um objeto em linguagem simples a ser substituído. O serviço segmentará automaticamente o objeto e o substituirá pelo objeto solicitado no prompt sem precisar de uma máscara.
Pesquisar e substituir tem os seguintes parâmetros obrigatórios:
prompt ‐ O que você deseja ver na imagem de saída. Um prompt forte e descritivo que define claramente os elementos, as cores e os assuntos proporcionará melhores resultados. Para controlar o peso de uma determinada palavra, use o formato (palavra:peso), em que palavra é a palavra da qual você gostaria de controlar o peso e peso é um valor. Um valor 0 e 1,0 não enfatizou a palavra e um valor entre 1,1 e 2 enfatizou a palavra. Por exemplo: o céu estava nítido (azul: 0,3) e (verde: 1,8) transmitiria um céu azul e verde, mas mais verde do que azul. Mínimo de 0 e máximo de 10000 caracteres.
image ‐ (string) A imagem Base64 a ser recolorida. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
search_prompt ‐ (string) Breve descrição do que pintar na imagem. Máximo de 10000 caracteres.
Os seguintes parâmetros são opcionais:
style_preset ‐ (string) guia o modelo de imagem em direção a um estilo específico. Enum: modelo 3D, filme analógico, anime, cinematográfico, história em quadrinhos, arte digital, aprimoramento, arte de fantasia, isométrico, arte linear, low-poly, composto de modelagem, neon-punk, origami, fotográfico, pixel-art, textura de azulejos.
negative_prompt ‐ (string) Uma sinopse de texto descrevendo o que você não deseja ver na imagem de saída. Este é um recurso avançado. Máximo de 10000 caracteres.
seed ‐ (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma propagação aleatória.) Intervalo de 0 a 4294967294. Padrão 0.
output_format ‐ (string) Dita o tipo de conteúdo da imagem gerada. Enumeração: jpeg, png, webp. PNG padrão.
grow_mask ‐ Aumenta as bordas da máscara para fora em todas as direções pelo número especificado de pixels. A área expandida ao redor da máscara ficará desfocada, o que pode ajudar a suavizar a transição entre o conteúdo pintado e a imagem original. Intervalo entre 0 e 20. Padrão 5. Experimente esse parâmetro se você notar costuras ou bordas ásperas ao redor do conteúdo pintado. Observe que o crescimento excessivo pode obscurecer detalhes finos na and/or mesclagem de máscaras nas regiões mascaradas próximas.
A tabela a seguir mostra as imagens de entrada e saída de uma operação de pesquisa e substituição usando o seguinte prompt: jacket.
Entrada |
Resultado |
---|---|
![]() |
![]() |
“Modelo feminina vestindo suéter de outono” gerada pela Stable Image Ultra. Solicitações e edições feitas por Sanwal Yousaf. Licenciado sob CC BY 4.0 |
O Apagar permite que você remova elementos indesejados usando máscaras de imagem, mantendo a consistência do plano de fundo de forma inteligente.
Apagar tem os seguintes parâmetros obrigatórios:
image ‐ (string) A imagem Base64 a ser apagada. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
Os seguintes parâmetros são opcionais:
seed ‐ (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma propagação aleatória.) Intervalo de 0 a 4294967294. Padrão 0.
output_format ‐ (string) Dita o tipo de conteúdo da imagem gerada. Enumeração: jpeg, png, webp. PNG padrão.
mask ‐ (string) Controla a intensidade do processo de pintura por pixel, seja por meio de uma segunda imagem (passada para esse parâmetro) ou por meio do canal alfa do parâmetro de imagem.
Inserindo uma máscara ‐ A imagem passada para esse parâmetro deve ser uma imagem em preto e branco que represente, em qualquer pixel, a intensidade da pintura com base no quão escuro ou claro é o pixel em questão. Os pixels totalmente pretos não representam a intensidade da pintura embutida, enquanto os pixels totalmente brancos representam a força máxima. Caso a máscara tenha um tamanho diferente do parâmetro da imagem, ela será redimensionada automaticamente.
Alpha Channel Support ‐ Se você não fornecer uma máscara explícita, uma será derivada do canal alfa do parâmetro de imagem. Os pixels transparentes serão pintados enquanto os pixels opacos serão preservados. Caso uma imagem com um canal alfa seja fornecida junto com uma máscara, a máscara terá precedência.
grow_mask ‐ Aumenta as bordas da máscara para fora em todas as direções pelo número especificado de pixels. A área expandida ao redor da máscara ficará desfocada, o que pode ajudar a suavizar a transição entre o conteúdo pintado e a imagem original. Intervalo entre 0 e 20. Padrão 5. Experimente esse parâmetro se você notar costuras ou bordas ásperas ao redor do conteúdo pintado. Observe que o crescimento excessivo pode obscurecer detalhes finos na and/or mesclagem de máscaras nas regiões mascaradas próximas.
nota
Para obter os melhores resultados de apagamento, certifique-se de que sua máscara defina com precisão as áreas a serem removidas. Se nenhuma máscara explícita for fornecida, o serviço usará o canal alfa da imagem de entrada. A máscara terá precedência se ambas forem fornecidas.
A tabela a seguir mostra as imagens de entrada e saída de uma operação de apagamento.
Entrada |
Mask |
Resultado |
---|---|---|
![]() |
![]() |
![]() |
“Mesa de estudantes” gerada pelo Stable Image Ultra. Solicitações e edições feitas por Sanwal Yousaf. Licenciado sob CC BY 4.0 |
Remover fundo permite isolar objetos do fundo com precisão.
Remover plano de fundo tem os seguintes parâmetros obrigatórios:
image ‐ (string) A imagem Base64 da qual remover o fundo. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
Os seguintes parâmetros são opcionais:
output_format ‐ (string) Dita o tipo de conteúdo da imagem gerada. Enumeração: jpeg, png, webp. PNG padrão.
A tabela a seguir mostra as imagens de entrada e saída de uma operação Remover plano de fundo.
Entrada |
Resultado |
---|---|
![]() |
![]() |
“Modelo feminina vestindo suéter de outono” gerada pela Stable Image Ultra. Solicitações e edições feitas por Sanwal Yousaf. Licenciado sob CC BY 4.0 |
Controle
A seção a seguir descreve o controle Stability AI Image Services.
Atualize esboços grosseiros desenhados à mão para saídas refinadas com controle preciso. Para imagens sem esboço, o Control Sketch permite a manipulação detalhada da aparência final, aproveitando as linhas de contorno e as bordas da imagem.
O Control Sketch tem os seguintes parâmetros necessários:
prompt ‐ O que você deseja ver na imagem de saída. Um prompt forte e descritivo que define claramente os elementos, as cores e os assuntos proporcionará melhores resultados. Para controlar o peso de uma determinada palavra, use o formato (palavra:peso), em que palavra é a palavra da qual você gostaria de controlar o peso e peso é um valor. Um valor 0 e 1,0 não enfatizou a palavra e um valor entre 1,1 e 2 enfatizou a palavra. Por exemplo: o céu estava nítido (azul: 0,3) e (verde: 1,8) transmitiria um céu azul e verde, mas mais verde do que azul. Mínimo de 0 e máximo de 10000 caracteres.
image ‐ (string) A imagem Base64 do esboço. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
Os seguintes parâmetros são opcionais:
control_strength ‐ (número) Quanta influência, ou controle, a imagem tem na geração. Representado como uma flutuação entre 0 e 1, onde 0 é a menor influência e 1 é a máxima. Padrão 0.7.
negative_prompt ‐ (string) Uma sinopse de texto descrevendo o que você não deseja ver na imagem de saída. Este é um recurso avançado. Máximo de 10000 caracteres.
seed ‐ (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma propagação aleatória.) Intervalo de 0 a 4294967294. Padrão 0.
output_format ‐ (string) Dita o tipo de conteúdo da imagem gerada. Enumeração: jpeg, png, webp. PNG padrão.
style_preset ‐ Guia o modelo de imagem em direção a um estilo específico. Enum: modelo 3D, filme analógico, anime, cinematográfico, história em quadrinhos, arte digital, aprimoramento, arte de fantasia, isométrico, arte linear, low-poly, composto de modelagem, neon-punk, origami, fotográfico, pixel-art, textura de azulejos.
A tabela a seguir mostra as imagens de entrada e saída de uma chamada do Control Sketch usando o seguinte prompt: uma casa com fundo de montanhas e um rio fluindo nas proximidades.
Entrada |
Resultado |
---|---|
![]() |
![]() |
“Esboço de casa, montanhas e rio” de Sanwal Yousaf. Licenciado sob CC BY 4.0 |
A Estrutura de Controle permite gerar imagens enquanto mantém a estrutura de uma imagem de entrada. Isso é especialmente valioso para cenários avançados de criação de conteúdo, como recriar cenas ou renderizar personagens a partir de modelos.
A estrutura de controle tem os seguintes parâmetros necessários:
prompt ‐ O que você deseja ver na imagem de saída. Um prompt forte e descritivo que define claramente os elementos, as cores e os assuntos proporcionará melhores resultados. Para controlar o peso de uma determinada palavra, use o formato (palavra:peso), em que palavra é a palavra da qual você gostaria de controlar o peso e peso é um valor. Um valor 0 e 1,0 não enfatizou a palavra e um valor entre 1,1 e 2 enfatizou a palavra. Por exemplo: o céu estava nítido (azul: 0,3) e (verde: 1,8) transmitiria um céu azul e verde, mas mais verde do que azul. Mínimo de 0 e máximo de 10000 caracteres.
image ‐ (string) A imagem Base64 do esboço. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
Os seguintes parâmetros são opcionais:
control_strength ‐ (número) Quanta influência, ou controle, a imagem tem na geração. Representado como uma flutuação entre 0 e 1, onde 0 é a menor influência e 1 é a máxima. Padrão 0.7.
negative_prompt ‐ (string) Uma sinopse de texto descrevendo o que você não deseja ver na imagem de saída. Este é um recurso avançado. Máximo de 10000 caracteres.
seed ‐ (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma propagação aleatória.) Intervalo de 0 a 4294967294. Padrão 0.
output_format ‐ (string) Dita o tipo de conteúdo da imagem gerada. Enumeração: jpeg, png, webp. PNG padrão.
style_preset ‐ Guia o modelo de imagem em direção a um estilo específico. Enum: modelo 3D, filme analógico, anime, cinematográfico, história em quadrinhos, arte digital, aprimoramento, arte de fantasia, isométrico, arte linear, low-poly, composto de modelagem, neon-punk, origami, fotográfico, pixel-art, textura de azulejos.
A tabela a seguir mostra as imagens de entrada e saída de uma operação da Estrutura de Controle usando o seguinte prompt: estrutura surreal com faíscas geradas por movimento iluminando a cena.
Entrada |
Resultado |
---|---|
![]() |
![]() |
“Pessoa sentada na caixa marrom” |
O Guia de Estilo permite que você extraia elementos estilísticos de uma imagem de entrada e os use para orientar a criação de uma imagem de saída com base no prompt. O resultado é uma nova imagem no mesmo estilo da imagem de entrada.
O Guia de Estilo tem os seguintes parâmetros obrigatórios:
prompt ‐ O que você deseja ver na imagem de saída. Um prompt forte e descritivo que define claramente os elementos, as cores e os assuntos proporcionará melhores resultados. Para controlar o peso de uma determinada palavra, use o formato (palavra:peso), em que palavra é a palavra da qual você gostaria de controlar o peso e peso é um valor. Um valor 0 e 1,0 não enfatizou a palavra e um valor entre 1,1 e 2 enfatizou a palavra. Por exemplo: o céu estava nítido (azul: 0,3) e (verde: 1,8) transmitiria um céu azul e verde, mas mais verde do que azul. Mínimo de 0 e máximo de 10000 caracteres.
image ‐ (string) A imagem Base64 do esboço. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
Os seguintes parâmetros são opcionais:
aspect_ratio ‐ (string) Controla a proporção da imagem gerada. Esse parâmetro só é válido para text-to-image solicitações. Padrão 1:1. Enumeração: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Padrão 1:1.
negative_prompt ‐ (string) Uma sinopse de texto descrevendo o que você não deseja ver na imagem de saída. Este é um recurso avançado. Máximo de 10000 caracteres.
seed ‐ (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma propagação aleatória.) Intervalo de 0 a 4294967294. Padrão 0.
output_format ‐ (string) Dita o tipo de conteúdo da imagem gerada. Enumeração: jpeg, png, webp. PNG padrão.
fidelidade ‐ (número) Até que ponto o estilo da imagem de saída se assemelha ao estilo da imagem de entrada. Intervalo de 0 a 1. Padrão 0,5.
style_preset ‐ Guia o modelo de imagem em direção a um estilo específico. Enum: modelo 3D, filme analógico, anime, cinematográfico, história em quadrinhos, arte digital, aprimoramento, arte de fantasia, isométrico, arte linear, low-poly, composto de modelagem, neon-punk, origami, fotográfico, pixel-art, textura de azulejos.
A tabela a seguir mostra as imagens de entrada e saída de uma chamada do Style Guide usando o seguinte prompt: foto ampla da metrópole moderna.
Entrada |
Resultado |
---|---|
![]() |
![]() |
“Pintura abstrata” |
A Transferência de Estilo permite que você aplique características visuais de imagens de estilo de referência às imagens de destino. Enquanto o serviço Style Guide extrai elementos estilísticos de uma imagem de entrada e os usa para orientar a criação de uma imagem de saída com base no prompt, o Style Transfer transforma especificamente o conteúdo existente enquanto preserva a composição original. Essa ferramenta ajuda a criar conteúdo consistente em vários ativos.
A transferência de estilo tem os seguintes parâmetros obrigatórios:
init_image ‐ (string) Uma imagem Base64 contendo o assunto que você deseja reestilizar. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
style_image ‐ (string) Uma imagem Base64 contendo o assunto que você deseja reestilizar. Cada lado da imagem deve ter pelo menos 64 pixels. A contagem total de pixels não pode exceder 9.437.184 pixels. A proporção da imagem deve estar entre 1:2,5 e 2, 5:1. Formatos suportados: jpeg, png, webp.
Os seguintes parâmetros são opcionais:
prompt ‐ (string) O que você deseja ver na imagem de saída. Um prompt forte e descritivo que define claramente os elementos, as cores e os assuntos proporcionará melhores resultados. Para controlar o peso de uma determinada palavra, use o formato (palavra:peso), em que palavra é a palavra da qual você gostaria de controlar o peso e peso é um valor. Um valor 0 e 1,0 não enfatizou a palavra e um valor entre 1,1 e 2 enfatizou a palavra. Por exemplo: o céu estava nítido (azul: 0,3) e (verde: 1,8) transmitiria um céu azul e verde, mas mais verde do que azul.
negative_prompt ‐ (string) Uma sinopse de texto descrevendo o que você não deseja ver na imagem de saída. Este é um recurso avançado. Máximo de 10000 caracteres.
seed ‐ (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma propagação aleatória.) Intervalo de 0 a 4294967294. Padrão 0.
output_format ‐ (string) Dita o tipo de conteúdo da imagem gerada. Enumeração: jpeg, png, webp. PNG padrão.
composition_fidelity ‐ (número) Até que ponto o estilo da imagem de saída se assemelha ao estilo da imagem de entrada. Intervalo entre 0 e 1. Padrão 0.9.
style_strength ‐ (número) Às vezes chamado de redução de ruído, esse parâmetro controla quanta influência o parâmetro style_image tem na imagem gerada. Um valor de 0 produziria uma imagem idêntica à entrada. Um valor de 1 seria como se você não tivesse passado nenhuma imagem. Intervalo entre 0 e 1. Padrão 1.
change_strength ‐ (número) Quanto a imagem original deve mudar. Intervalo entre 0,1 e 1. Padrão 0.9.
A tabela a seguir mostra as imagens de entrada e saída de uma chamada de transferência de estilo.
Entrada |
Style (Estilo) |
Resultado |
---|---|---|
![]() |
![]() |
![]() |
“Estátua de mulher em pé” |
“Blue Bright Lights” |