View a markdown version of this page

Stability.ai Difusão estável 3,5 Grande - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Stability.ai Difusão estável 3,5 Grande

O modelo Stable Diffusion 3.5 Large usa 8 bilhões de parâmetros e comporta saída de resolução de 1 megapixel para geração de conversão de texto em imagem e de imagem em imagem.

O corpo da solicitação é passado no body campo de uma solicitação para InvokeModel.

Campo do corpo da solicitação de invocação do modelo

Ao fazer uma InvokeModel chamada usando um modelo Stable Diffusion 3.5 Large, preencha o campo body com um objeto JSON parecido com o seguinte.

  • prompt: (string) descrição de texto da imagem de saída desejada. Máximo de 10 mil caracteres.

    Mínimo Máximo

    0

    10.000

Campo de corpo de respostas de invocação do modelo

Quando você faz uma InvokeModel chamada usando um modelo Stable Diffusion 3.5 Large, a resposta é semelhante à seguinte

{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }

Uma resposta com um motivo final que não sejanull, terá a seguinte aparência:

{ "finish_reasons":["Filter reason: prompt"] }
  • seeds: (string) lista de propagações usadas para gerar imagens para o modelo.

  • finish_reasons: enumeração indicando se a solicitação foi filtrada ou não. null indicará que a solicitação foi bem-sucedida. Valores atuais possíveis: "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.

  • images: uma lista de imagens geradas no formato de string base64.

Text to image

O modelo Stability.ai Stable Diffusion 3.5 Large tem os seguintes parâmetros de inferência para uma chamada de inferência de texto para imagem.

  • prompt (string) — Descrição de texto da imagem de saída desejada. Máximo de 10 mil caracteres.

    Mínimo Máximo
    0 10.000

Parâmetros opcionais

  • aspect_ratio (string) — Controla a proporção da imagem gerada. Válido somente para solicitações de conversão de texto em imagem. Enumeração: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Padrão 1:1.

  • mode (string) (GenerationMode) - Padrão: conversão de texto em imagem. Enumeração: conversão de imagem em imagem ou de texto em imagem. Controla se é uma geração de texto em imagem ou imagem em imagem, o que afeta os parâmetros necessários.

    • A conversão de texto em imagem requer somente o parâmetro prompt.

    • A conversão imagem em imagem requer os parâmetros prompt, imagem e intensidade.

  • semente (número) — Valor para controlar a aleatoriedade na geração. Varia de 0 a 4.294.967.295. Padrão: 0 (propagação aleatória).

    Mínimo Máximo Padrão
    0 4294967294 0
  • negative_prompt (string) — Texto descrevendo elementos a serem excluídos da imagem de saída. Máximo de 10 mil caracteres.

    Mínimo Máximo
    0 10.000
  • output_format (string) — Formato da imagem de saída. Enumeração: jpeg, png, webp. Padrão: png.

import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
Image to image

O modelo Stability.ai Stable Diffusion 3.5 Large tem os seguintes parâmetros de inferência para uma chamada de inferência de imagem para imagem.

  • prompt (string) — Descrição de texto da imagem de saída desejada. Máximo de 10 mil caracteres.

    Mínimo Máximo
    0 10.000
  • image (string) — imagem Base64-encoded de entrada. Mínimo de 64 pixels por lado. Formatos compatíveis: jpeg, png e webp.

  • mode (string) (GenerationMode) - Padrão: conversão de texto em imagem. Enumeração: conversão de imagem em imagem ou de texto em imagem. Controla se é uma geração de texto em imagem ou imagem em imagem, o que afeta os parâmetros necessários.

    • A conversão de texto em imagem requer somente o parâmetro prompt.

    • A conversão imagem em imagem requer os parâmetros prompt, imagem e intensidade.

  • força (número) — Controla a influência da imagem de entrada na saída. Varia de 0 a 1. O valor 0 preserva a imagem de entrada e o valor 1 ignora a imagem de entrada.

    Mínimo Máximo
    0 1
  • semente (número) — Valor para controlar a aleatoriedade na geração. Varia de 0 a 4.294.967.295. Padrão: 0 (propagação aleatória).

    Mínimo Máximo Padrão
    0 4294967294 0
  • negative_prompt (string) — Texto descrevendo elementos a serem excluídos da imagem de saída. Máximo de 10 mil caracteres.

    Mínimo Máximo
    0 10.000
  • output_format (string) — Formato da imagem de saída. Enumeração: jpeg, png, webp. Padrão: png.

import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )