Stability.ai Difusão estável 3,5 Grande

O modelo Stable Diffusion 3.5 Large usa 8 bilhões de parâmetros e comporta saída de resolução de 1 megapixel para geração de conversão de texto em imagem e de imagem em imagem.

O corpo da solicitação é passado no body campo de uma solicitação para InvokeModel.

Campo do corpo da solicitação de invocação do modelo

Ao fazer uma InvokeModel chamada usando um modelo Stable Diffusion 3.5 Large, preencha o campo body com um objeto JSON parecido com o seguinte.

prompt: (string) descrição de texto da imagem de saída desejada. Máximo de 10 mil caracteres.

Mínimo	Máximo
0	10.000

Campo de corpo de respostas de invocação do modelo

Quando você faz uma InvokeModel chamada usando um modelo Stable Diffusion 3.5 Large, a resposta é semelhante à seguinte


{
    'seeds': [2130420379], 
    "finish_reasons":[null], 
    "images":["..."]
}

Uma resposta com um motivo final que não sejanull, terá a seguinte aparência:


{
    "finish_reasons":["Filter reason: prompt"]
}

seeds: (string) lista de propagações usadas para gerar imagens para o modelo.
finish_reasons: enumeração indicando se a solicitação foi filtrada ou não. null indicará que a solicitação foi bem-sucedida. Valores atuais possíveis: "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
images: uma lista de imagens geradas no formato de string base64.

Text to image

O modelo Stability.ai Stable Diffusion 3.5 Large tem os seguintes parâmetros de inferência para uma chamada de inferência de texto para imagem.

prompt (string) — Descrição de texto da imagem de saída desejada. Máximo de 10 mil caracteres.

Mínimo	Máximo
0	10.000

Parâmetros opcionais

aspect_ratio (string) — Controla a proporção da imagem gerada. Válido somente para solicitações de conversão de texto em imagem. Enumeração: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Padrão 1:1.
mode (string) (GenerationMode) - Padrão: conversão de texto em imagem. Enumeração: conversão de imagem em imagem ou de texto em imagem. Controla se é uma geração de texto em imagem ou imagem em imagem, o que afeta os parâmetros necessários.
- A conversão de texto em imagem requer somente o parâmetro prompt.
- A conversão imagem em imagem requer os parâmetros prompt, imagem e intensidade.

semente (número) — Valor para controlar a aleatoriedade na geração. Varia de 0 a 4.294.967.295. Padrão: 0 (propagação aleatória).

Mínimo	Máximo	Padrão
0	4294967294	0

negative_prompt (string) — Texto descrevendo elementos a serem excluídos da imagem de saída. Máximo de 10 mil caracteres.

Mínimo	Máximo
0	10.000

output_format (string) — Formato da imagem de saída. Enumeração: jpeg, png, webp. Padrão: png.



import boto3
import json

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.'
    })
)

Image to image

O modelo Stability.ai Stable Diffusion 3.5 Large tem os seguintes parâmetros de inferência para uma chamada de inferência de imagem para imagem.

prompt (string) — Descrição de texto da imagem de saída desejada. Máximo de 10 mil caracteres.

Mínimo	Máximo
0	10.000

image (string) — imagem Base64-encoded de entrada. Mínimo de 64 pixels por lado. Formatos compatíveis: jpeg, png e webp.
mode (string) (GenerationMode) - Padrão: conversão de texto em imagem. Enumeração: conversão de imagem em imagem ou de texto em imagem. Controla se é uma geração de texto em imagem ou imagem em imagem, o que afeta os parâmetros necessários.
- A conversão de texto em imagem requer somente o parâmetro prompt.
- A conversão imagem em imagem requer os parâmetros prompt, imagem e intensidade.

força (número) — Controla a influência da imagem de entrada na saída. Varia de 0 a 1. O valor 0 preserva a imagem de entrada e o valor 1 ignora a imagem de entrada.

Mínimo	Máximo
0	1

semente (número) — Valor para controlar a aleatoriedade na geração. Varia de 0 a 4.294.967.295. Padrão: 0 (propagação aleatória).

Mínimo	Máximo	Padrão
0	4294967294	0

negative_prompt (string) — Texto descrevendo elementos a serem excluídos da imagem de saída. Máximo de 10 mil caracteres.

Mínimo	Máximo
0	10.000

output_format (string) — Formato da imagem de saída. Enumeração: jpeg, png, webp. Padrão: png.



import boto3
import base64
import json

# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
    image_base64 = base64.b64encode(image_file.read()).decode('utf-8')

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-5-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.',
        'image': image_base64,
        'strength': 0.7
    })
)

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Stable Image Ultra

Stable Image Core