View a markdown version of this page

Stability.ai Stable Diffusion 3.5 Grande - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Stability.ai Stable Diffusion 3.5 Grande

El modelo Stable Diffusion 3.5 Large utiliza 8000 millones de parámetros y admite una salida de resolución de 1 megapíxel para la generación de texto a imagen y de imagen a imagen.

El cuerpo de la solicitud se pasa en el body campo de una solicitud a InvokeModel.

Campo del cuerpo de la solicitud de invocación del modelo

Cuando realices una InvokeModel llamada con un modelo Stable Diffusion 3.5 Large, rellena el campo del cuerpo con un objeto JSON parecido al siguiente.

  • prompt (cadena): descripción textual de la imagen de salida deseada. Máximo 10 000 caracteres.

    Mínimo Máximo

    0

    10 000

Campo del cuerpo de respuestas a la invocación del modelo

Cuando realiza una InvokeModel llamada con un modelo Stable Diffusion 3.5 Large, la respuesta es similar a la siguiente

{ 'seeds': [2130420379], "finish_reasons":[null], "images":["..."] }

Una respuesta con un motivo de finalización que no null lo sea tendrá el siguiente aspecto:

{ "finish_reasons":["Filter reason: prompt"] }
  • seeds: (cadena) lista de semillas utilizadas para generar imágenes para el modelo.

  • finish_reasons: enumeración que indica si la solicitud se ha filtrado o no. null indica que la solicitud se ha realizado correctamente. Valores posibles actuales: "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.

  • images: lista de imágenes generadas en formato de cadena base64.

Text to image

El modelo Stability.ai Stable Diffusion 3.5 Large tiene los siguientes parámetros de inferencia para una llamada de inferencia de texto a imagen.

  • prompt (string): descripción textual de la imagen de salida deseada. Máximo 10 000 caracteres.

    Mínimo Máximo
    0 10 000

Parámetros opcionales

  • aspect_ratio (cadena): controla la relación de aspecto de la imagen generada. Solo es válido para las solicitudes de texto a imagen. Enumeración: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. El valor predeterminado es 1:1.

  • mode (string) (GenerationMode) - Predeterminado: conversión de texto a imagen. Enum: de imagen a imagen o de texto a imagen. Controla si se trata de una generación de texto a imagen o de imagen a imagen, lo que afecta a los parámetros necesarios:

    • De texto a imagen solo requiere el parámetro prompt.

    • De imagen a imagen requiere los parámetros prompt, image y strength.

  • seed (number): valor para controlar la aleatoriedad en la generación. Intervalo: de 0 a 4294967294. Predeterminado 0 (semilla aleatoria).

    Mínimo Máximo Predeterminado
    0 4294967294 0
  • negative_prompt (cadena): texto que describe los elementos que se van a excluir de la imagen de salida. Máximo 10 000 caracteres.

    Mínimo Máximo
    0 10 000
  • output_format (string): formato de imagen de salida. Enum: jpeg, png, webp. Valor predeterminado: png.

import boto3 import json bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) )
Image to image

El modelo Stability.ai Stable Diffusion 3.5 Large tiene los siguientes parámetros de inferencia para una llamada de inferencia de imagen a imagen.

  • prompt (string): descripción textual de la imagen de salida deseada. Máximo 10 000 caracteres.

    Mínimo Máximo
    0 10 000
  • imagen (cadena): imagen Base64-encoded de entrada. Mínimo de 64 píxeles por lado. Formatos compatibles: jpeg, png, webp.

  • mode (string) (GenerationMode) - Predeterminado: conversión de texto a imagen. Enum: de imagen a imagen o de texto a imagen. Controla si se trata de una generación de texto a imagen o de imagen a imagen, lo que afecta a los parámetros necesarios:

    • De texto a imagen solo requiere el parámetro prompt.

    • De imagen a imagen requiere los parámetros prompt, image y strength.

  • fuerza (número): controla la influencia de la imagen de entrada en la salida. Intervalo del 0 al 1. El valor de 0 conserva la imagen de entrada; el valor de 1 ignora la imagen de entrada.

    Mínimo Máximo
    0 1
  • semilla (número): valor para controlar la aleatoriedad en la generación. Intervalo: de 0 a 4294967294. Predeterminado 0 (semilla aleatoria).

    Mínimo Máximo Predeterminado
    0 4294967294 0
  • negative_prompt (cadena): texto que describe los elementos que se van a excluir de la imagen de salida. Máximo 10 000 caracteres.

    Mínimo Máximo
    0 10 000
  • output_format (string): formato de imagen de salida. Enum: jpeg, png, webp. Valor predeterminado: png.

import boto3 import base64 import json # Load and encode image with open('input_image.jpg', 'rb') as image_file: image_base64 = base64.b64encode(image_file.read()).decode('utf-8') bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='stability.sd3-5-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.', 'image': image_base64, 'strength': 0.7 }) )