Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Stability.ai Stable Diffusion 3.5 Grande
El modelo Stable Diffusion 3.5 Large utiliza 8000 millones de parámetros y admite una salida de resolución de 1 megapíxel para la generación de texto a imagen y de imagen a imagen.
El cuerpo de la solicitud se pasa en el body campo de una solicitud a InvokeModel.
Campo del cuerpo de la solicitud de invocación del modelo
Cuando realices una InvokeModel llamada con un modelo Stable Diffusion 3.5 Large, rellena el campo del cuerpo con un objeto JSON parecido al siguiente.
Campo del cuerpo de respuestas a la invocación del modelo
Cuando realiza una InvokeModel llamada con un modelo Stable Diffusion 3.5 Large, la respuesta es similar a la siguiente
{
'seeds': [2130420379],
"finish_reasons":[null],
"images":["..."]
}
Una respuesta con un motivo de finalización que no null lo sea tendrá el siguiente aspecto:
{
"finish_reasons":["Filter reason: prompt"]
}
seeds: (cadena) lista de semillas utilizadas para generar imágenes para el modelo.
-
finish_reasons: enumeración que indica si la solicitud se ha filtrado o no. null indica que la solicitud se ha realizado correctamente. Valores posibles actuales: "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
-
images: lista de imágenes generadas en formato de cadena base64.
- Text to image
-
El modelo Stability.ai Stable Diffusion 3.5 Large tiene los siguientes parámetros de inferencia para una llamada de inferencia de texto a imagen.
Parámetros opcionales
-
aspect_ratio (cadena): controla la relación de aspecto de la imagen generada. Solo es válido para las solicitudes de texto a imagen. Enumeración: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. El valor predeterminado es 1:1.
-
mode (string) (GenerationMode) - Predeterminado: conversión de texto a imagen. Enum: de imagen a imagen o de texto a imagen. Controla si se trata de una generación de texto a imagen o de imagen a imagen, lo que afecta a los parámetros necesarios:
-
De texto a imagen solo requiere el parámetro prompt.
-
De imagen a imagen requiere los parámetros prompt, image y strength.
-
seed (number): valor para controlar la aleatoriedad en la generación. Intervalo: de 0 a 4294967294. Predeterminado 0 (semilla aleatoria).
| Mínimo |
Máximo |
Predeterminado |
| 0 |
4294967294 |
0 |
-
negative_prompt (cadena): texto que describe los elementos que se van a excluir de la imagen de salida. Máximo 10 000 caracteres.
-
output_format (string): formato de imagen de salida. Enum: jpeg, png, webp. Valor predeterminado: png.
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.'
})
)
- Image to image
-
El modelo Stability.ai Stable Diffusion 3.5 Large tiene los siguientes parámetros de inferencia para una llamada de inferencia de imagen a imagen.
-
prompt (string): descripción textual de la imagen de salida deseada. Máximo 10 000 caracteres.
-
imagen (cadena): imagen Base64-encoded de entrada. Mínimo de 64 píxeles por lado. Formatos compatibles: jpeg, png, webp.
-
mode (string) (GenerationMode) - Predeterminado: conversión de texto a imagen. Enum: de imagen a imagen o de texto a imagen. Controla si se trata de una generación de texto a imagen o de imagen a imagen, lo que afecta a los parámetros necesarios:
-
De texto a imagen solo requiere el parámetro prompt.
-
De imagen a imagen requiere los parámetros prompt, image y strength.
-
fuerza (número): controla la influencia de la imagen de entrada en la salida. Intervalo del 0 al 1. El valor de 0 conserva la imagen de entrada; el valor de 1 ignora la imagen de entrada.
-
semilla (número): valor para controlar la aleatoriedad en la generación. Intervalo: de 0 a 4294967294. Predeterminado 0 (semilla aleatoria).
| Mínimo |
Máximo |
Predeterminado |
| 0 |
4294967294 |
0 |
-
negative_prompt (cadena): texto que describe los elementos que se van a excluir de la imagen de salida. Máximo 10 000 caracteres.
-
output_format (string): formato de imagen de salida. Enum: jpeg, png, webp. Valor predeterminado: png.
import boto3
import base64
import json
# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
image_base64 = base64.b64encode(image_file.read()).decode('utf-8')
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.',
'image': image_base64,
'strength': 0.7
})
)