Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Servicios de imágenes de IA de estabilidad
Puede utilizar Stability AI Image Services con Amazon Bedrock para acceder a nueve herramientas de edición de imágenes especializadas diseñadas para acelerar los flujos de trabajo creativos profesionales. Con Stability AI Image Services, puede generar imágenes a partir de un boceto, reestructurar y cambiar el estilo de una imagen existente, o eliminar y reemplazar los objetos de una imagen.
En esta sección se describe cómo realizar llamadas de inferencia a los servicios de imágenes de Stability AI mediante el. InvokeModel Esta sección también proporciona ejemplos de código en Python y ejemplos de imágenes antes y después de usar Stability AI Image Services.
Los servicios de imágenes de Stability AI están disponibles en las siguientes categorías:
Edición: servicios de edición de imágenes basados en la inteligencia artificial, que incluyen pintar con máscaras (relleno generativo) o con palabras. Incluye herramientas para la colocación y publicidad de productos, así como herramientas básicas, como la eliminación de fondos.
Control ‐ Puede utilizar indicaciones, mapas y otras guías. Estos servicios ControlNets aprovechan tecnologías similares basadas en modelos de difusión estable.
nota
Al suscribirse a cualquier servicio de imágenes de IA de Stability, editarlo o controlarlo, se inscribirá automáticamente en los nueve servicios de imágenes de IA de Stability disponibles.
Solicitud y respuesta
El cuerpo de la solicitud se pasa en el body
campo de la solicitud a. InvokeModel
Campo del cuerpo de la solicitud de invocación del modelo
Cuando realices una InvokeModel llamada con Stability AI Image Services, rellena el campo del cuerpo con un objeto JSON parecido al que se muestra a continuación.
{ 'prompt': 'Create an image of a panda' }
Campo del cuerpo de respuestas a la invocación del modelo
Cuando haces una InvokeModel llamada con Stability AI Image Services, la respuesta es similar a la siguiente
{ 'seeds': [2130420379], 'finish_reasons': [null], 'images': ['...'] }
seeds: (cadena) lista de semillas utilizadas para generar imágenes para el modelo.
-
finish_reasons: enumeración que indica si la solicitud se ha filtrado o no.
null
indica que la solicitud se ha realizado correctamente. Valores posibles actuales:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null
. -
images: lista de imágenes generadas en formato de cadena base64.
Para obtener más información, consulte https://platform.us.stability. ai/docs/api-reference#tag/v1 generación
Edición
En la siguiente sección se describe la edición de Stability AI Image Services.
Inpaint modifica las imágenes de forma inteligente rellenando o sustituyendo áreas específicas por contenido nuevo en función del contenido de la imagen de una máscara.
Inpaint tiene los siguientes parámetros obligatorios:
prompt ‐ Lo que desea ver en la imagen de salida. Una petición descriptiva y fuerte que defina claramente los elementos, los colores y los sujetos permitirá obtener mejores resultados. Para controlar el peso de una palabra determinada, utilice el formato (word:weight), donde palabra es la palabra cuyo peso desea controlar y peso es un valor. Los valores 0 y 1,0 restan énfasis a la palabra y los valores entre 1,1 y 2 enfatizan la palabra. Por ejemplo: el cielo era nítido (azul: 0,3) y (verde: 1,8) representaría un cielo azul y verde, pero más verde que azul. Mínimo 0 y máximo 10000 caracteres.
image ‐ (cadena) La imagen de Base64 que se va a pintar. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
Los siguientes parámetros son opcionales:
style_preset ‐ (string) Guía el modelo de imagen hacia un estilo concreto. Enum: modelo 3D, película analógica, anime, cine, cómic, arte digital, mejora, arte fantástico, isométrico, arte lineal, low-poly, modelado compuesto, neon-punk, origami, fotográfico, pixel-art, textura de mosaico.
negative_prompt ‐ (cadena) Un texto que describe lo que no desea ver en la imagen de salida. Esta es una característica avanzada. Máximo 10 000 caracteres.
semilla ‐ (número) Un valor específico que se utiliza para determinar la «aleatoriedad» de la generación. (Omita este parámetro o pase 0 para usar una semilla aleatoria). Rango de 0 a 4294967294. Predeterminado 0.
output_format ‐ (string) Dicta el tipo de contenido de la imagen generada. Enum: jpeg, png, webp. PNG predeterminado.
mask ‐ (cadena) Controla la intensidad del proceso de pintura interna por píxel, ya sea mediante una segunda imagen (que se pasa a este parámetro) o mediante el canal alfa del parámetro de imagen.
Pasar una máscara: la imagen que se pase a este parámetro debe ser una imagen en blanco y negro que represente, en cualquier píxel, la intensidad de la pintura interna en función del grado de oscuridad o claridad del píxel en cuestión. Los píxeles completamente negros representan la ausencia de fuerza de pintura, mientras que los píxeles completamente blancos representan la fuerza máxima. En el caso de que la máscara tenga un tamaño diferente al del parámetro de la imagen, se redimensionará automáticamente.
Alpha Channel Support ‐ Si no proporciona una máscara explícita, se derivará una del canal alfa del parámetro de imagen. Los píxeles transparentes se repintarán mientras que los opacos se conservarán. En el caso de que se proporcione una imagen con un canal alfa junto con una máscara, la máscara tendrá prioridad.
grow_mask ‐ Hace crecer los bordes de la máscara hacia afuera en todas las direcciones según el número de píxeles especificado. El área expandida alrededor de la máscara aparecerá borrosa, lo que puede ayudar a suavizar la transición entre el contenido pintado y la imagen original. Rango entre 0 y 20. Predeterminado 5. Pruebe este parámetro si observa costuras o bordes rugosos alrededor del contenido pintado. Tenga en cuenta que un crecimiento excesivo puede oscurecer los detalles finos de la máscara y and/or fusionar las regiones enmascaradas cercanas.
La siguiente tabla muestra las imágenes de entrada y salida de una operación de Inpaint.
Input |
Máscara |
Salida |
---|---|---|
![]() |
![]() |
![]() |
«El hombre en una metrópolis» generado por Stable Image Ultra, con indicaciones y ediciones de Sanwal Yousaf. Licenciado bajo CC BY 4.0 |
Buscar y volver a colorear te permite cambiar el color de un objeto específico de una imagen mediante un mensaje. Este servicio es una versión específica de inpainting que no requiere máscara. Segmentará automáticamente el objeto y lo volverá a colorear con los colores solicitados en la solicitud.
Buscar y volver a colorear tiene los siguientes parámetros obligatorios:
prompt ‐ Lo que desea ver en la imagen de salida. Una petición descriptiva y fuerte que defina claramente los elementos, los colores y los sujetos permitirá obtener mejores resultados. Para controlar el peso de una palabra determinada, utilice el formato (word:weight), donde palabra es la palabra cuyo peso desea controlar y peso es un valor. Los valores 0 y 1,0 restan énfasis a la palabra y los valores entre 1,1 y 2 enfatizan la palabra. Por ejemplo: el cielo era nítido (azul: 0,3) y (verde: 1,8) representaría un cielo azul y verde, pero más verde que azul. Mínimo 0 y máximo 10000 caracteres.
image ‐ (cadena) La imagen de Base64 que se va a volver a colorear. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
select_prompt ‐ (string) Breve descripción de lo que se debe buscar en la imagen. Máximo 10000 caracteres.
Los siguientes parámetros son opcionales:
style_preset ‐ (string) Guía el modelo de imagen hacia un estilo concreto. Enum: modelo 3D, película analógica, anime, cine, cómic, arte digital, mejora, arte fantástico, isométrico, arte lineal, low-poly, modelado compuesto, neon-punk, origami, fotográfico, pixel-art, textura de mosaico.
negative_prompt ‐ (cadena) Un texto que describe lo que no desea ver en la imagen de salida. Esta es una característica avanzada. Máximo 10 000 caracteres.
semilla ‐ (número) Un valor específico que se utiliza para determinar la «aleatoriedad» de la generación. (Omita este parámetro o pase 0 para usar una semilla aleatoria). Rango de 0 a 4294967294. Predeterminado 0.
output_format ‐ (string) Dicta el tipo de contenido de la imagen generada. Enum: jpeg, png, webp. PNG predeterminado.
grow_mask ‐ Hace crecer los bordes de la máscara hacia afuera en todas las direcciones según el número de píxeles especificado. El área expandida alrededor de la máscara aparecerá borrosa, lo que puede ayudar a suavizar la transición entre el contenido pintado y la imagen original. Rango entre 0 y 20. Predeterminado 5. Pruebe este parámetro si observa costuras o bordes rugosos alrededor del contenido pintado. Tenga en cuenta que un crecimiento excesivo puede oscurecer los detalles finos de la máscara y and/or fusionar las regiones enmascaradas cercanas.
En la siguiente tabla se muestran las imágenes de entrada y salida de una operación de búsqueda y cambio de color mediante el siguiente mensaje: pink jacket.
Input |
Output |
---|---|
![]() |
![]() |
«Hombre con chaqueta acolchada» generada por Stable Image Ultra, imágenes y ediciones de Sanwal Yousaf. Licenciado |
Buscar y reemplazar permite utilizar un mensaje de búsqueda para identificar en un lenguaje sencillo el objeto que se va a reemplazar. El servicio segmentará automáticamente el objeto y lo sustituirá por el objeto solicitado en el mensaje sin necesidad de utilizar una máscara.
Buscar y reemplazar tiene los siguientes parámetros obligatorios:
prompt ‐ Lo que desea ver en la imagen de salida. Una petición descriptiva y fuerte que defina claramente los elementos, los colores y los sujetos permitirá obtener mejores resultados. Para controlar el peso de una palabra determinada, utilice el formato (word:weight), donde palabra es la palabra cuyo peso desea controlar y peso es un valor. Los valores 0 y 1,0 restan énfasis a la palabra y los valores entre 1,1 y 2 enfatizan la palabra. Por ejemplo: el cielo era nítido (azul: 0,3) y (verde: 1,8) representaría un cielo azul y verde, pero más verde que azul. Mínimo 0 y máximo 10000 caracteres.
image ‐ (cadena) La imagen de Base64 que se va a volver a colorear. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
search_prompt ‐ (string) Breve descripción de lo que se debe pintar en la imagen. Máximo 10000 caracteres.
Los siguientes parámetros son opcionales:
style_preset ‐ (string) Guía el modelo de imagen hacia un estilo concreto. Enum: modelo 3D, película analógica, anime, cine, cómic, arte digital, mejora, arte fantástico, isométrico, arte lineal, low-poly, modelado compuesto, neon-punk, origami, fotográfico, pixel-art, textura de mosaico.
negative_prompt ‐ (cadena) Un texto que describe lo que no desea ver en la imagen de salida. Esta es una característica avanzada. Máximo 10 000 caracteres.
semilla ‐ (número) Un valor específico que se utiliza para determinar la «aleatoriedad» de la generación. (Omita este parámetro o pase 0 para usar una semilla aleatoria). Rango de 0 a 4294967294. Predeterminado 0.
output_format ‐ (string) Dicta el tipo de contenido de la imagen generada. Enum: jpeg, png, webp. PNG predeterminado.
grow_mask ‐ Hace crecer los bordes de la máscara hacia afuera en todas las direcciones según el número de píxeles especificado. El área expandida alrededor de la máscara aparecerá borrosa, lo que puede ayudar a suavizar la transición entre el contenido pintado y la imagen original. Rango entre 0 y 20. Predeterminado 5. Pruebe este parámetro si observa costuras o bordes rugosos alrededor del contenido pintado. Tenga en cuenta que un crecimiento excesivo puede oscurecer los detalles finos de la máscara y and/or fusionar las regiones enmascaradas cercanas.
En la siguiente tabla se muestran las imágenes de entrada y salida de una operación de búsqueda y reemplazo mediante el siguiente mensaje: chaqueta.
Input |
Output |
---|---|
![]() |
![]() |
«Modelo femenina con un jersey otoñal» generado por Stable Image Ultra. Indicaciones y ediciones de Sanwal Yousaf. Licenciado bajo CC BY 4.0 |
El borrado permite eliminar elementos no deseados mediante máscaras de imagen y, al mismo tiempo, mantener de forma inteligente la coherencia del fondo.
Erase tiene los siguientes parámetros obligatorios:
image ‐ (cadena) La imagen de Base64 de la que se va a borrar. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
Los siguientes parámetros son opcionales:
semilla ‐ (número) Un valor específico que se utiliza para determinar la «aleatoriedad» de la generación. (Omita este parámetro o pase 0 para usar una semilla aleatoria). Rango de 0 a 4294967294. Predeterminado 0.
output_format ‐ (string) Dicta el tipo de contenido de la imagen generada. Enum: jpeg, png, webp. PNG predeterminado.
mask ‐ (cadena) Controla la intensidad del proceso de pintura interna por píxel, ya sea mediante una segunda imagen (que se pasa a este parámetro) o mediante el canal alfa del parámetro de imagen.
Pasar una máscara: la imagen que se pase a este parámetro debe ser una imagen en blanco y negro que represente, en cualquier píxel, la intensidad de la pintura interna en función del grado de oscuridad o claridad del píxel en cuestión. Los píxeles completamente negros representan la ausencia de fuerza de pintura, mientras que los píxeles completamente blancos representan la fuerza máxima. En el caso de que la máscara tenga un tamaño diferente al del parámetro de la imagen, se redimensionará automáticamente.
Alpha Channel Support ‐ Si no proporciona una máscara explícita, se derivará una del canal alfa del parámetro de imagen. Los píxeles transparentes se repintarán mientras que los opacos se conservarán. En el caso de que se proporcione una imagen con un canal alfa junto con una máscara, la máscara tendrá prioridad.
grow_mask ‐ Hace crecer los bordes de la máscara hacia afuera en todas las direcciones según el número de píxeles especificado. El área expandida alrededor de la máscara aparecerá borrosa, lo que puede ayudar a suavizar la transición entre el contenido pintado y la imagen original. Rango entre 0 y 20. Predeterminado 5. Pruebe este parámetro si observa costuras o bordes rugosos alrededor del contenido pintado. Tenga en cuenta que un crecimiento excesivo puede oscurecer los detalles finos de la máscara y and/or fusionar las regiones enmascaradas cercanas.
nota
Para obtener resultados de borrado óptimos, asegúrate de que la máscara defina con precisión las áreas que se van a quitar. Si no se proporciona una máscara explícita, el servicio utilizará el canal alfa de la imagen de entrada. La máscara tendrá prioridad si se proporcionan ambas.
La siguiente tabla muestra las imágenes de entrada y salida de una operación de borrado.
Input |
Máscara |
Salida |
---|---|---|
![]() |
![]() |
![]() |
«Escritorio para estudiantes» generado por Stable Image Ultra. Indicaciones y ediciones de Sanwal Yousaf. Licenciado bajo CC BY 4.0 |
Eliminar fondo le permite aislar los sujetos del fondo con precisión.
Remove Background tiene los siguientes parámetros obligatorios:
image ‐ (cadena) La imagen de Base64 de la que se va a eliminar el fondo. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
Los siguientes parámetros son opcionales:
output_format ‐ (string) Dicta el tipo de contenido de la imagen generada. Enum: jpeg, png, webp. PNG predeterminado.
La siguiente tabla muestra las imágenes de entrada y salida de una operación de eliminación del fondo.
Input |
Output |
---|---|
![]() |
![]() |
«Modelo femenina con un jersey otoñal» generado por Stable Image Ultra. Indicaciones y ediciones de Sanwal Yousaf. Licenciado bajo CC BY 4.0 |
Controlar
En la siguiente sección se describen los servicios de control Stability AI Image Services.
Actualice los bocetos dibujados a mano para convertirlos en resultados refinados con un control preciso. En el caso de imágenes que no son bocetos, Control Sketch permite una manipulación detallada del aspecto final al aprovechar las líneas de contorno y los bordes de la imagen.
Control Sketch tiene los siguientes parámetros obligatorios:
prompt ‐ Lo que desea ver en la imagen de salida. Una petición descriptiva y fuerte que defina claramente los elementos, los colores y los sujetos permitirá obtener mejores resultados. Para controlar el peso de una palabra determinada, utilice el formato (word:weight), donde palabra es la palabra cuyo peso desea controlar y peso es un valor. Los valores 0 y 1,0 restan énfasis a la palabra y los valores entre 1,1 y 2 enfatizan la palabra. Por ejemplo: el cielo era nítido (azul: 0,3) y (verde: 1,8) representaría un cielo azul y verde, pero más verde que azul. Mínimo 0 y máximo 10000 caracteres.
image ‐ (cadena) La imagen en Base64 del boceto. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
Los siguientes parámetros son opcionales:
control_strength ‐ (número) Cuánta influencia o control tiene la imagen en la generación. Se representa como un valor flotante entre 0 y 1, donde 0 es la menor influencia y 1 es la máxima. El valor predeterminado es 0.7.
negative_prompt ‐ (cadena) Un texto que describe lo que no desea ver en la imagen de salida. Esta es una característica avanzada. Máximo 10 000 caracteres.
semilla ‐ (número) Un valor específico que se utiliza para determinar la «aleatoriedad» de la generación. (Omita este parámetro o pase 0 para usar una semilla aleatoria). Rango de 0 a 4294967294. Predeterminado 0.
output_format ‐ (string) Dicta el tipo de contenido de la imagen generada. Enum: jpeg, png, webp. PNG predeterminado.
style_preset ‐ Guía el modelo de imagen hacia un estilo concreto. Enum: modelo 3D, película analógica, anime, cine, cómic, arte digital, mejora, arte fantástico, isométrico, arte lineal, low-poly, modelado compuesto, neon-punk, origami, fotográfico, pixel-art, textura en mosaico.
En la siguiente tabla se muestran las imágenes de entrada y salida de una llamada de Control Sketch utilizando la siguiente línea de comandos: una casa con un fondo de montañas y un río que fluye cerca.
Input |
Output |
---|---|
![]() |
![]() |
«Bosquejo de una casa, una montaña y un río» de Sanwal Yousaf. Licenciado bajo CC BY 4.0 |
La estructura de control le permite generar imágenes manteniendo la estructura de una imagen de entrada. Esto resulta especialmente útil para escenarios avanzados de creación de contenido, como la recreación de escenas o la representación de personajes a partir de modelos.
La estructura de control tiene los siguientes parámetros obligatorios:
prompt ‐ Lo que desea ver en la imagen de salida. Una petición descriptiva y fuerte que defina claramente los elementos, los colores y los sujetos permitirá obtener mejores resultados. Para controlar el peso de una palabra determinada, utilice el formato (word:weight), donde palabra es la palabra cuyo peso desea controlar y peso es un valor. Los valores 0 y 1,0 restan énfasis a la palabra y los valores entre 1,1 y 2 enfatizan la palabra. Por ejemplo: el cielo era nítido (azul: 0,3) y (verde: 1,8) representaría un cielo azul y verde, pero más verde que azul. Mínimo 0 y máximo 10000 caracteres.
image ‐ (cadena) La imagen en Base64 del boceto. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
Los siguientes parámetros son opcionales:
control_strength ‐ (número) Cuánta influencia o control tiene la imagen en la generación. Se representa como un valor flotante entre 0 y 1, donde 0 es la menor influencia y 1 es la máxima. El valor predeterminado es 0.7.
negative_prompt ‐ (cadena) Un texto que describe lo que no desea ver en la imagen de salida. Esta es una característica avanzada. Máximo 10 000 caracteres.
semilla ‐ (número) Un valor específico que se utiliza para determinar la «aleatoriedad» de la generación. (Omita este parámetro o pase 0 para usar una semilla aleatoria). Rango de 0 a 4294967294. Predeterminado 0.
output_format ‐ (string) Dicta el tipo de contenido de la imagen generada. Enum: jpeg, png, webp. PNG predeterminado.
style_preset ‐ Guía el modelo de imagen hacia un estilo concreto. Enum: modelo 3D, película analógica, anime, cine, cómic, arte digital, mejora, arte fantástico, isométrico, arte lineal, low-poly, modelado compuesto, neon-punk, origami, fotográfico, pixel-art, textura en mosaico.
En la siguiente tabla se muestran las imágenes de entrada y salida de una operación de estructura de control que utiliza la siguiente línea de comandos: estructura surrealista con chispas generadas por el movimiento que iluminan la escena.
La Guía de estilo permite extraer elementos estilísticos de una imagen de entrada y utilizarla para guiar la creación de una imagen de salida en función de la solicitud. El resultado es una imagen nueva con el mismo estilo que la imagen de entrada.
La Guía de estilo tiene los siguientes parámetros obligatorios:
prompt ‐ Lo que desea ver en la imagen de salida. Una petición descriptiva y fuerte que defina claramente los elementos, los colores y los sujetos permitirá obtener mejores resultados. Para controlar el peso de una palabra determinada, utilice el formato (word:weight), donde palabra es la palabra cuyo peso desea controlar y peso es un valor. Los valores 0 y 1,0 restan énfasis a la palabra y los valores entre 1,1 y 2 enfatizan la palabra. Por ejemplo: el cielo era nítido (azul: 0,3) y (verde: 1,8) representaría un cielo azul y verde, pero más verde que azul. Mínimo 0 y máximo 10000 caracteres.
image ‐ (cadena) La imagen en Base64 del boceto. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
Los siguientes parámetros son opcionales:
aspect_ratio ‐ (cadena) Controla la relación de aspecto de la imagen generada. Este parámetro solo es válido para las solicitudes. text-to-image El valor predeterminado es 1:1. Enumeración: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. El valor predeterminado es 1:1.
negative_prompt ‐ (cadena) Una nota de texto que describe lo que no desea ver en la imagen de salida. Esta es una característica avanzada. Máximo 10 000 caracteres.
semilla ‐ (número) Un valor específico que se utiliza para determinar la «aleatoriedad» de la generación. (Omita este parámetro o pase 0 para usar una semilla aleatoria). Rango de 0 a 4294967294. Predeterminado 0.
output_format ‐ (string) Dicta el tipo de contenido de la imagen generada. Enum: jpeg, png, webp. PNG predeterminado.
fidelidad ‐ (número) Cuánto se parece el estilo de la imagen de salida al estilo de la imagen de entrada. Rango de 0 a 1. 0,5 por defecto.
style_preset ‐ Guía el modelo de imagen hacia un estilo concreto. Enum: modelo 3D, película analógica, anime, cine, cómic, arte digital, mejora, arte fantástico, isométrico, arte lineal, low-poly, modelado compuesto, neon-punk, origami, fotográfico, pixel-art, textura en mosaico.
En la siguiente tabla se muestran las imágenes de entrada y salida de una llamada a Style Guide utilizando el siguiente mensaje: plano panorámico de una metrópolis moderna.
Input |
Output |
---|---|
![]() |
![]() |
«Pintura abstracta» |
La transferencia de estilos permite aplicar las características visuales de las imágenes de estilo de referencia a las imágenes de destino. Mientras que el servicio de guías de estilo extrae los elementos estilísticos de una imagen de entrada y los utiliza para guiar la creación de una imagen de salida en función de la solicitud, Style Transfer transforma específicamente el contenido existente conservando la composición original. Esta herramienta ayuda a crear contenido coherente en varios activos.
Style Transfer tiene los siguientes parámetros obligatorios:
init_image ‐ (string) Una imagen en Base64 que contiene el tema al que desea cambiar el estilo. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
style_image ‐ (string) Una imagen en Base64 que contiene el tema al que desea cambiar el estilo. Cada lado de la imagen debe tener al menos 64 píxeles. El número total de píxeles no puede superar los 9 437.184 píxeles. La relación de aspecto de la imagen debe estar entre 1:2,5 y 2. 5:1. Formatos compatibles: jpeg, png, webp.
Los siguientes parámetros son opcionales:
prompt ‐ (cadena) Lo que desea ver en la imagen de salida. Una petición descriptiva y fuerte que defina claramente los elementos, los colores y los sujetos permitirá obtener mejores resultados. Para controlar el peso de una palabra determinada, utilice el formato (palabra:peso), donde palabra es la palabra cuyo peso desea controlar y peso es un valor. Los valores 0 y 1,0 restan énfasis a la palabra y los valores entre 1,1 y 2 enfatizan la palabra. Por ejemplo: el cielo era nítido (azul: 0,3) y (verde: 1,8) representaría un cielo azul y verde, pero más verde que azul.
negative_prompt ‐ (cadena) Un texto que describe lo que no desea ver en la imagen de salida. Esta es una característica avanzada. Máximo 10 000 caracteres.
semilla ‐ (número) Un valor específico que se utiliza para determinar la «aleatoriedad» de la generación. (Omita este parámetro o pase 0 para usar una semilla aleatoria). Rango de 0 a 4294967294. Predeterminado 0.
output_format ‐ (string) Dicta el tipo de contenido de la imagen generada. Enum: jpeg, png, webp. PNG predeterminado.
composition_fidelity ‐ (number) Cuánto se parece el estilo de la imagen de salida al estilo de la imagen de entrada. Rango entre 0 y 1. El valor predeterminado es 0.9.
style_strength ‐ (number) Este parámetro, que a veces se denomina reducción de ruido, controla la influencia que tiene el parámetro style_image en la imagen generada. Un valor de 0 generaría una imagen idéntica a la entrada. Un valor de 1 sería como si no hubiera pasado ninguna imagen. Rango entre 0 y 1. Predeterminado 1.
change_strength ‐ (número) Cuánto debe cambiar la imagen original. Rango entre 0,1 y 1. El valor predeterminado es 0.9.
La siguiente tabla muestra las imágenes de entrada y salida de una llamada de Style Transfer.
Input |
Style (Estilo) |
Salida |
---|---|---|
![]() |
![]() |
![]() |
«Estatua de mujer de pie» |