Prueba virtual
La prueba virtual es un caso de uso de inpainting guiado por imágenes en el que los contenidos de una imagen de referencia se superponen a una imagen de origen basándose en la orientación de una imagen de máscara. Amazon Nova Canvas se ha ajustado para prendas, accesorios, muebles y objetos relacionados. El modelo también se generaliza bien a otros casos, como añadir un logotipo o texto a una imagen.
Puede generar hasta cinco imágenes con la API de la prueba virtual. De forma predeterminada, solo se genera una imagen.
Para realizar una prueba virtual, debe proporcionar tres imágenes:
-
Imagen de origen: la imagen original que desea modificar. Por ejemplo, puede ser una imagen, una persona o la escena de una habitación.
-
Imagen de referencia: la imagen que contiene el elemento, objeto o artículo que desea superponer a la imagen de origen. Por ejemplo, puede contener una chaqueta, un cuenco o un sofá. En el caso de las prendas, la imagen de referencia puede incluir prendas con o sin cuerpo y varios productos que representen distintos componentes del atuendo (como camisas, pantalones y zapatos en una sola imagen).
-
Imagen de máscara: la máscara que define qué parte de la imagen de origen quiere modificar. Una imagen de máscara es una imagen en blanco y negro que se utiliza para definir qué parte de la imagen de origen debe modificarse. Los píxeles negros indican el área de la imagen de origen que se debe modificar, mientras que los píxeles blancos indican las áreas de la imagen que se deben conservar. Puede proporcionar su propia imagen de máscara o dejar que el modelo cree una por usted basándose en otros parámetros de entrada que usted proporcione.
La imagen de máscara se puede devolver como parte de la salida si se especifica.
A continuación, se muestran algunos ejemplos de cómo funciona el modelo.
A diferencia de otros tipos de tareas de Amazon Nova Canvas, la prueba virtual no admite una petición de texto ni una petición de texto negativo.
Definición de la imagen de máscara
Puede proporcionar directamente una imagen de máscara especificando maskType: "IMAGE"
o permitir que el modelo la calcule automáticamente mediante entradas auxiliares como maskType: "GARMENT"
o maskType: "PROMPT"
.
Cuando se especifica un tipo de máscara "GARMENT"
, Amazon Nova Canvas crea una máscara compatible con prendas de vestir basada en un valor del parámetro de entrada garmentClass
que especifique. En la mayoría de los casos, puede utilizar una de las siguientes clases de prendas de alto nivel:
-
"UPPER_BODY"
: crea una máscara que abarca toda la longitud del brazo. -
"LOWER_BODY"
: crea una máscara que abarca toda la longitud de la pierna sin dejar espacio entre las piernas. -
"FOOTWEAR"
: crea una máscara que se ajusta al perfil del zapato que se muestra en la imagen de origen. -
"FULL_BODY"
: crea una máscara equivalente a la combinación de"UPPER_BODY"
y"LOWER_BODY"
.
Puede usar el tipo de máscara "PROMPT"
para usar un lenguaje natural y describir el elemento de la imagen de origen que desea reemplazar. Esto es útil para escenarios que no son de prendas de vestir. Esta característica utiliza la misma funcionalidad de enmascaramiento automático que existe en el tipo de tarea "INPAINTING"
a través del parámetro maskPrompt
.
aviso
Las máscaras creadas con el tipo de máscara "PROMPT"
se adherirán firmemente a la forma del elemento que usted describa. Esto puede resultar problemático en muchos escenarios porque el producto que usted está añadiendo podría no compartir la misma silueta o tamaño del elemento que está reemplazando. Por esta razón, la API de la prueba virtual también proporciona un parámetro opcional maskShape
que se puede configurar en "BOUNDING_BOX"
. Recomendamos usar esta configuración (que es la predeterminada) en la mayoría de los casos cuando se usa el tipo de máscara "PROMPT"
.
Generación de nuevas poses, manos o rostros
Puede indicarle al modelo que mantenga o regenere la pose, las manos o el rostro de la persona en la imagen de origen. Cuando elige conservar estos elementos, se eliminan automáticamente de la imagen de máscara, independientemente del maskType
que haya elegido.
Es posible que desee conservar la pose, las manos o el rostro en las siguientes situaciones:
-
Está desarrollando una aplicación que permite a los usuarios finales dibujar sus propias máscaras. La conservación de estas características evita que los usuarios finales incluyan accidentalmente las manos o el rostro en la máscara.
-
Está utilizando
maskShape: BOUNDING_BOX
, pero no quiere generar nuevas manos o rostro. ConpreserveFace: ON
opreserveHands: ON
, estas características se eliminan automáticamente de la máscara. -
Está utilizando
maskType:GARMENT
ymaskShape: BOUNDING_BOX
con un modelo que no está en posición vertical. En este caso, la máscara con forma de cuadro delimitador puede superponerse a la cara y recomendamos que utilicepreserveFace: ON
.
Por el contrario, es posible que desee regenerar la pose, las manos o el rostro en las siguientes situaciones:
-
En el caso de prendas que cubren el cuello,
preserveFace: ON
puede excluir una parte suficiente del cuello como para repercutir negativamente en el resultado. -
Cuando el modelo lleva zapatos de tacón alto y la imagen de referencia es de zapatos planos, o viceversa. En este caso, conservar la postura corporal crea resultados de aspecto poco natural.
-
Al igual que en el punto anterior, al probarse bolsos u otros accesorios, generar nuevas poses o manos puede generar resultados de aspecto más natural.
Pautas de estilo
El parámetro garmentStyling
le permite conservar o modificar las pautas de estilo específicas de la prenda que pueda encontrar en una sesión de fotos. Por ejemplo, Amazon Nova Canvas puede modificar el estilo de una camisa para que sus mangas queden enrolladas hacia arriba o hacia abajo o puede modificar la camisa para que quede metida por dentro o no. Están disponibles las siguientes opciones:
-
"longSleeveStyle"
: controla si las mangas de una camisa de manga larga están enrolladas hacia arriba o hacia abajo.-
"SLEEVE_DOWN"
: se puede aplicar cuando la imagen de origen lleva puesta una camisa de manga larga (con las mangas hacia arriba o hacia abajo), una camisa de manga corta o una camisa sin mangas. -
"SLEEVE_UP"
: se puede aplicar cuando la imagen de origen lleva puesta una camisa de manga larga con las mangas hacia arriba, una camisa de manga corta o una camisa sin mangas.
-
-
"tuckingStyle"
: controla si una prenda de la parte superior del cuerpo aparece metida por dentro o suelta.-
"UNTUCKED"
: se puede aplicar independientemente de si la imagen de origen tiene la camisa metida por dentro o no. -
"TUCKED"
: se puede aplicar cuando la imagen de origen tiene la camisa metida por dentro.
-
-
"outerLayerStyle"
: controla si una prenda de la parte superior del cuerpo está abierta o cerrada. De forma predeterminada,"CLOSED"
es la adecuada para la mayoría de las prendas (como camisas y suéteres). Para las prendas exteriores, como las chaquetas, establecer este valor en"OPEN"
garantiza que la prenda original de la parte superior del cuerpo de la imagen de origen se conservará con la nueva prenda exterior superpuesta sobre ella. El uso de un valor de"CLOSED"
con una prenda exterior podría no siempre representar la prenda como cerrada. Esto se debe a que un valor de"CLOSED"
solo garantiza que todas las prendas de la parte superior del cuerpo en la imagen de origen serán reemplazadas y, a veces, puede resultar en una capa exterior abierta con una nueva capa inferior visible debajo.-
"CLOSED"
-
"OPEN"
-
Para obtener más información, consulte los parámetros de garmentStyling
en Estructura de la solicitud y la respuesta para la generación de imágenes.
Unión de imágenes
La prueba virtual le permite determinar cómo se unen las imágenes para crear la imagen final. Puede elegir entre "BALANCED"
, "SEAMLESS"
y "DETAILED"
. Cada estilo de combinación adopta un enfoque diferente para unir los elementos y crear la imagen final, cada uno con sus propias ventajas y desventajas.
-
"BALANCED"
: protege los píxeles no enmascarados de la imagen de origen, garantizando que conserven una precisión del 100 % con respecto al original. En algunos casos, habrá un ligero desajuste perceptible de color o textura en la imagen de salida, que se presenta como una especie de imagen “fantasma” con forma de máscara. Lo más probable es que esto ocurra cuando la imagen muestre a una persona de pie sobre un fondo de color sólido o con una textura uniforme. Para evitarlo, puede utilizar el estilo de fusión"SEAMLESS"
en su lugar. -
"SEAMLESS"
: garantiza que en la imagen final nunca se notará una unión entre las áreas de las imágenes enmascaradas y no enmascaradas. La desventaja es que todos los píxeles de la imagen cambian ligeramente y, a veces, los detalles finos disminuyen en las áreas no enmascaradas de la imagen. -
"DETAILED"
: puede mejorar considerablemente los detalles finos, como los logotipos y el texto, especialmente cuando el área enmascarada es relativamente pequeña en comparación con la imagen en general. El modelo logra esto al realizar inpainting en una versión de la imagen original muy recortada y de mayor resolución, que solo incluye la zona enmascarada. A continuación, vuelve a fusionar el resultado con la imagen original. Al igual que con el modo"BALANCED"
, este modo a veces puede resultar en una unión visible.