Virtuelles Anprobieren - Amazon Nova

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Virtuelles Anprobieren

Beim virtuellen Anprobieren handelt es sich um einen bildgesteuerten Anwendungsfall von Inpainting, bei dem der Inhalt eines Referenzbildes auf der Grundlage eines Maskenbildes einem Quellbild überlagert wird. Amazon Nova Canvas wurde für Kleidungsstücke, Accessoires, Möbel und ähnliche Objekte optimiert. Das Modell lässt sich auch gut auf andere Fälle verallgemeinern, z. B. das Hinzufügen eines Logos oder Textes zu einem Bild.

Mit der virtuellen Anprobe-API können Sie bis zu fünf Bilder generieren. Standardmäßig wird nur ein Bild generiert.

Um eine virtuelle Anprobe durchzuführen, müssen Sie drei Bilder bereitstellen:

  • Quellbild — Das Originalbild, das Sie ändern möchten. Dies kann beispielsweise ein Bild, eine Person oder eine Raumszene sein.

  • Referenzbild — Das Bild, das den Artikel, das Objekt oder den Artikel enthält, den Sie in das Quellbild einfügen möchten. Dies kann beispielsweise eine Jacke, eine Schüssel oder ein Sofa enthalten. Bei Kleidungsstücken kann das Referenzbild Kleidungsstücke an oder ohne Körper und mehrere Produkte enthalten, die unterschiedliche Outfitkomponenten repräsentieren (z. B. Hemden, Hosen und Schuhe in einem einzigen Bild).

  • Maskenbild — Das Bild, das definiert, welchen Teil der Quelle Sie ändern möchten. Ein Maskenbild ist ein Schwarzweißbild, das verwendet wird, um zu definieren, welcher Teil des Quellbilds geändert werden soll. Schwarze Pixel geben den Bereich des Quellbilds an, der geändert werden soll, während weiße Pixel Bereiche des Bildes angeben, die beibehalten werden sollen. Sie können entweder Ihr eigenes Maskenbild angeben oder das Modell anhand anderer von Ihnen eingegebener Eingabeparameter eines für Sie erstellen lassen.

    Das Maskenbild kann als Teil der Ausgabe zurückgegeben werden, sofern angegeben.

Hier sind einige Beispiele dafür, wie das Modell funktioniert.

Upper body clothing

Die folgenden Bilder zeigen ein Beispiel dafür, wie Amazon Nova ein Modell mit einem Kleidungsstück für den Oberkörper überlagert.

Quellbild

Referenzbild

Output

Ein Mann mit Sonnenbrille, schaut nach links und trägt ein blaues Hemd.
Ein rosarotes Button-Down-Hemd.
Ein Gemeiner, der eine Sonnenbrille trägt, nach links schaut und ein rosarotes Button-Down-Hemd trägt.
Couch in a room

Die folgenden Bilder zeigen ein Beispiel dafür, wie Amazon Nova eine Couch in einen Möbelraum legt.

Quellbild

Referenzbild

Output

Eine moderne graue Couch aus der Mitte des Jahrhunderts in einem Raum, der von anderen Dekorationen umgeben ist.
Eine orangefarbene Couch vor weißem Hintergrund.
Eine orangefarbene Couch in einem Raum, umgeben von anderen Dekorationen.

Im Gegensatz zu anderen Amazon Nova Canvas-Aufgabentypen unterstützt die virtuelle Anprobe keine Textaufforderung oder negative Textaufforderung.

Definieren Sie das Maskenbild

Sie können entweder direkt ein Maskenbild bereitstellen, indem Sie es spezifizieren, maskType: "IMAGE" oder es dem Modell ermöglichen, es mithilfe von Hilfseingaben wie maskType: "GARMENT" oder automatisch zu berechnenmaskType: "PROMPT".

Wenn ein Maskentyp von angegeben "GARMENT" ist, erstellt Amazon Nova Canvas auf der Grundlage eines von Ihnen angegebenen garmentClass Eingabeparameterwerts eine Maske, die Kleidungsstücke berücksichtigt. In den meisten Fällen können Sie eine der folgenden hochwertigen Bekleidungsklassen verwenden:

  • "UPPER_BODY"- Erzeugt eine Maske, die die gesamte Armlänge umfasst.

  • "LOWER_BODY"- Erzeugt eine Maske, die die gesamte Beinlänge ohne Lücke zwischen den Beinen umfasst.

  • "FOOTWEAR"- Erzeugt eine Maske, die dem im Quellbild gezeigten Schuhprofil entspricht.

  • "FULL_BODY"- Erzeugt eine Maske, die der Kombination von "UPPER_BODY" und entspricht"LOWER_BODY".

Sie können den "PROMPT" Maskentyp verwenden, um das Element im Quellbild, das Sie ersetzen möchten, in natürlicher Sprache zu beschreiben. Dies ist nützlich für Szenarien, bei denen es sich nicht um Kleidungsstücke handelt. Diese Funktion verwendet dieselbe automatische Maskierungsfunktion, die im "INPAINTING" Aufgabentyp über den Parameter vorhanden ist. maskPrompt

Warnung

Masken, die mit diesem "PROMPT" Maskentyp erstellt wurden, haften eng an der Form des Objekts, das Sie beschreiben. Dies kann in vielen Szenarien problematisch sein, da das Produkt, das Sie hinzufügen, möglicherweise nicht dieselbe Silhouette oder Größe wie der Artikel hat, den Sie ersetzen. Aus diesem Grund bietet die virtuelle Anprobier-API auch einen optionalen maskShape Parameter, auf den eingestellt werden kann. "BOUNDING_BOX" Wir empfehlen, diese Einstellung (die Standardeinstellung) in den meisten Fällen zu verwenden, wenn Sie den "PROMPT" Maskentyp verwenden.

Generieren neuer Posen, Hände oder Gesichter

Sie können das Modell anweisen, die Pose, die Hände oder das Gesicht der Person im Quellbild beizubehalten oder zu regenerieren. Wenn Sie sich dafür entscheiden, diese Elemente beizubehalten, werden sie automatisch aus dem Maskenbild entfernt, unabhängig davon, welche maskType Sie ausgewählt haben.

In den folgenden Situationen möchten Sie möglicherweise Pose, Hände oder Gesicht beibehalten:

  • Sie entwickeln eine Anwendung, mit der Endbenutzer ihre eigenen Masken zeichnen können. Durch die Beibehaltung dieser Merkmale wird verhindert, dass Endbenutzer versehentlich Hände oder Gesicht in die Maske einbauen.

  • Sie verwenden Hände oder Gesichter, möchten maskShape: BOUNDING_BOX aber keine neuen erstellen. Mit preserveFace: ON oder preserveHands: ON werden diese Merkmale automatisch aus der Maske entfernt.

  • Sie verwenden maskType:GARMENT und maskShape: BOUNDING_BOX mit einem Modell, das sich nicht in einer aufrechten Körperhaltung befindet. In diesem Fall kann die Bounding-Box-Maske das Gesicht überlappen und wir empfehlen die Verwendung. preserveFace: ON

Umgekehrt möchten Sie in den folgenden Situationen möglicherweise die Pose, die Hände oder das Gesicht regenerieren:

  • Bei Kleidungsstücken, die den Hals bedecken, preserveFace: ON kann ein ausreichender Teil des Halses weggelassen werden, was sich negativ auf die Leistung auswirkt.

  • Wenn das Model Schuhe mit hohen Absätzen trägt und das Referenzbild Schuhe mit flachen Absätzen zeigt oder umgekehrt. In diesem Fall führt die Beibehaltung der Körperhaltung zu unnatürlich aussehenden Ergebnissen.

  • Ähnlich wie beim vorherigen Punkt kann das Generieren neuer Posen oder Hände beim Anprobieren von Handtaschen oder anderen Accessoires zu natürlicheren Ergebnissen führen.

Hinweise zum Styling

Mit diesem garmentStyling Parameter können Sie bestimmte Stilelemente für Kleidungsstücke, die Sie möglicherweise bei einem Fotoshooting finden, beibehalten oder ändern. Amazon Nova Canvas kann beispielsweise das Design eines Hemdes so ändern, dass die Ärmel entweder hoch- oder heruntergekrempelt werden, oder es kann das Hemd so modifizieren, dass es eingesteckt wird oder nicht. Verfügbar sind die nachfolgend aufgeführten Optionen:

  • "longSleeveStyle"- Steuert, ob die Ärmel eines Langarmhemdes hoch- oder heruntergekrempelt werden.

    • "SLEEVE_DOWN"- Kann angewendet werden, wenn das Quellbild ein Langarmhemd (Ärmel hoch oder runter), ein Kurzarmhemd oder ein Hemd ohne Ärmel trägt.

    • "SLEEVE_UP"- Kann angewendet werden, wenn das Quellbild ein Langarmhemd mit hochgezogenen Ärmeln, ein Kurzarmhemd oder ein Hemd ohne Ärmel trägt.

  • "tuckingStyle"- Steuert, ob ein Kleidungsstück für den Oberkörper eng oder locker aussieht.

    • "UNTUCKED"- Kann unabhängig davon angewendet werden, ob das Hemd auf dem Quellbild eingesteckt oder nicht eingesteckt ist.

    • "TUCKED"- Kann angewendet werden, wenn auf dem Quellbild das Hemd eingesteckt ist.

  • "outerLayerStyle"- Steuert, ob ein Oberkörperkleidungsstück offen oder geschlossen gestylt wird. Dies ist standardmäßig "CLOSED" das, was für die meisten Kleidungsstücke (wie Hemden und Pullover) geeignet ist. Wenn Sie diesen Wert für Oberbekleidung wie Jacken auf festlegen, wird "OPEN" garantiert, dass das ursprüngliche Oberkörperbekleidungsstück aus dem Quellbild beibehalten wird und das neue Oberbekleidungsstück darüber geschichtet wird. Wenn Sie den Wert für ein "CLOSED" Oberbekleidungsstück verwenden, ist das Kleidungsstück möglicherweise nicht immer geschlossen. Das liegt daran, dass der Wert „"CLOSED"nur“ garantiert, dass jedes Oberkörper-Kleidungsstück im Quellbild ersetzt wird. Dies kann manchmal dazu führen, dass die äußere Schicht geöffnet ist und darunter eine neue Unterschicht sichtbar ist.

    • "CLOSED"

    • "OPEN"

Weitere Informationen finden Sie in Anfrage- und Antwortstruktur für die Bildgenerierung den garmentStyling Parametern unter.

Zusammenfügen von Bildern

Mit der virtuellen Anprobe können Sie bestimmen, wie Bilder zusammengefügt werden, um das endgültige Bild zu erstellen. Sie können zwischen"BALANCED", "SEAMLESS" und wählen. "DETAILED" Jeder Zusammenführungsstil verfolgt einen anderen Ansatz, wenn es darum geht, wie die Elemente zusammengefügt werden, um das endgültige Bild zu erstellen. Jeder Stil hat seine eigenen Vor- und Nachteile.

  • "BALANCED"- Schützt alle nicht maskierten Pixel im Originalbild und stellt sicher, dass sie dem Original zu 100% entsprechen. In einigen Fällen kann es zu einer leichten Farb- oder Texturabweichung im Ausgabebild kommen, die als eine Art „Geisterbild“ der Maskenform dargestellt wird. Dies ist am wahrscheinlichsten, wenn auf dem Bild eine Person vor einem einfarbigen oder gleichmäßig strukturierten Hintergrund steht. Um dies zu vermeiden, können Sie stattdessen den Stil „"SEAMLESS"Zusammenführen“ verwenden.

  • "SEAMLESS"- Stellt sicher, dass im endgültigen Bild niemals eine sichtbare Naht zwischen den maskierten und den nicht maskierten Bildbereichen entsteht. Der Kompromiss besteht darin, dass sich alle Pixel im Bild geringfügig ändern und manchmal feinkörnige Details in den nicht maskierten Bereichen des Bildes verringert werden.

  • "DETAILED"- Kann feinkörnige Details wie Logos und Text erheblich verbessern, insbesondere wenn der maskierte Bereich im Vergleich zum Gesamtbild relativ klein ist. Das Modell erreicht dies, indem es eine eng beschnittene Version des Originalbilds mit höherer Auflösung einfügt, die nur den maskierten Bereich enthält. Anschließend wird das Ergebnis wieder mit dem Originalbild zusammengeführt. Wie "BALANCED" im Modus „Benutzen“ kann auch dieser Modus manchmal zu einer sichtbaren Naht führen.