Bildgenerierung und -bearbeitung - Amazon Nova

Bildgenerierung und -bearbeitung

Amazon Nova Canvas ist über das InvokeModel API von Bedrock verfügbar und unterstützt die folgenden Inferenzparameter und Modellantworten bei der Durchführung der Modellinferenz.

Format für Anfrage und Antwort bei der Bildgenerierung

Wenn Sie einen InvokeModel-Aufruf mit dem Amazon Nova Canvas-Modell durchführen, ersetzen Sie das body-Feld der Anfrage durch das Format, das Ihrem Anwendungsfall entspricht. Alle Aufgaben haben ein gemeinsames imageGenerationConfig-Objekt, aber jede Aufgabe hat ein für diese Aufgabe spezifisches Parameterobjekt. Die folgenden Anwendungsfälle werden unterstützt:

Aufgabentyp-Wert Aufgabenparameterfeld Aufgabenkategorie Beschreibung
TEXT_IMAGE nur mit Text textToImageParams Generation Generieren Sie ein Bild mithilfe einer Text-Prompt.
TEXT_IMAGE mit Bildkonditionierung textToImageParams Generation Stellen Sie ein konditionierendes Eingabebild zusammen mit einem Text-Prompt bereit, um ein Bild zu generieren, das dem Layout und der Komposition des konditionierenden Bildes entspricht.
COLOR_GUIDED_GENERATION colorGuidedGenerationParams Generation Bitte geben Sie eine Liste mit Farbwerten im Hexadezimalformat (z. B. #FF9800) zusammen mit einem Text-Prompt und einem optionalen Referenzbild an, um ein Bild zu generieren, das der angegebenen Farbpalette entspricht.
IMAGE_VARIATION imageVariationParams Generation Geben Sie ein oder mehrere Eingabebilder an – mit oder ohne Text-Prompt –, um das generierte Bild zu beeinflussen. Kann verwendet werden, um den visuellen Stil des generierten Bildes zu beeinflussen (bei Verwendung mit einem Text-Prompt), um Variationen eines einzelnen Bildes zu generieren (bei Verwendung ohne Text-Prompt) und für andere kreative Effekte und Kontrollmöglichkeiten.
INPAINTING inPaintingParams Bearbeitung Bearbeiten Sie ein Bild, indem Sie den Bereich innerhalb einer maskierten Region bearbeiten. Kann zum Hinzufügen, Entfernen oder Ersetzen von Bildelementen verwendet werden.
OUTPAINTING outPaintingParams Bearbeitung Bearbeiten Sie ein Bild, indem Sie den Bereich außerhalb einer maskierten Region bearbeiten. Kann verwendet werden, um den Hintergrund hinter einem Motiv zu ersetzen.
BACKGROUND_REMOVAL backgroundRemovalParams Bearbeitung Entfernt automatisch den Hintergrund eines Bilds und ersetzt den Hintergrund durch transparente Pixel. Dies kann nützlich sein, wenn Sie das Bild später mit anderen Elementen in einer Bildbearbeitungsanwendung, einer Präsentation oder einer Website kombinieren möchten. Der Hintergrund kann auch ganz einfach durch benutzerdefinierten Code in eine einfarbige Fläche geändert werden.
VIRTUAL_TRY_ON virtualTryOnParams Bearbeitung Stellen Sie ein Quellbild und ein Referenzbild bereit und überlagern Sie ein Objekt aus dem Referenzbild mit dem Quellbild. Kann verwendet werden, um Kleidung und Accessoires an verschiedenen Models oder in verschiedenen Posen zu visualisieren, den Stil und das Aussehen eines Objekts, Artikels oder Kleidungsstücks zu verändern oder Stile und Designs von einem Objekt auf ein anderes zu übertragen.

Eingabebilder für die Bilderzeugung

Bei vielen Aufgabentypen müssen ein oder mehrere Eingabebilder in die Anfrage aufgenommen werden. Jedes in der Anfrage verwendete Bild muss als Base64-Zeichenfolge codiert werden. Im Allgemeinen können Bilder im PNG- oder JPEG-Format vorliegen und müssen 8 Bit pro Farbkanal (RGB) aufweisen. PNG-Bilder können einen zusätzlichen Alphakanal enthalten, jedoch darf dieser Kanal keine transparenten oder durchscheinenden Pixel enthalten. Spezifische Informationen zu den unterstützten Abmessungen von Eingabebildern finden Sie unter Unterstützte Bildauflösungen.

Ein Maskenbild ist ein Bild, das den Bereich für Inpainting oder Outpainting angibt. Dieses Bild kann nur rein schwarze und rein weiße Pixel enthalten.

Bei Inpainting-Anfragen wird der Bereich, der schwarz gefärbt ist, Maske genannt und wird geändert werden. Der Rest des Maskenbilds darf nur rein weiße Pixel enthalten. Reinweiße Pixel kennzeichnen den Bereich außerhalb der Maske.

Bei Outpainting-Anfragen wird der Bereich, der weiß eingefärbt ist, vom Modell geändert.

Maskenbilder dürfen keine Pixel enthalten, die nicht rein schwarz oder rein weiß sind. Wenn Sie ein JPEG-Bild als Maske verwenden, muss es mit einer Qualität von 100 % komprimiert werden, um zu vermeiden, dass bei der Komprimierung nicht weiße oder nicht schwarze Pixel entstehen.

Beispiele für die Kodierung oder Dekodierung eines Bildes in eine bzw. aus einer Base64-Zeichenkette finden Sie in den Codebeispielen.

Maskenbilder

Wenn Sie ein Bild bearbeiten, können Sie mit einer Maske die zu bearbeitenden Bereiche definieren. Sie können eine Maske auf eine von drei Arten definieren:

  • maskPrompt – Verfassen Sie einen Text-Prompt in natürlicher Sprache, in der Sie die Teile des Bildes beschreiben, die maskiert werden sollen.

  • maskImage – Ein Schwarz-Weiß-Bild, bei dem rein schwarze Pixel den Bereich innerhalb der Maske und rein weiße Pixel den Bereich außerhalb der Maske darstellen.

    Bei Inpainting-Anfragen werden die schwarzen Pixel je nach Modell geändert. Bei Outpainting-Anfragen werden die weißen Pixel verändert.

  • garmentBasedMask – Eine bildbasierte Maske, die einen zu ersetzenden Bereich definiert, zusammen mit einigen begrenzten Gestaltungsoptionen.

Sie können ein Bildbearbeitungsprogramm verwenden, um Masken zu zeichnen, oder diese mit Ihrem eigenen benutzerdefinierten Code erstellen. Verwenden Sie andernfalls das maskPrompt-Feld, damit das Modell auf die Maske schließen kann.

Unterstützte Bildauflösungen

Für eine Generierungsaufgabe kann jede beliebige Ausgangsauflösung festgelegt werden, sofern die folgenden Anforderungen erfüllt sind:

  • Jede Seite muss zwischen 320 und 4 096 Pixeln (einschließlich) liegen.

  • Jede Seite muss gleichmäßig durch 16 teilbar sein.

  • Das Seitenverhältnis muss zwischen 1:4 und 4:1 liegen. Das heißt, eine Seite darf nicht mehr als viermal so lang sein wie die andere Seite.

  • Die Gesamtpixelzahl muss weniger als 4 194 304 betragen.

Die meisten dieser Einschränkungen gelten auch für Eingabebilder. Die Seiten der Bilder müssen jedoch nicht gleichmäßig durch 16 teilbar sein.