Bildgenerierung und -bearbeitung
Amazon Nova Canvas ist über das InvokeModel API von Bedrock verfügbar und unterstützt die folgenden Inferenzparameter und Modellantworten bei der Durchführung der Modellinferenz.
Themen
Format für Anfrage und Antwort bei der Bildgenerierung
Wenn Sie einen InvokeModel-Aufruf mit dem Amazon Nova Canvas-Modell durchführen, ersetzen Sie das body-Feld der Anfrage durch das Format, das Ihrem Anwendungsfall entspricht. Alle Aufgaben haben ein gemeinsames imageGenerationConfig-Objekt, aber jede Aufgabe hat ein für diese Aufgabe spezifisches Parameterobjekt. Die folgenden Anwendungsfälle werden unterstützt:
| Aufgabentyp-Wert | Aufgabenparameterfeld | Aufgabenkategorie | Beschreibung |
|---|---|---|---|
TEXT_IMAGE nur mit Text |
textToImageParams |
Generation | Generieren Sie ein Bild mithilfe einer Text-Prompt. |
TEXT_IMAGE mit Bildkonditionierung |
textToImageParams |
Generation | Stellen Sie ein konditionierendes Eingabebild zusammen mit einem Text-Prompt bereit, um ein Bild zu generieren, das dem Layout und der Komposition des konditionierenden Bildes entspricht. |
COLOR_GUIDED_GENERATION |
colorGuidedGenerationParams |
Generation | Bitte geben Sie eine Liste mit Farbwerten im Hexadezimalformat (z. B. #FF9800) zusammen mit einem Text-Prompt und einem optionalen Referenzbild an, um ein Bild zu generieren, das der angegebenen Farbpalette entspricht. |
IMAGE_VARIATION |
imageVariationParams |
Generation | Geben Sie ein oder mehrere Eingabebilder an – mit oder ohne Text-Prompt –, um das generierte Bild zu beeinflussen. Kann verwendet werden, um den visuellen Stil des generierten Bildes zu beeinflussen (bei Verwendung mit einem Text-Prompt), um Variationen eines einzelnen Bildes zu generieren (bei Verwendung ohne Text-Prompt) und für andere kreative Effekte und Kontrollmöglichkeiten. |
INPAINTING |
inPaintingParams |
Bearbeitung | Bearbeiten Sie ein Bild, indem Sie den Bereich innerhalb einer maskierten Region bearbeiten. Kann zum Hinzufügen, Entfernen oder Ersetzen von Bildelementen verwendet werden. |
OUTPAINTING |
outPaintingParams |
Bearbeitung | Bearbeiten Sie ein Bild, indem Sie den Bereich außerhalb einer maskierten Region bearbeiten. Kann verwendet werden, um den Hintergrund hinter einem Motiv zu ersetzen. |
BACKGROUND_REMOVAL |
backgroundRemovalParams |
Bearbeitung | Entfernt automatisch den Hintergrund eines Bilds und ersetzt den Hintergrund durch transparente Pixel. Dies kann nützlich sein, wenn Sie das Bild später mit anderen Elementen in einer Bildbearbeitungsanwendung, einer Präsentation oder einer Website kombinieren möchten. Der Hintergrund kann auch ganz einfach durch benutzerdefinierten Code in eine einfarbige Fläche geändert werden. |
VIRTUAL_TRY_ON |
virtualTryOnParams |
Bearbeitung | Stellen Sie ein Quellbild und ein Referenzbild bereit und überlagern Sie ein Objekt aus dem Referenzbild mit dem Quellbild. Kann verwendet werden, um Kleidung und Accessoires an verschiedenen Models oder in verschiedenen Posen zu visualisieren, den Stil und das Aussehen eines Objekts, Artikels oder Kleidungsstücks zu verändern oder Stile und Designs von einem Objekt auf ein anderes zu übertragen. |
Eingabebilder für die Bilderzeugung
Bei vielen Aufgabentypen müssen ein oder mehrere Eingabebilder in die Anfrage aufgenommen werden. Jedes in der Anfrage verwendete Bild muss als Base64-Zeichenfolge codiert werden. Im Allgemeinen können Bilder im PNG- oder JPEG-Format vorliegen und müssen 8 Bit pro Farbkanal (RGB) aufweisen. PNG-Bilder können einen zusätzlichen Alphakanal enthalten, jedoch darf dieser Kanal keine transparenten oder durchscheinenden Pixel enthalten. Spezifische Informationen zu den unterstützten Abmessungen von Eingabebildern finden Sie unter Unterstützte Bildauflösungen.
Ein Maskenbild ist ein Bild, das den Bereich für Inpainting oder Outpainting angibt. Dieses Bild kann nur rein schwarze und rein weiße Pixel enthalten.
Bei Inpainting-Anfragen wird der Bereich, der schwarz gefärbt ist, Maske genannt und wird geändert werden. Der Rest des Maskenbilds darf nur rein weiße Pixel enthalten. Reinweiße Pixel kennzeichnen den Bereich außerhalb der Maske.
Bei Outpainting-Anfragen wird der Bereich, der weiß eingefärbt ist, vom Modell geändert.
Maskenbilder dürfen keine Pixel enthalten, die nicht rein schwarz oder rein weiß sind. Wenn Sie ein JPEG-Bild als Maske verwenden, muss es mit einer Qualität von 100 % komprimiert werden, um zu vermeiden, dass bei der Komprimierung nicht weiße oder nicht schwarze Pixel entstehen.
Beispiele für die Kodierung oder Dekodierung eines Bildes in eine bzw. aus einer Base64-Zeichenkette finden Sie in den Codebeispielen.
Maskenbilder
Wenn Sie ein Bild bearbeiten, können Sie mit einer Maske die zu bearbeitenden Bereiche definieren. Sie können eine Maske auf eine von drei Arten definieren:
-
maskPrompt– Verfassen Sie einen Text-Prompt in natürlicher Sprache, in der Sie die Teile des Bildes beschreiben, die maskiert werden sollen. -
maskImage– Ein Schwarz-Weiß-Bild, bei dem rein schwarze Pixel den Bereich innerhalb der Maske und rein weiße Pixel den Bereich außerhalb der Maske darstellen.Bei Inpainting-Anfragen werden die schwarzen Pixel je nach Modell geändert. Bei Outpainting-Anfragen werden die weißen Pixel verändert.
-
garmentBasedMask– Eine bildbasierte Maske, die einen zu ersetzenden Bereich definiert, zusammen mit einigen begrenzten Gestaltungsoptionen.
Sie können ein Bildbearbeitungsprogramm verwenden, um Masken zu zeichnen, oder diese mit Ihrem eigenen benutzerdefinierten Code erstellen. Verwenden Sie andernfalls das maskPrompt-Feld, damit das Modell auf die Maske schließen kann.
Unterstützte Bildauflösungen
Für eine Generierungsaufgabe kann jede beliebige Ausgangsauflösung festgelegt werden, sofern die folgenden Anforderungen erfüllt sind:
-
Jede Seite muss zwischen 320 und 4 096 Pixeln (einschließlich) liegen.
-
Jede Seite muss gleichmäßig durch 16 teilbar sein.
-
Das Seitenverhältnis muss zwischen 1:4 und 4:1 liegen. Das heißt, eine Seite darf nicht mehr als viermal so lang sein wie die andere Seite.
-
Die Gesamtpixelzahl muss weniger als 4 194 304 betragen.
Die meisten dieser Einschränkungen gelten auch für Eingabebilder. Die Seiten der Bilder müssen jedoch nicht gleichmäßig durch 16 teilbar sein.