Anfrage- und Antwortstruktur für die Bildgenerierung - Amazon Nova

Anfrage- und Antwortstruktur für die Bildgenerierung

Bildgenerierung

In den folgenden Beispielen werden verschiedene Anwendungsfälle für die Bildgenerierung vorgestellt. Jedes Beispiel enthält eine Erläuterung der Felder, die für die Bildgenerierung verwendet werden.

Text-to-image request
{ "taskType": "TEXT_IMAGE", "textToImageParams": { "text": string, "negativeText": string, "style": "3D_ANIMATED_FAMILY_FILM" | "DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" | "GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" | "MIDCENTURY_RETRO" | "PHOTOREALISM" | "SOFT_DIGITAL_PAINTING" }, "imageGenerationConfig": { "width": int, "height": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int, "numberOfImages": int } }

Die folgenden textToImageParams-Felder werden in dieser Anfrage verwendet:

  • text (Erforderlich): Ein Text-Prompt zum Generieren des Bildes. Der Prompt muss zwischen 1 und 1 024 Zeichen lang sein.

  • negativeText (Optional): Ein Text-Prompt, um festzulegen, was nicht in das Bild aufgenommen werden soll. Der Wert muss 1-1 024 Zeichen lang sein.

  • style (Optional) – Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.

Anmerkung

Vermeiden Sie es, negierende Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text- und negativeText-Werten zu verwenden. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text-Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText-Feld aufzunehmen.

Text-to-image request with image conditioning
{ "taskType": "TEXT_IMAGE", "textToImageParams": { "conditionImage": string (Base64 encoded image), "controlMode": "CANNY_EDGE" | "SEGMENTATION", "controlStrength": float, "text": string, "negativeText": string, "style": "3D_ANIMATED_FAMILY_FILM" | "DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" | "GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" | "MIDCENTURY_RETRO" | "PHOTOREALISM" | "SOFT_DIGITAL_PAINTING" }, "imageGenerationConfig": { "width": int, "height": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int, "numberOfImages": int } }

Die folgenden textToImageParams-Felder werden in dieser Anfrage verwendet:

  • conditionImage (Erforderlich) – Ein JPEG- oder PNG-Bild, welches das Layout und die Zusammensetzung des generierten Bilds bestimmt. Das Bild muss als Base64-Zeichenfolge formatiert sein. Siehe Eingabebilder für die Bilderzeugung für zusätzliche Anforderungen.

  • controlMode (Optional) – Gibt an, welcher Konditionierungsmodus verwendet werden soll. Der Standardwert ist „CANNY_EDGE“.

    • CANNY_EDGE – Die Elemente des generierten Bildes folgen genau den markanten Konturen oder „Edges“ des Konditionierungsbildes.

    • SEGMENTATION – Das Konditionierungsbild wird automatisch analysiert, um auffällige Formen im Inhalt zu identifizieren. Diese Analyse führt zu einer Segmentierungsmaske, welche die Generierung steuert, sodass ein Bild entsteht, das sich eng an das Layout des Konditionierungsbildes anlehnt, dem Modell jedoch mehr Freiheit innerhalb der Grenzen jedes Inhaltsbereichs gewährt.

  • controlStrength (Optional) – Gibt an, wie ähnlich das Layout und die Zusammensetzung des generierten Bildes dem conditionImage sein sollen. Der Bereich liegt zwischen 0 und 1,0. Niedrigere Werte führen zu mehr Zufälligkeit. Der Standardwert lautet 0.7.

  • text (Erforderlich): Ein Text-Prompt zum Generieren des Bildes. Der Prompt muss zwischen 1 und 1 024 Zeichen lang sein.

  • negativeText (Optional): Ein Text-Prompt, um festzulegen, was nicht in das Bild aufgenommen werden soll. Der Wert muss 1-1 024 Zeichen lang sein.

  • style (Optional) – Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.

Anmerkung

Vermeiden Sie es, negierende Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text- und negativeText-Werten zu verwenden. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text-Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText-Feld aufzunehmen.

Color guided image generation request
{ "taskType": "COLOR_GUIDED_GENERATION", "colorGuidedGenerationParams": { "colors": string[] (list of hexadecimal color values), "referenceImage": string (Base64 encoded image), "text": string, "negativeText": string }, "imageGenerationConfig": { "width": int, "height": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int, "numberOfImages": int } }

Die folgenden colorGuidedGenerationParams-Felder werden in dieser Anfrage verwendet:

  • colors (Erforderlich) – Eine Liste mit bis zu 10 Farbcodes, welche die gewünschte Farbpalette für Ihr Bild definieren. Ausgedrückt als Hexadezimalwerte in der Form „#RRGGBB“. Zum Beispiel ist „#00FF00“ rein grün und „#FCF2AB“ ein warmes Gelb. Die colors-Liste hat die stärkste Wirkung, wenn kein referenceImage angegeben wird. Andernfalls werden sowohl die Farben in der Liste als auch die Farben aus dem Referenzbild in der endgültigen Ausgabe verwendet.

  • referenceImage (Optional) – Ein JPEG- oder PNG-Bild, das als Motiv- und Stilreferenz verwendet werden soll. Die Farben des Bildes werden zusammen mit den Farben aus der colors-Liste ebenfalls in die endgültige Ausgabe übernommen. Siehe Eingabebilder für die Bilderzeugung für zusätzliche Anforderungen.

  • text (Erforderlich): Ein Text-Prompt zum Generieren des Bildes. Der Prompt muss zwischen 1 und 1 024 Zeichen lang sein.

  • negativeText (Optional): Ein Text-Prompt, um festzulegen, was nicht in das Bild aufgenommen werden soll. Der Wert muss 1-1 024 Zeichen lang sein.

Anmerkung

Vermeiden Sie es, negierende Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text- und negativeText-Werten zu verwenden. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text-Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText-Feld aufzunehmen.

Image variation request
{ "taskType": "IMAGE_VARIATION", "imageVariationParams": { "images": string[] (list of Base64 encoded images), "similarityStrength": float, "text": string, "negativeText": string }, "imageGenerationConfig": { "height": int, "width": int, "cfgScale": float, "seed": int, "numberOfImages": int } }

Die folgenden imageVariationParams-Felder werden in dieser Anfrage verwendet:

  • images (Erforderlich) – Eine Liste mit 1–5 Bildern, die als Referenz verwendet werden können. Jedes muss im JPEG- oder PNG-Format vorliegen und als Base64-Zeichenfolgen kodiert sein. Siehe Eingabebilder für die Bilderzeugung für zusätzliche Anforderungen.

  • similarityStrength (Optional) – Gibt an, inwiefern das generierte Bild den Eingabebildern ähneln soll. Gültige Werte liegen zwischen 0,2 und 1,0, wobei niedrigere Werte für mehr Zufälligkeit verwendet werden.

  • text (Erforderlich): Ein Text-Prompt zum Generieren des Bildes. Der Prompt muss zwischen 1 und 1 024 Zeichen lang sein. Wenn Sie dieses Feld auslassen, entfernt das Modell Elemente innerhalb des maskierten Bereichs. Sie werden durch eine nahtlose Erweiterung des Bildhintergrunds ersetzt.

  • negativeText (Optional): Ein Text-Prompt, um festzulegen, was nicht in das Bild aufgenommen werden soll. Der Wert muss 1-1 024 Zeichen lang sein.

Anmerkung

Vermeiden Sie es, negierende Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text- und negativeText-Werten zu verwenden. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text-Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText-Feld aufzunehmen.

Bildbearbeitung

In den folgenden Beispielen werden verschiedene Anwendungsfälle für die Bildbearbeitung vorgestellt. Jedes Beispiel enthält eine Erläuterung der Felder, die für die Bildbearbeitung verwendet werden.

Inpainting request
{ "taskType": "INPAINTING", "inPaintingParams": { "image": string (Base64 encoded image), "maskPrompt": string, "maskImage": string (Base64 encoded image), "text": string, "negativeText": string }, "imageGenerationConfig": { "numberOfImages": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int } }

Die folgenden inPaintingParams-Felder werden in dieser Anfrage verwendet:

  • image (Erforderlich) – Die JPEG- oder PNG-Datei, die Sie ändern möchten, formatiert als Base64-Zeichenfolge. Siehe Eingabebilder für die Bilderzeugung für zusätzliche Anforderungen.

  • maskPrompt oder maskImage (Erforderlich) – Sie müssen entweder den maskPrompt- oder den maskImage-Parameter angeben, aber nicht beide.

    Der maskPrompt ist ein Text-Prompt in natürlicher Sprache, der die Bereiche des Bildes beschreibt, die bearbeitet werden sollen.

    Das maskImage ist ein Bild, das die Bereiche des Bildes definiert, die bearbeitet werden sollen. Das Maskenbild muss dieselbe Größe wie das Eingabebild haben. Zu bearbeitende Bereiche sind rein schwarz schattiert und Bereiche, die ignoriert werden sollen, sind rein weiß schattiert. Im Maskenbild sind keine anderen Farben zulässig.

    Beachten Sie, dass die Anforderungen an das In- und Outpainting in Bezug auf die Farbanforderungen der Maskenbilder entgegengesetzt sind.

  • text (Erforderlich) – Ein Text-Prompt, der beschriebt, was innerhalb des maskierten Bereichs generiert werden soll. Der Prompt muss zwischen 1 und 1 024 Zeichen lang sein. Wenn Sie dieses Feld auslassen, entfernt das Modell Elemente innerhalb des maskierten Bereichs. Sie werden durch eine nahtlose Erweiterung des Bildhintergrunds ersetzt.

  • negativeText (Optional): Ein Text-Prompt, um festzulegen, was nicht in das Bild aufgenommen werden soll. Der Wert muss 1-1 024 Zeichen lang sein.

Anmerkung

Vermeiden Sie es, negierende Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text- und negativeText-Werten zu verwenden. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text-Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText-Feld aufzunehmen.

Outpainting request
{ "taskType": "OUTPAINTING", "outPaintingParams": { "image": string (Base64 encoded image), "maskPrompt": string, "maskImage": string (Base64 encoded image), "outPaintingMode": "DEFAULT" | "PRECISE", "text": string, "negativeText": string }, "imageGenerationConfig": { "numberOfImages": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int } }

Die folgenden outPaintingParams-Felder werden in dieser Anfrage verwendet:

  • image (Erforderlich) – Die JPEG- oder PNG-Datei, die Sie ändern möchten, formatiert als Base64-Zeichenfolge. Siehe Eingabebilder für die Bilderzeugung für zusätzliche Anforderungen.

  • maskPrompt oder maskImage (Erforderlich) – Sie müssen entweder den maskPrompt- oder den maskImage-Parameter angeben, aber nicht beide.

    Der maskPrompt ist ein Text-Prompt in natürlicher Sprache, der die Bereiche des Bildes beschreibt, die bearbeitet werden sollen.

    Das maskImage ist ein Bild, das die Bereiche des Bildes definiert, die bearbeitet werden sollen. Das Maskenbild muss dieselbe Größe wie das Eingabebild haben. Zu bearbeitende Bereiche sind rein schwarz schattiert und Bereiche, die ignoriert werden sollen, sind rein weiß schattiert. Im Maskenbild sind keine anderen Farben zulässig.

    Beachten Sie, dass die Anforderungen an das In- und Outpainting in Bezug auf die Farbanforderungen der Maskenbilder entgegengesetzt sind.

  • outPaintingMode – Legt fest, wie die von Ihnen bereitgestellte Maske interpretiert wird.

    Verwenden Sie DEFAULT für einen reibungslosen Übergang zwischen dem maskierten Bereich und dem nicht maskierten Bereich. Einige der ursprünglichen Pixel werden als Ausgangspunkt für den neuen Hintergrund verwendet. Dieser Modus ist generell besser, wenn Sie möchten, dass der neue Hintergrund ähnliche Farben wie der ursprüngliche Hintergrund verwendet. Sie können jedoch einen Halo-Effekt erzielen, wenn Ihr Prompt einen neuen Hintergrund erfordert, der sich erheblich vom ursprünglichen Hintergrund unterscheidet.

    Verwenden Sie PRECISE, um die Maskengrenzen strikt einzuhalten. Dieser Modus ist generell besser, wenn Sie wesentliche Änderungen am Hintergrund vornehmen.

  • text (Erforderlich) – Ein Text-Prompt, der beschriebt, was innerhalb des maskierten Bereichs generiert werden soll. Der Prompt muss zwischen 1 und 1 024 Zeichen lang sein. Wenn Sie dieses Feld auslassen, entfernt das Modell Elemente innerhalb des maskierten Bereichs. Sie werden durch eine nahtlose Erweiterung des Bildhintergrunds ersetzt.

  • negativeText (Optional): Ein Text-Prompt, um festzulegen, was nicht in das Bild aufgenommen werden soll. Der Wert muss 1-1 024 Zeichen lang sein.

Anmerkung

Vermeiden Sie es, negierende Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text- und negativeText-Werten zu verwenden. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text-Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText-Feld aufzunehmen.

Background removal request
{ "taskType": "BACKGROUND_REMOVAL", "backgroundRemovalParams": { "image": string (Base64 encoded image) } }

Das folgende backgroundRemovalParams-Feld wird in dieser Anfrage verwendet:

  • image (Erforderlich) – Die JPEG- oder PNG-Datei, die Sie ändern möchten, formatiert als Base64-Zeichenfolge. Siehe Eingabebilder für die Bilderzeugung für zusätzliche Anforderungen.

Die BACKGROUND_REMOVAL-Aufgabe gibt ein PNG-Bild mit voller 8-Bit-Transparenz zurück. Dieses Format ermöglicht eine reibungslose, saubere Isolierung der Vordergrundobjekte und erleichtert die Zusammenführung des Bildes mit anderen Elementen in einer Bildbearbeitungsanwendung, einer Präsentation oder einer Website. Der Hintergrund kann mit einem einfachen benutzerdefinierten Code leicht in eine einfarbige Fläche geändert werden.

Virtual try-on
{ "taskType": "VIRTUAL_TRY_ON", "virtualTryOnParams": { "sourceImage": string (Base64 encoded image), "referenceImage": string (Base64 encoded image), "maskType": "IMAGE" | "GARMENT" | "PROMPT", "imageBasedMask":{ "maskImage": string (Base64 encoded image), }, "garmentBasedMask":{ "maskShape": "CONTOUR" | "BOUNDING_BOX" | "DEFAULT", "garmentClass": "UPPER_BODY" | "LOWER_BODY" | "FULL_BODY" | "FOOTWEAR" | "LONG_SLEEVE_SHIRT" | "SHORT_SLEEVE_SHIRT" | "NO_SLEEVE_SHIRT" | "OTHER_UPPER_BODY" | "LONG_PANTS" | "SHORT_PANTS" | "OTHER_LOWER_BODY" | "LONG_DRESS" | "SHORT_DRESS" | "FULL_BODY_OUTFIT" | "OTHER_FULL_BODY" | "SHOES" | "BOOTS" | "OTHER_FOOTWEAR", "garmentStyling":{ "longSleeveStyle": "SLEEVE_DOWN" | "SLEEVE_UP", "tuckingStyle": "UNTUCKED" | "TUCKED", "outerLayerStyle": "CLOSED" | "OPEN", } }, "promptBasedMask":{ "maskShape": "BOUNDING_BOX" | "CONTOUR" | "DEFAULT", "maskPrompt": string, }, "maskExclusions": { "preserveBodyPose": "ON" | "OFF" | "DEFAULT", "preserveHands": "ON" | "OFF" | "DEFAULT", "preserveFace": "OFF" | "ON" | "DEFAULT" }, "mergeStyle" : "BALANCED" | "SEAMLESS" | "DETAILED" , "returnMask": boolean, }, "imageGenerationConfig": { "numberOfImages": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int } }

Die folgenden virtualTryOnParams-Felder werden in dieser Anfrage verwendet:

  • sourceImage (Erforderlich) – Die JPEG- oder PNG-Datei, die Sie ändern möchten, formatiert als Base64-Zeichenfolge. Siehe Eingabebilder für die Bilderzeugung für zusätzliche Anforderungen.

  • referenceImage (Erforderlich) – Die JPEG- oder PNG-Datei, die das Objekt enthält, das Sie dem Quellbild überlagern möchten, formatiert als Base64-Zeichenfolge. Siehe Eingabebilder für die Bilderzeugung für zusätzliche Anforderungen.

  • maskType (Erforderlich) – Gibt an, ob die Maske als Bild, Prompt oder Kleidungsmaske bereitgestellt wird.

  • imageBasedMask – Erforderlich, wenn maskType als "IMAGE" angegeben ist.

    Das maskImage ist ein Bild, das die Bereiche des Bildes definiert, die bearbeitet werden sollen. Das Maskenbild muss dieselbe Größe wie das Eingabebild haben. Zu bearbeitende Bereiche sind rein schwarz schattiert und Bereiche, die ignoriert werden sollen, sind rein weiß schattiert. Im Maskenbild sind keine anderen Farben zulässig.

  • garmentBasedMask – Erforderlich, wenn maskType als "GARMENT" angegeben ist.

    • maskShape (Optional) – Definiert die Form des Maskenbegrenzungsrahmens. Die Form und Größe des Begrenzungsrahmens können sich darauf auswirken, wie das Referenzbild auf das Quellbild übertragen wird.

    • garmentClass (Erforderlich) – Definiert das Kleidungsstück, das übertragen wird. Dieser Parameter ermöglicht es dem Modell, sich auf bestimmte Teile des Referenzbilds zu konzentrieren, die Sie übertragen möchten.

    • garmentStyling (Optional) – Stellt dem Modell Stilmerkmale für bestimmte Kleidungsstücke bereit. Die Parameter longSleeveStyle und tuckingStyle gelten ausschließlich für Kleidung für den Oberkörper. Der Parameter outerLayerStyle gilt ausschließlich für die äußere Lage der Oberkörperbekleidung.

  • promptBasedMask (Erforderlich) – Erforderlich, wenn maskType "PROMPT" ist.

    • maskShape (Optional) – Definiert die Form des Maskenbegrenzungsrahmens. Die Form und Größe des Begrenzungsrahmens können sich darauf auswirken, wie das Referenzbild auf das Quellbild übertragen wird.

    • maskPrompt (Erforderlich) – Ein Text-Prompt in natürlicher Sprache, der die Bereiche des Bildes beschreibt, die bearbeitet werden sollen.

  • maskExclusions (Optional) – Wenn eine Person im Quellbild erkannt wird, bestimmen diese Parameter, ob ihre Körperhaltung, Hände und ihr Gesicht im Ausgabebild beibehalten oder neu generiert werden sollen.

  • mergeStyle (Optional) – Legt fest, wie die Quell- und Referenzbilder miteinander verbunden werden. Jeder Zusammenführungsstil verfolgt einen anderen Ansatz, wie die Elemente zu einem endgültigen Bild zusammengefügt werden, wobei jeder Stil seine eigenen Vorteile und Nachteile aufweist.

    • "BALANCED" – Schützt alle nicht maskierten Pixel im Originalbild und stellt sicher, dass sie dem Original zu 100 % entsprechen. In bestimmten Fällen kann es zu einer geringfügigen Abweichung in der Farbe oder Textur des Ausgabebildes kommen, die sich als eine Art „Geisterbild“ der Maskenform darstellt. Dies tritt am wahrscheinlichsten auf, wenn die Person auf einem einfarbigen oder gleichmäßig strukturierten Hintergrund abgebildet ist. Um dies zu vermeiden, können Sie stattdessen den "SEAMLESS"-Stil verwenden.

    • "SEAMLESS" – Stellt sicher, dass im endgültigen Bild keine sichtbare Nahtstelle zwischen den maskierten und nicht maskierten Bildbereichen vorhanden ist. Der Nachteil besteht darin, dass in diesem Modus alle Pixel im Bild leicht verändert werden, was manchmal zu einem Verlust feiner Details in den nicht maskierten Bereichen des Bildes führen kann.

    • "DETAILED" – Kann feine Details wie Logos und Text erheblich verbessern, insbesondere wenn der maskierte Bereich im Vergleich zum Gesamtbild relativ klein ist. Das Modell erreicht dies, indem es eine Inpainting-Bearbeitung an einer stark beschnittenen Version des Originalbildes mit höherer Auflösung durchführt, welche nur den maskierten Bereich enthält. Anschließend wird das Ergebnis wieder mit dem Originalbild zusammengeführt. Wie im "BALANCED"-Modus kann dies manchmal zu einer sichtbaren Naht führen.

  • returnMask (Optional) – Gibt an, ob das Maskenbild zusammen mit dem Ausgabebild zurückgegeben wird.

Antworttext

Die Antwort enthält eines oder mehrere der folgenden Felder:

{ "images": "images": string[] (list of Base64 encoded images), "maskImage": string (Base64 encoded image), "error": string }
  • images – Bei Erfolg wird eine Liste von Base64-kodierten Zeichenfolgen zurückgegeben, die jedes generierte Bild darstellen. Diese Liste enthält nicht immer dieselbe Anzahl von Bildern, welche Sie angefordert haben. Einzelne Bilder können nach ihrer Erstellung gesperrt werden, wenn sie nicht mit den AWS-Richtlinien zur Inhaltsmoderation von verantwortungsvoller KI (RAI) übereinstimmen. Es werden nur Bilder zurückgegeben, die den RAI-Richtlinien entsprechen.

  • maskImage – Wenn Sie angegeben haben, dass das Maskenbild mit der Ausgabe zurückgegeben werden soll, wird es an dieser Stelle zurückgegeben.

  • error – Wenn ein Bild nicht der RAI-Richtlinie entspricht, wird dieses Feld zurückgegeben. Andernfalls ist dieses Feld in der Antwort leer.

Das imageGenerationConfig-Feld ist allen Aufgabentypen gemeinsam, außer BACKGROUND_REMOVAL. Dies ist optional und umfasst die folgenden Felder. Wenn Sie dieses Objekt auslassen, werden die Standardkonfigurationen verwendet.

  • width und height (Optional) – Definieren die Größe und das Seitenverhältnis des generierten Bilds. Der Standardwert für beide ist 1 024.

    Die Werte width und height sollten nicht für die Aufgabentypen "INPAINTING", "OUTPAINTING" oder "VIRTUAL_TRY_ON" angegeben werden.

    Die vollständige Liste der unterstützten Auflösungen finden Sie unter Unterstützte Bildauflösungen.

  • quality (Optional) – Legt die Qualität fest, die beim Erstellen des Bildes verwendet werden soll – „Standard“ (Standard) oder „Premium“.

  • cfgScale (Optional) – Gibt an, inwiefern das Modell dem Prompt entsprechen soll. Die Werte reichen von 1,1 bis einschließlich 10, wobei der Standardwert 6,5 beträgt.

    • Niedrige Werte (1,1–3) – Mehr kreative Freiheit für die KI, potenziell ästhetischer, jedoch mit geringem Kontrast und weniger promptkonformen Ergebnissen.

    • Mittlere Werte (4–7) – Ausgewogener Ansatz, der in der Regel für die meisten Generationen empfohlen wird.

    • Hohe Werte (8–10) – Strikte Einhaltung der Prompts, was zu präziseren Ergebnissen führen kann, jedoch manchmal auf Kosten der natürlichen Ästhetik und einer erhöhten Farbsättigung

  • numberOfImages (Optional) – Die Anzahl der zu generierenden Bilder.

    Minimum Maximum Default
    1 5 1
  • seed (Optional) – Bestimmt die anfängliche Einstellung für das Rauschen im Generierungsprozess. Das Ändern des Seed-Wertes bei Beibehaltung aller anderen Parameter erzeugt ein völlig neues Bild, das weiterhin Ihrem Prompt, den Abmessungen und anderen Einstellungen entspricht. Es ist üblich, mit verschiedenen Seed-Werten zu experimentieren, um das optimale Bild zu erzielen.

    Minimum Maximum Default
    0 2,147,483,646 12
Wichtig

Auflösung (width und height), numberOfImages und quality haben alle einen Einfluss auf die Zeit, die für die Generierung benötigt wird. Das AWS-SDK hat einen read_timeout-Standardwert von 60 Sekunden, der bei Verwendung höherer Werte für diese Parameter leicht überschritten werden kann. Daher wird empfohlen, die read_timeout Ihrer Aufrufe auf mindestens 5 Minuten (300 Sekunden) zu erhöhen. Die Codebeispiele veranschaulichen, wie dies durchgeführt werden kann.