Anfrage- und Antwortstruktur für die Bildgenerierung - Amazon Nova

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Anfrage- und Antwortstruktur für die Bildgenerierung

Bildgenerierung

In den folgenden Beispielen werden verschiedene Anwendungsfälle für die Bildgenerierung vorgestellt. Jedes Beispiel enthält eine Erläuterung der Felder, die für die Bilderzeugung verwendet werden.

Text-to-image request
{ "taskType": "TEXT_IMAGE", "textToImageParams": { "text": string, "negativeText": string, "style": "3D_ANIMATED_FAMILY_FILM" | "DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" | "GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" | "MIDCENTURY_RETRO" | "PHOTOREALISM" | "SOFT_DIGITAL_PAINTING" }, "imageGenerationConfig": { "width": int, "height": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int, "numberOfImages": int } }

Die folgenden textToImageParams Felder werden in dieser Anfrage verwendet:

  • text(Erforderlich) — Eine Textaufforderung zum Generieren des Bildes. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein.

  • negativeText(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.

  • style(Optional) — Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.

Anmerkung

Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text negativeText Werten. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText Feld aufzunehmen.

Text-to-image request with image conditioning
{ "taskType": "TEXT_IMAGE", "textToImageParams": { "conditionImage": string (Base64 encoded image), "controlMode": "CANNY_EDGE" | "SEGMENTATION", "controlStrength": float, "text": string, "negativeText": string, "style": "3D_ANIMATED_FAMILY_FILM" | "DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" | "GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" | "MIDCENTURY_RETRO" | "PHOTOREALISM" | "SOFT_DIGITAL_PAINTING" }, "imageGenerationConfig": { "width": int, "height": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int, "numberOfImages": int } }

Die folgenden textToImageParams Felder werden in dieser Anfrage verwendet:

  • conditionImage(Erforderlich) — Ein JPEG- oder PNG-Bild, das das Layout und die Zusammensetzung des generierten Bilds bestimmt. Das Bild muss als Base64-Zeichenfolge formatiert sein. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.

  • controlMode(Optional) — Gibt an, welcher Konditionierungsmodus verwendet werden soll. Der Standardwert ist „CANNY_EDGE“.

    • CANNY_EDGE— Die Elemente des generierten Bildes folgen genau den markanten Konturen oder „Kanten“ des Zustandsbildes.

    • SEGMENTATION— Das Zustandsbild wird automatisch analysiert, um markante Inhaltsformen zu identifizieren. Diese Analyse führt zu einer Segmentierungsmaske, die die Generierung steuert. Das Ergebnis ist ein generiertes Bild, das dem Layout des Zustandsbilds sehr ähnlich ist, dem Modell jedoch innerhalb der Grenzen der einzelnen Inhaltsbereiche mehr Freiheit einräumt.

  • controlStrength(Optional) — Gibt an, wie ähnlich das Layout und die Zusammensetzung des generierten Bildes dem sein sollen. conditionImage Der Bereich liegt zwischen 0 und 1,0, und niedrigere Werte führen zu mehr Zufälligkeit. Der Standardwert ist 0,7.

  • text(Erforderlich) — Eine Textaufforderung zum Generieren des Bilds. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein.

  • negativeText(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.

  • style(Optional) — Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.

Anmerkung

Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text negativeText Werten. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText Feld aufzunehmen.

Color guided image generation request
{ "taskType": "COLOR_GUIDED_GENERATION", "colorGuidedGenerationParams": { "colors": string[] (list of hexadecimal color values), "referenceImage": string (Base64 encoded image), "text": string, "negativeText": string, "style": "3D_ANIMATED_FAMILY_FILM" | "DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" | "GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" | "MIDCENTURY_RETRO" | "PHOTOREALISM" | "SOFT_DIGITAL_PAINTING" }, "imageGenerationConfig": { "width": int, "height": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int, "numberOfImages": int } }

Die folgenden colorGuidedGenerationParams Felder werden in dieser Anfrage verwendet:

  • colors(Erforderlich) — Eine Liste mit bis zu 10 Farbcodes, die die gewünschte Farbpalette für Ihr Bild definieren. Ausgedrückt als Hexadezimalwerte in der Form „#RRGGBB“. Zum Beispiel ist "#00FF00" rein grün und „# FCF2 AB“ ist warmes Gelb. Die colors Liste hat die stärkste Wirkung, wenn a nicht angegeben referenceImage wird. Andernfalls werden sowohl die Farben in der Liste als auch die Farben aus dem Referenzbild in der endgültigen Ausgabe verwendet.

  • referenceImage(Optional) — Ein JPEG- oder PNG-Bild, das als Motiv- und Stilreferenz verwendet werden soll. Die Farben des Bildes werden zusammen mit den Farben aus der colors Liste ebenfalls in die endgültige Ausgabe übernommen. Eingabebilder für die BilderzeugungWeitere Anforderungen finden Sie unter.

  • text(Erforderlich) — Eine Textaufforderung zum Generieren des Bilds. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein.

  • negativeText(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.

  • style(Optional) — Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.

Anmerkung

Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text negativeText Werten. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText Feld aufzunehmen.

Image variation request
{ "taskType": "IMAGE_VARIATION", "imageVariationParams": { "images": string[] (list of Base64 encoded images), "similarityStrength": float, "text": string, "negativeText": string, "style": "3D_ANIMATED_FAMILY_FILM" | "DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" | "GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" | "MIDCENTURY_RETRO" | "PHOTOREALISM" | "SOFT_DIGITAL_PAINTING" }, "imageGenerationConfig": { "height": int, "width": int, "cfgScale": float, "seed": int, "numberOfImages": int } }

Die folgenden imageVariationParams Felder werden in dieser Anfrage verwendet:

  • images(Erforderlich) — Eine Liste mit 1—5 Bildern, die als Referenz verwendet werden können. Jedes muss im JPEG- oder PNG-Format vorliegen und als Base64-Zeichenfolgen codiert sein. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.

  • similarityStrength(Optional) — Gibt an, wie ähnlich das generierte Bild den Eingabebildern sein soll. Gültige Werte liegen zwischen 0,2 und 1,0, wobei niedrigere Werte für mehr Zufälligkeit verwendet werden.

  • text(Erforderlich) — Eine Textaufforderung zum Generieren des Bilds. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein. Wenn Sie dieses Feld weglassen, entfernt das Modell Elemente innerhalb des maskierten Bereichs. Sie werden durch eine nahtlose Erweiterung des Bildhintergrunds ersetzt.

  • negativeText(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.

  • style(Optional) — Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.

Anmerkung

Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text negativeText Werten. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText Feld aufzunehmen.

Bearbeitung von Bildern

Die folgenden Beispiele stellen verschiedene Anwendungsfälle für die Bildbearbeitung vor. Jedes Beispiel enthält eine Erläuterung der Felder, die zur Bearbeitung des Bilds verwendet werden.

Inpainting request
{ "taskType": "INPAINTING", "inPaintingParams": { "image": string (Base64 encoded image), "maskPrompt": string, "maskImage": string (Base64 encoded image), "text": string, "negativeText": string }, "imageGenerationConfig": { "numberOfImages": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int } }

Die folgenden inPaintingParams Felder werden in dieser Anfrage verwendet:

  • image(Erforderlich) — Das JPEG- oder PNG-Format, das Sie ändern möchten, formatiert als Base64-Zeichenfolge. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.

  • maskPromptoder maskImage (Erforderlich) — Sie müssen entweder den maskPrompt oder den maskImage Parameter angeben, aber nicht beide.

    Das maskPrompt ist eine Textaufforderung in natürlicher Sprache, die die Bereiche des Bildes beschreibt, die bearbeitet werden sollen.

    Das maskImage ist ein Bild, das die Bereiche des Bildes definiert, die bearbeitet werden sollen. Das Maskenbild muss dieselbe Größe wie das Eingabebild haben. Zu bearbeitende Bereiche sind rein schwarz schattiert und Bereiche, die ignoriert werden sollen, sind rein weiß schattiert. Im Maskenbild sind keine anderen Farben zulässig.

    Beachten Sie, dass die Anforderungen an das Ein- und Ausmalen in Bezug auf die Farbanforderungen der Maskenbilder entgegengesetzt sind.

  • text(Erforderlich) — Eine Eingabeaufforderung, die beschreibt, was innerhalb des maskierten Bereichs generiert werden soll. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein. Wenn Sie dieses Feld weglassen, entfernt das Modell Elemente innerhalb des maskierten Bereichs. Sie werden durch eine nahtlose Erweiterung des Bildhintergrunds ersetzt.

  • negativeText(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.

Anmerkung

Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren Wertentext. negativeText Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText Feld aufzunehmen.

Outpainting request
{ "taskType": "OUTPAINTING", "outPaintingParams": { "image": string (Base64 encoded image), "maskPrompt": string, "maskImage": string (Base64 encoded image), "outPaintingMode": "DEFAULT" | "PRECISE", "text": string, "negativeText": string }, "imageGenerationConfig": { "numberOfImages": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int } }

Die folgenden outPaintingParams Felder werden in dieser Anfrage verwendet:

  • image(Erforderlich) — Das JPEG- oder PNG-Format, das Sie ändern möchten, formatiert als Base64-Zeichenfolge. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.

  • maskPromptoder maskImage (Erforderlich) — Sie müssen entweder den maskPrompt oder den maskImage Parameter angeben, aber nicht beide.

    Das maskPrompt ist eine Textaufforderung in natürlicher Sprache, die die Bereiche des Bildes beschreibt, die bearbeitet werden sollen.

    Das maskImage ist ein Bild, das die Bereiche des Bildes definiert, die bearbeitet werden sollen. Das Maskenbild muss dieselbe Größe wie das Eingabebild haben. Zu bearbeitende Bereiche sind rein schwarz schattiert und Bereiche, die ignoriert werden sollen, sind rein weiß schattiert. Im Maskenbild sind keine anderen Farben zulässig.

    Beachten Sie, dass die Anforderungen an das Ein- und Ausmalen in Bezug auf die Farbanforderungen der Maskenbilder entgegengesetzt sind.

  • outPaintingMode- Legt fest, wie die von Ihnen bereitgestellte Maske interpretiert wird.

    Dient DEFAULT zum reibungslosen Übergang zwischen dem maskierten Bereich und dem nicht maskierten Bereich. Einige der ursprünglichen Pixel werden als Ausgangspunkt für den neuen Hintergrund verwendet. Dieser Modus ist im Allgemeinen besser, wenn Sie möchten, dass der neue Hintergrund ähnliche Farben wie der ursprüngliche Hintergrund verwendet. Sie können jedoch einen Halo-Effekt erzielen, wenn Ihre Aufforderung einen neuen Hintergrund erfordert, der sich erheblich vom ursprünglichen Hintergrund unterscheidet.

    Verwenden Sie diese PRECISE Option, um die Maskengrenzen strikt einzuhalten. Dieser Modus ist generell besser, wenn Sie wesentliche Änderungen am Hintergrund vornehmen.

  • text(Erforderlich) — Eine Eingabeaufforderung, die beschreibt, was innerhalb des maskierten Bereichs generiert werden soll. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein. Wenn Sie dieses Feld weglassen, entfernt das Modell Elemente innerhalb des maskierten Bereichs. Sie werden durch eine nahtlose Erweiterung des Bildhintergrunds ersetzt.

  • negativeText(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.

Anmerkung

Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren Wertentext. negativeText Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText Feld aufzunehmen.

Background removal request
{ "taskType": "BACKGROUND_REMOVAL", "backgroundRemovalParams": { "image": string (Base64 encoded image) } }

Das folgende backgroundRemovalParams Feld wird in dieser Anfrage verwendet:

  • image(Erforderlich) — Das JPEG- oder PNG-Format, das Sie ändern möchten, formatiert als Base64-Zeichenfolge. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.

Die BACKGROUND_REMOVAL Aufgabe gibt ein PNG-Bild mit voller 8-Bit-Transparenz zurück. Dieses Format ermöglicht eine reibungslose und saubere Isolierung der Vordergrundobjekte und macht es einfach, das Bild mit anderen Elementen in einer Bildbearbeitungs-App, Präsentation oder Website zusammenzusetzen. Der Hintergrund kann mithilfe eines einfachen benutzerdefinierten Codes einfach in eine Volltonfarbe geändert werden.

Virtual try-on
{ "taskType": "VIRTUAL_TRY_ON", "virtualTryOnParams": { "sourceImage": string (Base64 encoded image), "referenceImage": string (Base64 encoded image), "maskType": "IMAGE" | "GARMENT" | "PROMPT", "imageBasedMask":{ "maskImage": string (Base64 encoded image), }, "garmentBasedMask":{ "maskShape": "CONTOUR" | "BOUNDING_BOX" | "DEFAULT", "garmentClass": "UPPER_BODY" | "LOWER_BODY" | "FULL_BODY" | "FOOTWEAR" | "LONG_SLEEVE_SHIRT" | "SHORT_SLEEVE_SHIRT" | "NO_SLEEVE_SHIRT" | "OTHER_UPPER_BODY" | "LONG_PANTS" | "SHORT_PANTS" | "OTHER_LOWER_BODY" | "LONG_DRESS" | "SHORT_DRESS" | "FULL_BODY_OUTFIT" | "OTHER_FULL_BODY" | "SHOES" | "BOOTS" | "OTHER_FOOTWEAR", "garmentStyling":{ "longSleeveStyle": "SLEEVE_DOWN" | "SLEEVE_UP", "tuckingStyle": "UNTUCKED" | "TUCKED", "outerLayerStyle": "CLOSED" | "OPEN", } }, "promptBasedMask":{ "maskShape": "BOUNDING_BOX" | "CONTOUR" | "DEFAULT", "maskPrompt": string, }, "maskExclusions": { "preserveBodyPose": "ON" | "OFF" | "DEFAULT", "preserveHands": "ON" | "OFF" | "DEFAULT", "preserveFace": "OFF" | "ON" | "DEFAULT" }, "mergeStyle" : "BALANCED" | "SEAMLESS" | "DETAILED" , "returnMask": boolean, }, "imageGenerationConfig": { "numberOfImages": int, "quality": "standard" | "premium", "cfgScale": float, "seed": int } }

Die folgenden virtualTryOnParams Felder werden in dieser Anfrage verwendet:

  • sourceImage(Erforderlich) — Das JPEG- oder PNG-Format, das Sie ändern möchten, formatiert als Base64-Zeichenfolge. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.

  • referenceImage(Erforderlich) — Das JPEG- oder PNG-Format, das das Objekt enthält, das Sie dem Quellbild überlagern möchten, formatiert als Base64-Zeichenfolge. Weitere Anforderungen finden Sie unterEingabebilder für die Bilderzeugung.

  • maskType(Erforderlich) — Gibt an, ob die Maske als Bild-, Eingabeaufforderung oder Kleidungsmaske bereitgestellt wird.

  • imageBasedMask— Erforderlich, wenn es maskType ist"IMAGE".

    Das maskImage ist ein Bild, das die Bereiche des Bildes definiert, die bearbeitet werden sollen. Das Maskenbild muss dieselbe Größe wie das Eingabebild haben. Zu bearbeitende Bereiche sind rein schwarz schattiert und Bereiche, die ignoriert werden sollen, sind rein weiß schattiert. Im Maskenbild sind keine anderen Farben zulässig.

  • garmentBasedMask— Erforderlich, wenn maskType es ist"GARMENT".

    • maskShape(Optional) — Definiert die Form des Masken-Begrenzungsrahmens. Die Form und Größe des Begrenzungsrahmens können sich darauf auswirken, wie das Referenzbild auf das Quellbild übertragen wird.

    • garmentClass(Erforderlich) — Definiert das Kleidungsstück, das übertragen wird. Dieser Parameter ermöglicht es dem Modell, sich auf bestimmte Teile des Referenzbilds zu konzentrieren, die Sie übertragen möchten.

    • garmentStyling(Optional) — Gibt dem Modell Styling-Hinweise für bestimmte Kleidungsstücke. Die tuckingStyle Parameter longSleeveStyle und gelten nur für Oberkörperkleidung. Der outerLayerStyle Parameter gilt nur für Oberkörperbekleidung, d. h. für Oberkörperbekleidung.

  • promptBasedMask(Erforderlich) — Erforderlich, wann maskType ist"PROMPT".

    • maskShape(Optional) — Definiert die Form des Maskenbegrenzungsrahmens. Die Form und Größe des Begrenzungsrahmens können sich darauf auswirken, wie das Referenzbild auf das Quellbild übertragen wird.

    • maskPrompt(Erforderlich) — Eine Textaufforderung in natürlicher Sprache, die die zu bearbeitenden Bereiche des Bilds beschreibt.

  • maskExclusions(Optional) — Wenn eine Person im Quellbild erkannt wird, bestimmen diese Parameter, ob ihre Körperhaltung, Hände und ihr Gesicht im Ausgabebild beibehalten oder regeneriert werden sollen.

  • mergeStyle(Optional) — Legt fest, wie das Quell- und das Referenzbild zusammengefügt werden. Jeder Zusammenführungsstil verfolgt einen anderen Ansatz, wenn es darum geht, wie die Elemente zusammengefügt werden, um das endgültige Bild zu erstellen. Jeder Stil hat seine eigenen Vor- und Nachteile.

    • "BALANCED"- Schützt alle nicht maskierten Pixel im Originalbild und stellt sicher, dass sie dem Original zu 100% entsprechen. In einigen Fällen kann es zu einer leichten Farb- oder Texturabweichung im Ausgabebild kommen, die als eine Art „Geisterbild“ der Maskenform dargestellt wird. Dies ist am wahrscheinlichsten, wenn auf dem Bild eine Person vor einem einfarbigen oder gleichmäßig strukturierten Hintergrund steht. Um dies zu vermeiden, können Sie stattdessen den Stil „"SEAMLESS"Zusammenführen“ verwenden.

    • "SEAMLESS"- Stellt sicher, dass im endgültigen Bild niemals eine sichtbare Naht zwischen den maskierten und den nicht maskierten Bildbereichen entsteht. Der Nachteil besteht darin, dass dieser Modus dazu führt, dass sich alle Pixel im Bild geringfügig ändern, wodurch feinkörnige Details in den nicht maskierten Bereichen des Bildes manchmal verringert werden können.

    • "DETAILED"- Kann feinkörnige Details wie Logos und Text erheblich verbessern, insbesondere wenn der maskierte Bereich im Vergleich zum Gesamtbild relativ klein ist. Das Modell erreicht dies, indem es eine eng beschnittene Version des Originalbilds mit höherer Auflösung einfügt, die nur den maskierten Bereich enthält. Anschließend wird das Ergebnis wieder mit dem Originalbild zusammengeführt. Wie "BALANCED" im Modus „Benutzen“ kann auch dieser Modus manchmal zu einer sichtbaren Naht führen.

  • returnMask(Optional) — Gibt an, ob das Maskenbild zusammen mit dem Ausgabebild zurückgegeben wird.

Antworttext

Der Antworttext enthält eines oder mehrere der folgenden Felder:

{ "images": "images": string[] (list of Base64 encoded images), "maskImage": string (Base64 encoded image), "error": string }
  • images— Bei Erfolg wird eine Liste mit Base64-codierten Zeichenketten zurückgegeben, die jedes generierte Bild repräsentieren. Diese Liste enthält nicht immer dieselbe Anzahl von Bildern, die Sie angefordert haben. Einzelne Bilder können nach der Generierung blockiert werden, wenn sie nicht den Richtlinien zur Inhaltsmoderation von AWS Responsible AI (RAI) entsprechen. Es werden nur Bilder zurückgegeben, die den RAI-Richtlinien entsprechen.

  • maskImage- Wenn Sie angegeben haben, dass das Maskenbild zusammen mit der Ausgabe zurückgegeben werden soll, wird es hier zurückgegeben.

  • error— Wenn ein Bild nicht der RAI-Richtlinie entspricht, wird dieses Feld zurückgegeben. Andernfalls wird dieses Feld in der Antwort weggelassen.

Das imageGenerationConfig Feld ist allen Aufgabentypen gemeinsam, außer BACKGROUND_REMOVAL Es ist optional und enthält die folgenden Felder. Wenn Sie dieses Objekt weglassen, werden die Standardkonfigurationen verwendet.

  • widthund height (Optional) — Definieren Sie die Größe und das Seitenverhältnis des generierten Bilds. Beide sind standardmäßig auf 1024 eingestellt.

    Die height Werte width und sollten nicht für die "VIRTUAL_TRY_ON" Aufgabentypen "INPAINTING""OUTPAINTING", oder angegeben werden.

    Die vollständige Liste der unterstützten Auflösungen finden Sie unterUnterstützte Bildauflösungen.

  • quality(Optional) — Gibt die Qualität an, die beim Generieren des Bilds verwendet werden soll: „Standard“ (Standard) oder „Premium“.

  • cfgScale(Optional) — Gibt an, wie genau sich das Modell an die Aufforderung halten soll. Die Werte liegen zwischen 1,1 und einschließlich 10, und der Standardwert ist 6,5.

    • Niedrige Werte (1,1—3) — Mehr kreative Freiheit für die KI, potenziell ästhetischer, aber kontrastarmer und weniger prompte Ergebnisse

    • Mittlere Werte (4-7) — Ausgewogener Ansatz, der in der Regel für die meisten Generationen empfohlen wird

    • Hohe Werte (8—10) — Strikte Einhaltung zeitnaher Einhaltung, was zu genaueren Ergebnissen führen kann, manchmal jedoch auf Kosten der natürlichen Ästhetik und der erhöhten Farbsättigung

  • numberOfImages(Optional) — Die Anzahl der zu generierenden Bilder.

    Minimum Maximum Standard
    1 5 1
  • seed(Optional) — Legt die anfängliche Rauscheinstellung für den Generierungsprozess fest. Wenn Sie den Ausgangswert ändern und dabei alle anderen Parameter unverändert lassen, wird ein völlig neues Bild erzeugt, das immer noch Ihren Eingabeaufforderungen, Abmessungen und anderen Einstellungen entspricht. Es ist üblich, mit einer Vielzahl von Ausgangswerten zu experimentieren, um das perfekte Bild zu finden.

    Minimum Maximum Standard
    0 2.147.483.646 12
Wichtig

Auflösung (widthundheight), und quality alle wirken sich auf die Zeit ausnumberOfImages, die bis zum Abschluss der Generierung benötigt wird. Das AWS SDK hat eine Standardeinstellung read_timeout von 60 Sekunden, die leicht überschritten werden kann, wenn höhere Werte für diese Parameter verwendet werden. Daher wird empfohlen, die read_timeout Anzahl Ihrer Aufrufanrufe auf mindestens 5 Minuten (300 Sekunden) zu erhöhen. Die Codebeispiele zeigen, wie das geht.