Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Anfrage- und Antwortstruktur für die Bildgenerierung
Bildgenerierung
In den folgenden Beispielen werden verschiedene Anwendungsfälle für die Bildgenerierung vorgestellt. Jedes Beispiel enthält eine Erläuterung der Felder, die für die Bilderzeugung verwendet werden.
- Text-to-image request
-
{
"taskType": "TEXT_IMAGE",
"textToImageParams": {
"text": string
,
"negativeText": string
,
"style": "3D_ANIMATED_FAMILY_FILM" |
"DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" |
"GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" |
"MIDCENTURY_RETRO" | "PHOTOREALISM" |
"SOFT_DIGITAL_PAINTING"
},
"imageGenerationConfig": {
"width": int
,
"height": int
,
"quality": "standard" | "premium",
"cfgScale": float
,
"seed": int
,
"numberOfImages": int
}
}
Die folgenden textToImageParams
Felder werden in dieser Anfrage verwendet:
-
text
(Erforderlich) — Eine Textaufforderung zum Generieren des Bildes. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein.
-
negativeText
(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.
-
style
(Optional) — Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.
Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text
negativeText
Werten. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text
Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText
Feld aufzunehmen.
- Text-to-image request with image conditioning
-
{
"taskType": "TEXT_IMAGE",
"textToImageParams": {
"conditionImage": string
(Base64 encoded image),
"controlMode": "CANNY_EDGE" | "SEGMENTATION",
"controlStrength": float
,
"text": string
,
"negativeText": string
,
"style": "3D_ANIMATED_FAMILY_FILM" |
"DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" |
"GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" |
"MIDCENTURY_RETRO" | "PHOTOREALISM" |
"SOFT_DIGITAL_PAINTING"
},
"imageGenerationConfig": {
"width": int
,
"height": int
,
"quality": "standard" | "premium",
"cfgScale": float
,
"seed": int
,
"numberOfImages": int
}
}
Die folgenden textToImageParams
Felder werden in dieser Anfrage verwendet:
-
conditionImage
(Erforderlich) — Ein JPEG- oder PNG-Bild, das das Layout und die Zusammensetzung des generierten Bilds bestimmt. Das Bild muss als Base64-Zeichenfolge formatiert sein. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.
-
controlMode
(Optional) — Gibt an, welcher Konditionierungsmodus verwendet werden soll. Der Standardwert ist „CANNY_EDGE“.
-
CANNY_EDGE
— Die Elemente des generierten Bildes folgen genau den markanten Konturen oder „Kanten“ des Zustandsbildes.
-
SEGMENTATION
— Das Zustandsbild wird automatisch analysiert, um markante Inhaltsformen zu identifizieren. Diese Analyse führt zu einer Segmentierungsmaske, die die Generierung steuert. Das Ergebnis ist ein generiertes Bild, das dem Layout des Zustandsbilds sehr ähnlich ist, dem Modell jedoch innerhalb der Grenzen der einzelnen Inhaltsbereiche mehr Freiheit einräumt.
-
controlStrength
(Optional) — Gibt an, wie ähnlich das Layout und die Zusammensetzung des generierten Bildes dem sein sollen. conditionImage
Der Bereich liegt zwischen 0 und 1,0, und niedrigere Werte führen zu mehr Zufälligkeit. Der Standardwert ist 0,7.
-
text
(Erforderlich) — Eine Textaufforderung zum Generieren des Bilds. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein.
-
negativeText
(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.
-
style
(Optional) — Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.
Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text
negativeText
Werten. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text
Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText
Feld aufzunehmen.
- Color guided image generation request
-
{
"taskType": "COLOR_GUIDED_GENERATION",
"colorGuidedGenerationParams": {
"colors": string[]
(list of hexadecimal color values),
"referenceImage": string
(Base64 encoded image),
"text": string
,
"negativeText": string
,
"style": "3D_ANIMATED_FAMILY_FILM" |
"DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" |
"GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" |
"MIDCENTURY_RETRO" | "PHOTOREALISM" |
"SOFT_DIGITAL_PAINTING"
},
"imageGenerationConfig": {
"width": int
,
"height": int
,
"quality": "standard" | "premium",
"cfgScale": float
,
"seed": int
,
"numberOfImages": int
}
}
Die folgenden colorGuidedGenerationParams
Felder werden in dieser Anfrage verwendet:
-
colors
(Erforderlich) — Eine Liste mit bis zu 10 Farbcodes, die die gewünschte Farbpalette für Ihr Bild definieren. Ausgedrückt als Hexadezimalwerte in der Form „#RRGGBB“. Zum Beispiel ist "#00FF00" rein grün und „# FCF2 AB“ ist warmes Gelb. Die colors
Liste hat die stärkste Wirkung, wenn a nicht angegeben referenceImage
wird. Andernfalls werden sowohl die Farben in der Liste als auch die Farben aus dem Referenzbild in der endgültigen Ausgabe verwendet.
-
referenceImage
(Optional) — Ein JPEG- oder PNG-Bild, das als Motiv- und Stilreferenz verwendet werden soll. Die Farben des Bildes werden zusammen mit den Farben aus der colors
Liste ebenfalls in die endgültige Ausgabe übernommen. Eingabebilder für die BilderzeugungWeitere Anforderungen finden Sie unter.
-
text
(Erforderlich) — Eine Textaufforderung zum Generieren des Bilds. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein.
-
negativeText
(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.
-
style
(Optional) — Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.
Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text
negativeText
Werten. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text
Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText
Feld aufzunehmen.
- Image variation request
-
{
"taskType": "IMAGE_VARIATION",
"imageVariationParams": {
"images": string[]
(list of Base64 encoded images),
"similarityStrength": float
,
"text": string
,
"negativeText": string
,
"style": "3D_ANIMATED_FAMILY_FILM" |
"DESIGN_SKETCH" | "FLAT_VECTOR_ILLUSTRATION" |
"GRAPHIC_NOVEL_ILLUSTRATION" | "MAXIMALISM" |
"MIDCENTURY_RETRO" | "PHOTOREALISM" |
"SOFT_DIGITAL_PAINTING"
},
"imageGenerationConfig": {
"height": int
,
"width": int
,
"cfgScale": float
,
"seed": int
,
"numberOfImages": int
}
}
Die folgenden imageVariationParams
Felder werden in dieser Anfrage verwendet:
-
images
(Erforderlich) — Eine Liste mit 1—5 Bildern, die als Referenz verwendet werden können. Jedes muss im JPEG- oder PNG-Format vorliegen und als Base64-Zeichenfolgen codiert sein. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.
-
similarityStrength
(Optional) — Gibt an, wie ähnlich das generierte Bild den Eingabebildern sein soll. Gültige Werte liegen zwischen 0,2 und 1,0, wobei niedrigere Werte für mehr Zufälligkeit verwendet werden.
-
text
(Erforderlich) — Eine Textaufforderung zum Generieren des Bilds. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein. Wenn Sie dieses Feld weglassen, entfernt das Modell Elemente innerhalb des maskierten Bereichs. Sie werden durch eine nahtlose Erweiterung des Bildhintergrunds ersetzt.
-
negativeText
(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.
-
style
(Optional) — Gibt den Stil an, der zum Generieren dieses Bilds verwendet wird. Weitere Informationen finden Sie unter Visuelle Stile.
Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren text
negativeText
Werten. Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text
Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText
Feld aufzunehmen.
Bearbeitung von Bildern
Die folgenden Beispiele stellen verschiedene Anwendungsfälle für die Bildbearbeitung vor. Jedes Beispiel enthält eine Erläuterung der Felder, die zur Bearbeitung des Bilds verwendet werden.
- Inpainting request
-
{
"taskType": "INPAINTING",
"inPaintingParams": {
"image": string
(Base64 encoded image),
"maskPrompt": string
,
"maskImage": string
(Base64 encoded image),
"text": string
,
"negativeText": string
},
"imageGenerationConfig": {
"numberOfImages": int
,
"quality": "standard" | "premium",
"cfgScale": float
,
"seed": int
}
}
Die folgenden inPaintingParams
Felder werden in dieser Anfrage verwendet:
-
image
(Erforderlich) — Das JPEG- oder PNG-Format, das Sie ändern möchten, formatiert als Base64-Zeichenfolge. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.
-
maskPrompt
oder maskImage
(Erforderlich) — Sie müssen entweder den maskPrompt
oder den maskImage
Parameter angeben, aber nicht beide.
Das maskPrompt
ist eine Textaufforderung in natürlicher Sprache, die die Bereiche des Bildes beschreibt, die bearbeitet werden sollen.
Das maskImage
ist ein Bild, das die Bereiche des Bildes definiert, die bearbeitet werden sollen. Das Maskenbild muss dieselbe Größe wie das Eingabebild haben. Zu bearbeitende Bereiche sind rein schwarz schattiert und Bereiche, die ignoriert werden sollen, sind rein weiß schattiert. Im Maskenbild sind keine anderen Farben zulässig.
Beachten Sie, dass die Anforderungen an das Ein- und Ausmalen in Bezug auf die Farbanforderungen der Maskenbilder entgegengesetzt sind.
-
text
(Erforderlich) — Eine Eingabeaufforderung, die beschreibt, was innerhalb des maskierten Bereichs generiert werden soll. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein. Wenn Sie dieses Feld weglassen, entfernt das Modell Elemente innerhalb des maskierten Bereichs. Sie werden durch eine nahtlose Erweiterung des Bildhintergrunds ersetzt.
-
negativeText
(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.
Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren Wertentext
. negativeText
Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text
Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText
Feld aufzunehmen.
- Outpainting request
-
{
"taskType": "OUTPAINTING",
"outPaintingParams": {
"image": string
(Base64 encoded image),
"maskPrompt": string
,
"maskImage": string
(Base64 encoded image),
"outPaintingMode": "DEFAULT" | "PRECISE",
"text": string
,
"negativeText": string
},
"imageGenerationConfig": {
"numberOfImages": int
,
"quality": "standard" | "premium",
"cfgScale": float
,
"seed": int
}
}
Die folgenden outPaintingParams
Felder werden in dieser Anfrage verwendet:
-
image
(Erforderlich) — Das JPEG- oder PNG-Format, das Sie ändern möchten, formatiert als Base64-Zeichenfolge. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.
-
maskPrompt
oder maskImage
(Erforderlich) — Sie müssen entweder den maskPrompt
oder den maskImage
Parameter angeben, aber nicht beide.
Das maskPrompt
ist eine Textaufforderung in natürlicher Sprache, die die Bereiche des Bildes beschreibt, die bearbeitet werden sollen.
Das maskImage
ist ein Bild, das die Bereiche des Bildes definiert, die bearbeitet werden sollen. Das Maskenbild muss dieselbe Größe wie das Eingabebild haben. Zu bearbeitende Bereiche sind rein schwarz schattiert und Bereiche, die ignoriert werden sollen, sind rein weiß schattiert. Im Maskenbild sind keine anderen Farben zulässig.
Beachten Sie, dass die Anforderungen an das Ein- und Ausmalen in Bezug auf die Farbanforderungen der Maskenbilder entgegengesetzt sind.
-
outPaintingMode
- Legt fest, wie die von Ihnen bereitgestellte Maske interpretiert wird.
Dient DEFAULT
zum reibungslosen Übergang zwischen dem maskierten Bereich und dem nicht maskierten Bereich. Einige der ursprünglichen Pixel werden als Ausgangspunkt für den neuen Hintergrund verwendet. Dieser Modus ist im Allgemeinen besser, wenn Sie möchten, dass der neue Hintergrund ähnliche Farben wie der ursprüngliche Hintergrund verwendet. Sie können jedoch einen Halo-Effekt erzielen, wenn Ihre Aufforderung einen neuen Hintergrund erfordert, der sich erheblich vom ursprünglichen Hintergrund unterscheidet.
Verwenden Sie diese PRECISE
Option, um die Maskengrenzen strikt einzuhalten. Dieser Modus ist generell besser, wenn Sie wesentliche Änderungen am Hintergrund vornehmen.
-
text
(Erforderlich) — Eine Eingabeaufforderung, die beschreibt, was innerhalb des maskierten Bereichs generiert werden soll. Die Eingabeaufforderung muss 1 bis 1024 Zeichen lang sein. Wenn Sie dieses Feld weglassen, entfernt das Modell Elemente innerhalb des maskierten Bereichs. Sie werden durch eine nahtlose Erweiterung des Bildhintergrunds ersetzt.
-
negativeText
(Optional) — Eine Textaufforderung, um zu definieren, was nicht in das Bild aufgenommen werden soll. Dieser Wert muss zwischen 1 und 1024 Zeichen lang sein.
Vermeiden Sie die Verwendung negierender Wörter („nein“, „nicht“, „ohne“ usw.) in Ihren Wertentext
. negativeText
Wenn Sie beispielsweise keine Spiegel in einem Bild haben möchten, verwenden Sie das Wort „Spiegel“ im text
Feld, anstatt „keine Spiegel“ oder „ohne Spiegel“ in das negativeText
Feld aufzunehmen.
- Background removal request
-
{
"taskType": "BACKGROUND_REMOVAL",
"backgroundRemovalParams": {
"image": string
(Base64 encoded image)
}
}
Das folgende backgroundRemovalParams
Feld wird in dieser Anfrage verwendet:
Die BACKGROUND_REMOVAL
Aufgabe gibt ein PNG-Bild mit voller 8-Bit-Transparenz zurück. Dieses Format ermöglicht eine reibungslose und saubere Isolierung der Vordergrundobjekte und macht es einfach, das Bild mit anderen Elementen in einer Bildbearbeitungs-App, Präsentation oder Website zusammenzusetzen. Der Hintergrund kann mithilfe eines einfachen benutzerdefinierten Codes einfach in eine Volltonfarbe geändert werden.
- Virtual try-on
-
{
"taskType": "VIRTUAL_TRY_ON",
"virtualTryOnParams": {
"sourceImage": string
(Base64 encoded image),
"referenceImage": string
(Base64 encoded image),
"maskType": "IMAGE" | "GARMENT" | "PROMPT",
"imageBasedMask":{
"maskImage": string
(Base64 encoded image),
},
"garmentBasedMask":{
"maskShape": "CONTOUR" | "BOUNDING_BOX" | "DEFAULT",
"garmentClass": "UPPER_BODY" | "LOWER_BODY" |
"FULL_BODY" | "FOOTWEAR" | "LONG_SLEEVE_SHIRT" |
"SHORT_SLEEVE_SHIRT" | "NO_SLEEVE_SHIRT" |
"OTHER_UPPER_BODY" | "LONG_PANTS" | "SHORT_PANTS" |
"OTHER_LOWER_BODY" | "LONG_DRESS" | "SHORT_DRESS" |
"FULL_BODY_OUTFIT" | "OTHER_FULL_BODY" | "SHOES" |
"BOOTS" | "OTHER_FOOTWEAR",
"garmentStyling":{
"longSleeveStyle": "SLEEVE_DOWN" | "SLEEVE_UP",
"tuckingStyle": "UNTUCKED" | "TUCKED",
"outerLayerStyle": "CLOSED" | "OPEN",
}
},
"promptBasedMask":{
"maskShape": "BOUNDING_BOX" | "CONTOUR" | "DEFAULT",
"maskPrompt": string
,
},
"maskExclusions": {
"preserveBodyPose": "ON" | "OFF" | "DEFAULT",
"preserveHands": "ON" | "OFF" | "DEFAULT",
"preserveFace": "OFF" | "ON" | "DEFAULT"
},
"mergeStyle" : "BALANCED" | "SEAMLESS" | "DETAILED" ,
"returnMask": boolean,
},
"imageGenerationConfig": {
"numberOfImages": int
,
"quality": "standard" | "premium",
"cfgScale": float
,
"seed": int
}
}
Die folgenden virtualTryOnParams
Felder werden in dieser Anfrage verwendet:
-
sourceImage
(Erforderlich) — Das JPEG- oder PNG-Format, das Sie ändern möchten, formatiert als Base64-Zeichenfolge. Weitere Anforderungen finden Eingabebilder für die Bilderzeugung Sie unter.
-
referenceImage
(Erforderlich) — Das JPEG- oder PNG-Format, das das Objekt enthält, das Sie dem Quellbild überlagern möchten, formatiert als Base64-Zeichenfolge. Weitere Anforderungen finden Sie unterEingabebilder für die Bilderzeugung.
-
maskType
(Erforderlich) — Gibt an, ob die Maske als Bild-, Eingabeaufforderung oder Kleidungsmaske bereitgestellt wird.
-
imageBasedMask
— Erforderlich, wenn es maskType
ist"IMAGE"
.
Das maskImage
ist ein Bild, das die Bereiche des Bildes definiert, die bearbeitet werden sollen. Das Maskenbild muss dieselbe Größe wie das Eingabebild haben. Zu bearbeitende Bereiche sind rein schwarz schattiert und Bereiche, die ignoriert werden sollen, sind rein weiß schattiert. Im Maskenbild sind keine anderen Farben zulässig.
-
garmentBasedMask
— Erforderlich, wenn maskType
es ist"GARMENT"
.
-
maskShape
(Optional) — Definiert die Form des Masken-Begrenzungsrahmens. Die Form und Größe des Begrenzungsrahmens können sich darauf auswirken, wie das Referenzbild auf das Quellbild übertragen wird.
-
garmentClass
(Erforderlich) — Definiert das Kleidungsstück, das übertragen wird. Dieser Parameter ermöglicht es dem Modell, sich auf bestimmte Teile des Referenzbilds zu konzentrieren, die Sie übertragen möchten.
-
garmentStyling
(Optional) — Gibt dem Modell Styling-Hinweise für bestimmte Kleidungsstücke. Die tuckingStyle
Parameter longSleeveStyle
und gelten nur für Oberkörperkleidung. Der outerLayerStyle
Parameter gilt nur für Oberkörperbekleidung, d. h. für Oberkörperbekleidung.
-
promptBasedMask
(Erforderlich) — Erforderlich, wann maskType
ist"PROMPT"
.
-
maskShape
(Optional) — Definiert die Form des Maskenbegrenzungsrahmens. Die Form und Größe des Begrenzungsrahmens können sich darauf auswirken, wie das Referenzbild auf das Quellbild übertragen wird.
-
maskPrompt
(Erforderlich) — Eine Textaufforderung in natürlicher Sprache, die die zu bearbeitenden Bereiche des Bilds beschreibt.
-
maskExclusions
(Optional) — Wenn eine Person im Quellbild erkannt wird, bestimmen diese Parameter, ob ihre Körperhaltung, Hände und ihr Gesicht im Ausgabebild beibehalten oder regeneriert werden sollen.
-
mergeStyle
(Optional) — Legt fest, wie das Quell- und das Referenzbild zusammengefügt werden. Jeder Zusammenführungsstil verfolgt einen anderen Ansatz, wenn es darum geht, wie die Elemente zusammengefügt werden, um das endgültige Bild zu erstellen. Jeder Stil hat seine eigenen Vor- und Nachteile.
-
"BALANCED"
- Schützt alle nicht maskierten Pixel im Originalbild und stellt sicher, dass sie dem Original zu 100% entsprechen. In einigen Fällen kann es zu einer leichten Farb- oder Texturabweichung im Ausgabebild kommen, die als eine Art „Geisterbild“ der Maskenform dargestellt wird. Dies ist am wahrscheinlichsten, wenn auf dem Bild eine Person vor einem einfarbigen oder gleichmäßig strukturierten Hintergrund steht. Um dies zu vermeiden, können Sie stattdessen den Stil „"SEAMLESS"
Zusammenführen“ verwenden.
-
"SEAMLESS"
- Stellt sicher, dass im endgültigen Bild niemals eine sichtbare Naht zwischen den maskierten und den nicht maskierten Bildbereichen entsteht. Der Nachteil besteht darin, dass dieser Modus dazu führt, dass sich alle Pixel im Bild geringfügig ändern, wodurch feinkörnige Details in den nicht maskierten Bereichen des Bildes manchmal verringert werden können.
-
"DETAILED"
- Kann feinkörnige Details wie Logos und Text erheblich verbessern, insbesondere wenn der maskierte Bereich im Vergleich zum Gesamtbild relativ klein ist. Das Modell erreicht dies, indem es eine eng beschnittene Version des Originalbilds mit höherer Auflösung einfügt, die nur den maskierten Bereich enthält. Anschließend wird das Ergebnis wieder mit dem Originalbild zusammengeführt. Wie "BALANCED"
im Modus „Benutzen“ kann auch dieser Modus manchmal zu einer sichtbaren Naht führen.
-
returnMask
(Optional) — Gibt an, ob das Maskenbild zusammen mit dem Ausgabebild zurückgegeben wird.
Antworttext
Der Antworttext enthält eines oder mehrere der folgenden Felder:
{
"images": "images": string[] (list of Base64 encoded images),
"maskImage": string (Base64 encoded image),
"error": string
}
-
images
— Bei Erfolg wird eine Liste mit Base64-codierten Zeichenketten zurückgegeben, die jedes generierte Bild repräsentieren. Diese Liste enthält nicht immer dieselbe Anzahl von Bildern, die Sie angefordert haben. Einzelne Bilder können nach der Generierung blockiert werden, wenn sie nicht den Richtlinien zur Inhaltsmoderation von AWS Responsible AI (RAI) entsprechen. Es werden nur Bilder zurückgegeben, die den RAI-Richtlinien entsprechen.
-
maskImage
- Wenn Sie angegeben haben, dass das Maskenbild zusammen mit der Ausgabe zurückgegeben werden soll, wird es hier zurückgegeben.
-
error
— Wenn ein Bild nicht der RAI-Richtlinie entspricht, wird dieses Feld zurückgegeben. Andernfalls wird dieses Feld in der Antwort weggelassen.
Das imageGenerationConfig
Feld ist allen Aufgabentypen gemeinsam, außer BACKGROUND_REMOVAL
Es ist optional und enthält die folgenden Felder. Wenn Sie dieses Objekt weglassen, werden die Standardkonfigurationen verwendet.
-
width
und height
(Optional) — Definieren Sie die Größe und das Seitenverhältnis des generierten Bilds. Beide sind standardmäßig auf 1024 eingestellt.
Die height
Werte width
und sollten nicht für die "VIRTUAL_TRY_ON"
Aufgabentypen "INPAINTING"
"OUTPAINTING"
, oder angegeben werden.
Die vollständige Liste der unterstützten Auflösungen finden Sie unterUnterstützte Bildauflösungen.
-
quality
(Optional) — Gibt die Qualität an, die beim Generieren des Bilds verwendet werden soll: „Standard“ (Standard) oder „Premium“.
-
cfgScale
(Optional) — Gibt an, wie genau sich das Modell an die Aufforderung halten soll. Die Werte liegen zwischen 1,1 und einschließlich 10, und der Standardwert ist 6,5.
-
Niedrige Werte (1,1—3) — Mehr kreative Freiheit für die KI, potenziell ästhetischer, aber kontrastarmer und weniger prompte Ergebnisse
-
Mittlere Werte (4-7) — Ausgewogener Ansatz, der in der Regel für die meisten Generationen empfohlen wird
-
Hohe Werte (8—10) — Strikte Einhaltung zeitnaher Einhaltung, was zu genaueren Ergebnissen führen kann, manchmal jedoch auf Kosten der natürlichen Ästhetik und der erhöhten Farbsättigung
-
numberOfImages
(Optional) — Die Anzahl der zu generierenden Bilder.
Minimum |
Maximum |
Standard |
1 |
5 |
1 |
-
seed
(Optional) — Legt die anfängliche Rauscheinstellung für den Generierungsprozess fest. Wenn Sie den Ausgangswert ändern und dabei alle anderen Parameter unverändert lassen, wird ein völlig neues Bild erzeugt, das immer noch Ihren Eingabeaufforderungen, Abmessungen und anderen Einstellungen entspricht. Es ist üblich, mit einer Vielzahl von Ausgangswerten zu experimentieren, um das perfekte Bild zu finden.
Minimum |
Maximum |
Standard |
0 |
2.147.483.646 |
12 |
Auflösung (width
undheight
), und quality
alle wirken sich auf die Zeit ausnumberOfImages
, die bis zum Abschluss der Generierung benötigt wird. Das AWS SDK hat eine Standardeinstellung read_timeout
von 60 Sekunden, die leicht überschritten werden kann, wenn höhere Werte für diese Parameter verwendet werden. Daher wird empfohlen, die read_timeout
Anzahl Ihrer Aufrufanrufe auf mindestens 5 Minuten (300 Sekunden) zu erhöhen. Die Codebeispiele zeigen, wie das geht.