Features Parameters Fine-tuning Ausgabe Wasserzeichenerkennung Prompt-Engineering-Richtlinien

Modell Amazon Titan Image Generator G1

Amazon Titan Image Generator G1 ist ein Modell zur Bilderzeugung, mit dem Benutzer Bilder auf vielfältige Weise generieren und bearbeiten können. Benutzer können Bilder erstellen, die ihren textbasierten Beschreibungen entsprechen, indem sie die entsprechenden Prompts in natürlicher Sprache eingeben. Darüber hinaus können sie vorhandene Bilder hochladen und bearbeiten, einschließlich der Anwendung textbasierter Prompts ohne die Notwendigkeit einer Maske oder der Bearbeitung bestimmter Teile eines Bilds mithilfe einer Bildmaske. Das Modell unterstützt auch das Outpainting, das die Grenzen eines Bilds erweitert, und das Inpainting, das fehlende Bereiche ausfüllt. Es bietet die Möglichkeit, Variationen eines Bilds auf der Grundlage eines optionalen Text-Prompts zu generieren, sowie sofortige Anpassungsoptionen, mit denen Benutzer Stile anhand von Referenzbildern übertragen oder Stile aus mehreren Referenzen kombinieren können, ohne dass eine Feinabstimmung erforderlich ist.

Amazon Titan Image Generator G1 v2 bietet mehrere erweiterte Funktionen. Es ermöglicht Benutzern, Referenzbilder als Leitfaden für die Bilderzeugung zu verwenden, wobei das Ausgabebild dem Layout und der Zusammensetzung des Referenzbilds entspricht und gleichzeitig der Textanfrage folgt. Es umfasst auch Features für automatische Hintergrundentfernung, die Hintergründe aus Bildern mit mehreren Objekten ohne Benutzereingaben entfernen kann. Das Modell ermöglicht eine präzise Steuerung der Farbpalette der generierten Bilder, sodass Benutzer die visuelle Identität einer Marke ohne zusätzliche Feinabstimmungen beibehalten können. Darüber hinaus ermöglicht das Feature „Motivkonsistenz“ den Benutzern, das Modell anhand von Referenzbildern zu optimieren, um das ausgewählte Motiv (z. B. Haustier, Schuh oder Handtasche) in den generierten Bildern beizubehalten. Diese umfassende Reihe von Features ermöglicht es Benutzern, ihr kreatives Potenzial zu entfalten und ihre fantasievollen Visionen zum Leben zu erwecken.

Weitere Informationen zu den technischen Richtlinien für Amazon Titan Image Generator G1 Model Prompt finden Sie unter Amazon Titan Image Generator Prompt Engineering Best Practices.

Um weiterhin Best Practices für den verantwortungsvollen Umgang mit KI zu unterstützen, sind Titan Basismodelle (FMs) darauf ausgelegt, schädliche Inhalte in den Daten zu erkennen und zu entfernen, unangemessene Inhalte in der Benutzereingabe zurückzuweisen und die Ausgaben der Modelle zu filtern, die unangemessene Inhalte (wie Hassreden, Obszönitäten und Gewalt) enthalten. Der Titan Image Generator FM fügt allen generierten Bildern ein unsichtbares Wasserzeichen und C2PA-Metadaten hinzu.

Sie können das Feature für die Erkennung von Wasserzeichen in der Amazon-Bedrock-Konsole verwenden oder die API (Vorschau) für Wasserzeichenerkennung von Amazon Bedrock aufrufen, um zu überprüfen, ob ein Bild Wasserzeichen von Titan Image Generator enthält. Sie können auch Websites wie Content Credentials Verify verwenden, um zu überprüfen, ob ein Bild von Titan Image Generator generiert wurde.

Übersicht über Amazon Titan Image Generator v2

Model ID – amazon.titan-image-generator-v2:0
Max. Eingabezeichen – 512 Zeichen
Max. Eingabebildgröße – 5 MB (nur einige spezifische Auflösungen werden unterstützt)
Maximale Bildgröße bei Verwendung in/outpainting, Entfernung des Hintergrunds, Bildbearbeitung, Farbpalette — 1.408 x 1.408 px
Maximale Bildgröße bei Verwendung von Bildvariationen — 1.408 x 1.408 px (die Größe des Eingabebilds wird so angepasst, dass es innerhalb dieses Grenzwerts liegt)
Sprachen: Englisch
Ausgabetyp: Bild
Unterstützte Bildtypen: JPEG, JPG, PNG
Inferenztypen —, Bereitgestellter Durchsatz On-Demand
Unterstützte Anwendungsfälle – Bilderzeugung, Bildbearbeitung, Bildvariationen, Entfernung des Hintergrunds, farbgesteuerte Inhalte

Features

Text-to-image (T2I) -Generierung — Geben Sie eine Textaufforderung ein und generieren Sie ein neues Bild als Ausgabe. Das generierte Bild erfasst die in der Textaufforderung beschriebenen Konzepte.
Feinabstimmung eines T2I-Modells: Importieren Sie mehrere Bilder, um Ihren eigenen persönlichen Stil zu erfassen, und optimieren Sie dann das T2I-Kernmodell. Das optimierte Modell generiert Bilder, die dem Stil und der Anpassung der Benutzer entsprechen.
Bildbearbeitungsoptionen: Dazu gehören Inpainting, Outpainting, Generierung von Variationen und automatische Bearbeitung ohne Bildmaske.
Inpainting: Verwendet ein Bild und eine Segmentierungsmaske als Eingabe (entweder vom/von der Benutzer:in oder vom Modell geschätzt) und rekonstruiert den Bereich innerhalb der Maske. Verwenden Sie Inpainting, um maskierte Elemente zu entfernen und sie durch Hintergrundpixel zu ersetzen.
Outpainting: Verwendet ein Bild und eine Segmentierungsmaske als Eingabe (entweder vom/von der Benutzer:in oder vom Modell geschätzt) und generiert neue Pixel, die den Bereich nahtlos erweitern. Erhalten Sie die Pixel des maskierten Bilds mit präzisem Outpainting, wenn das Bild über seine Ränder erweitert wird. Verwenden Sie das Standard-Outpainting, um die Pixel des maskierten Bilds auf der Grundlage der Segmentierungseinstellungen bis zu den Bildrändern zu erweitern.
Bildvariation – Verwendet ein bis fünf Bilder und einen optionalen Prompt als Eingabe. Es wird ein neues Bild generiert, das den Inhalt des Eingabebilds/der Eingabebilder beibehält, aber dessen Stil und Hintergrund variiert.
Bildkonditionierung – (nur V2) Verwendet ein eingegebenes Referenzbild zur Steuerung der Bildgenerierung. Das Modell erzeugt ein Ausgabebild, das mit dem Layout und der Komposition des Referenzbilds übereinstimmt und gleichzeitig dem Text-Prompt folgt.
Motivkonsistenz – (nur V2) Motivkonsistenz wird durch Optimierung des Modells mit Referenzbildern erreicht, um das ausgewählte Motiv (z. B. Haustier, Schuh oder Handtasche) in den generierten Bildern beizubehalten.
Farbgesteuerte Inhalte – (nur V2) Sie können eine Liste mit Hex-Farbcodes zusammen mit einem Prompt bereitstellen. Es kann ein Bereich von 1 bis 10 Hex-Codes angegeben werden. Das von Titan Image Generator G1 V2 zurückgegebene Bild enthält die vom Benutzer bereitgestellte Farbpalette.
Hintergrundentfernung – (nur V2) Identifiziert automatisch mehrere Objekte im Eingabebild und entfernt den Hintergrund. Das Ausgabebild hat einen transparenten Hintergrund.
Inhaltsherkunft – Sie können auch Websites wie Content Credentials Verify verwenden, um zu überprüfen, ob ein Bild von Titan Image Generator generiert wurde. Damit wird angezeigt, dass das Bild generiert wurde, es sei denn, die Metadaten wurden entfernt.

Anmerkung

Wenn Sie ein optimiertes Modell verwenden, können Sie die Features für Inpainting, Outpainting oder die Farbpalette der API oder des Modells nicht verwenden.

Parameters

Informationen zu den Modellinferenzparametern von Amazon Amazon Titan Image Generator G1 finden Sie unter Amazon Titan Image Generator G1-Modellinferenzparameter.

Fine-tuning

Weitere Informationen zur Feinabstimmung des Amazon Titan Image Generator G1-Modells finden Sie auf den folgenden Seiten.

Feinabstimmung und Preisgestaltung des Amazon Titan Image Generator G1-Modells

Das Modell verwendet die folgende Beispielformel, um den Gesamtpreis pro Auftrag zu berechnen:

Gesamtpreis = Schritte * Batchgröße * Preis pro betrachtetem Bild

Mindestwerte (automatisch):

Minimale Schritte (automatisch) – 500
Minimale Chargengröße – 8
Standardlernrate – 0,00001
Preis pro betrachtetem Bild – 0,005

Fine-tuning Hyperparameter-Einstellungen

Schritte – Häufigkeit, mit der das Modell den einzelnen Batches ausgesetzt wurde Es gibt keine Standardeinstellung für die Schrittanzahl. Sie müssen eine Zahl zwischen 10 und 40 000 oder den Zeichenkettenwert „Automatisch“ auswählen.

Schritteinstellungen – Automatisch – Amazon Bedrock ermittelt anhand von Trainingsinformationen einen angemessenen Wert. Wählen Sie diese Option, um der Modellleistung Vorrang vor den Schulungskosten einzuräumen. Die Anzahl der Schritte wird automatisch bestimmt. Diese Zahl liegt normalerweise zwischen 1 000 und 8 000, basierend auf Ihrem Datensatz. Die Auftragskosten werden durch die Anzahl der Schritte beeinflusst, die verwendet werden, um das Modell für die Daten verfügbar zu machen. Weitere Informationen zur Berechnung der Auftragskosten finden Sie im Abschnitt mit Preisbeispielen in den Preisdetails. (Anhand der Beispieltabelle oben können Sie ermitteln, wie die Schrittzahl mit der Anzahl der Bilder zusammenhängt, wenn „Auto“ ausgewählt ist.)

Schritteinstellungen – Benutzerdefiniert – Sie können die Anzahl der Schritte eingeben, mit der Bedrock Ihr benutzerdefiniertes Modell für die Trainingsdaten verfügbar machen soll. Dieser Wert muss zwischen 10 und 40 000 liegen. Sie können die Kosten pro Bild, das vom Modell erzeugt wurde, reduzieren, indem Sie einen niedrigeren Wert für die Anzahl der Schritte verwenden.

Batch-Größe – Die Anzahl der Stichproben, die vor der Aktualisierung der Modellparameter verarbeitet wurden. Dieser Wert liegt zwischen 8 und 192 und ist ein Vielfaches von 8.

Lernrate – Die Geschwindigkeit, mit der Modellparameter nach jedem Batch von Trainingsdaten aktualisiert werden. Dies ist ein Gleitkommawert zwischen 0 und 1. Die Lernrate ist standardmäßig auf 0,00001 festgelegt.

Weitere Informationen zum Feinabstimmungsverfahren finden Sie unter Einreichen eines Modellanpassungsauftrags.

Ausgabe

Das Modell Amazon Titan Image Generator G1 verwendet die Größe und Qualität des Ausgabebilds, um den Preis für ein Bild zu bestimmen. Das Modell hat je nach Größe zwei Preissegmente: eines für 512*512 Bilder und eines für 1024*1024 Bilder. Die Preisgestaltung basiert auf der Bildgröße (Höhe*Breite), die mindestens 512*512 entspricht oder größer als 512*512 ist.

Weitere Informationen zu den Preisen von Amazon Bedrock finden Sie unter Amazon Bedrock – Preise.

Wasserzeichenerkennung

Anmerkung

Die Wasserzeichenerkennung für die Amazon Bedrock-Konsole und API ist in der öffentlichen Vorschauversion verfügbar und erkennt Wasserzeichen, die mit Titan Image Generator G1 und Canvas generiert wurden. Amazon Nova Dieses Feature ist derzeit nur in den Regionen us-west-2 und us-east-1 verfügbar. Die Wasserzeichenerkennung ist eine hochgenaue Erkennung des von diesen Modellen generierten Wasserzeichens. Bilder, die gegenüber dem vom Modell generierten Originalbild verändert wurden, führen möglicherweise zu weniger genauen Ergebnissen.

Diese Modelle fügen allen generierten Bildern ein unsichtbares Wasserzeichen hinzu, um die Verbreitung von Fehlinformationen zu reduzieren, den Urheberrechtsschutz zu unterstützen und die Nutzung von Inhalten nachzuverfolgen. Mithilfe der Wasserzeichenerkennung können Sie überprüfen, ob ein Bild mit Titan Image Generator G1 oder Amazon Nova Canvas generiert wurde, der das Vorhandensein dieses Wasserzeichens überprüft.

Anmerkung

Die API zur Erkennung von Wasserzeichen befindet sich in der Vorschauversion und unterliegt Änderungen. Wir empfehlen, dass Sie virtuelle Umgebung erstellen, um das SDK zu verwenden. Da APIs zur Erkennung von Wasserzeichen in den neuesten SDKs nicht verfügbar sind, empfehlen wir, die neueste Version des SDK aus der virtuellen Umgebung zu deinstallieren, bevor Sie die Version mit den APIs zur Erkennung von Wasserzeichen installieren.

Sie können Ihr Bild hochladen, um festzustellen, ob ein Wasserzeichen von Titan Image Generator G1 oder Amazon Nova Canvas auf dem Bild vorhanden ist. Verwenden Sie die Konsole, um ein Wasserzeichen zu erkennen, indem Sie die folgenden Schritte ausführen.

So erkennen Sie ein Wasserzeichen:

Öffnen Sie die Amazon-Bedrock-Konsole unter Amazon-Bedrock-Konsole.
Wählen Sie im Navigationsbereich von Amazon Bedrock die Option Übersicht aus. Wählen Sie die Registerkarte Erstellen und testen aus.
Gehen Sie im Abschnitt Schutzmaßnahmen zu Wasserzeichenerkennung und wählen Sie Wasserzeichenerkennung anzeigen aus.
Wählen Sie Bild hochladen aus, und suchen Sie nach einer Datei im JPG- oder PNG-Format. Die maximal zulässige Dateigröße beträgt 18 MB.
Nach dem Hochladen wird eine Miniaturansicht des Bilds mit dem Namen, der Dateigröße und dem Datum der letzten Änderung angezeigt. Wählen Sie X, um das Bild aus dem Abschnitt Upload zu löschen oder zu ersetzen.
Wählen Sie Analysieren aus, um mit der Analyse der Wasserzeichenerkennung zu beginnen.
Das Bild wird unter Ergebnisse in der Vorschau angezeigt und gibt an, ob ein Wasserzeichen erkannt wurde, indem unter dem Bild Wasserzeichen erkannt und über dem Bild ein Banner angezeigt wird. Wenn kein Wasserzeichen erkannt wurde, wird unter dem Bild der Text Wasserzeichen NICHT erkannt angezeigt.
Um das nächste Bild zu laden, wählen Sie X in der Miniaturansicht des Bilds im Abschnitt Upload und ein neues Bild zur Analyse aus.

Prompt-Engineering-Richtlinien

Maskenaufforderung: Dieser Algorithmus unterteilt Pixel in Konzepte. Benutzer können eine Texteingabeaufforderung eingeben, die basierend auf der Interpretation der Maskenaufforderung die Bereiche des Bilds, die maskiert werden sollen, klassifiziert. Mit der Eingabeaufforderungsoption können komplexere Prompts interpretiert und die Maske im Segmentierungsalgorithmus kodiert werden.

Bildmaske: Sie können auch eine Bildmaske verwenden, um die Maskenwerte festzulegen. Die Bildmaske kann zur Verbesserung der Genauigkeit mit dem Prompt für die Maske kombiniert werden. Die Bildmaskendatei muss den folgenden Parametern entsprechen:

Die Maskenbildwerte müssen für das Maskenbild 0 (schwarz) oder 255 (weiß) sein. Der Bildmaskenbereich mit dem Wert 0 wird mit dem Bild aus dem and/or Eingabebild der Benutzereingabe regeneriert.
Das Feld maskImage muss eine base64-kodierte Bildzeichenfolge sein.
Das Maskenbild muss dieselben Abmessungen wie das Eingabebild haben (gleiche Höhe und Breite).
Für das Eingabebild und das Maskenbild können nur PNG- oder JPG-Dateien verwendet werden.
Das Maskenbild darf nur schwarze und weiße Pixelwerte verwenden.
Das Maskenbild kann nur die RGB-Kanäle verwenden (Alphakanal wird nicht unterstützt).

Weitere Informationen zum Prompt-Engineering für Amazon Titan Image Generator finden Sie unter Best Practices für Prompt-Engineering für Modelle von Amazon Titan Image Generator G1.

Allgemeine Prompt-Engineering-Richtlinien finden Sie unter Prompt-Engineering-Richtlinien.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Multimodale Einbettungen G1

Ältere Seiten