Übersicht über Modelle von Amazon Titan Image Generator G1 - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Übersicht über Modelle von Amazon Titan Image Generator G1

Amazon Titan Image Generator G1 ist ein Modell zur Bildgenerierung. Es sind zwei Versionen verfügbar: v1 und v2.

Amazon Titan Image Generator v1 ermöglicht es Benutzern, Bilder auf vielfältige Weise zu generieren und zu bearbeiten. Benutzer können Bilder erstellen, die ihren textbasierten Beschreibungen entsprechen, indem sie die entsprechenden Prompts in natürlicher Sprache eingeben. Darüber hinaus können sie vorhandene Bilder hochladen und bearbeiten, einschließlich der Anwendung textbasierter Prompts ohne die Notwendigkeit einer Maske oder der Bearbeitung bestimmter Teile eines Bilds mithilfe einer Bildmaske. Das Modell unterstützt auch das Outpainting, das die Grenzen eines Bilds erweitert, und das Inpainting, das fehlende Bereiche ausfüllt. Es bietet die Möglichkeit, Variationen eines Bilds auf der Grundlage eines optionalen Text-Prompts zu generieren, sowie sofortige Anpassungsoptionen, mit denen Benutzer Stile anhand von Referenzbildern übertragen oder Stile aus mehreren Referenzen kombinieren können, ohne dass eine Feinabstimmung erforderlich ist.

Titan Image Generator v2 unterstützt alle bestehenden Features von Titan Image Generator v1 und bietet darüber hinaus mehrere neue Features. So können Benutzer Referenzbilder zur Steuerung der Bilderzeugung nutzen, wobei das Ausgabebild dem Layout und der Komposition des Referenzbildes entspricht und gleichzeitig dem Text-Prompt folgt. Es umfasst auch Features für automatische Hintergrundentfernung, die Hintergründe aus Bildern mit mehreren Objekten ohne Benutzereingaben entfernen kann. Das Modell ermöglicht eine präzise Steuerung der Farbpalette der generierten Bilder, sodass Benutzer die visuelle Identität einer Marke ohne zusätzliche Feinabstimmungen beibehalten können. Darüber hinaus ermöglicht das Feature „Motivkonsistenz“ den Benutzern, das Modell anhand von Referenzbildern zu optimieren, um das ausgewählte Motiv (z. B. Haustier, Schuh oder Handtasche) in den generierten Bildern beizubehalten. Diese umfassende Reihe von Features ermöglicht es Benutzern, ihr kreatives Potenzial zu entfalten und ihre fantasievollen Visionen zum Leben zu erwecken.

Weitere Informationen zu den Modellen von Amazon Titan Image Generator G1 finden Sie unter Best Practices für Prompt-Engineering für Amazon Titan Image Generator.

Um weiterhin Best Practices für den verantwortungsvollen Umgang mit KI zu unterstützen, sind Titan Basismodelle (FMs) darauf ausgelegt, schädliche Inhalte in den Daten zu erkennen und zu entfernen, unangemessene Inhalte in der Benutzereingabe zurückzuweisen und die Ausgaben der Modelle zu filtern, die unangemessene Inhalte (wie Hassreden, Obszönitäten und Gewalt) enthalten. Der Titan Image Generator FM fügt allen generierten Bildern ein unsichtbares Wasserzeichen und C2PA-Metadaten hinzu.

Sie können das Feature für die Erkennung von Wasserzeichen in der Amazon-Bedrock-Konsole verwenden oder die API (Vorschau) für Wasserzeichenerkennung von Amazon Bedrock aufrufen, um zu überprüfen, ob ein Bild Wasserzeichen von Titan Image Generator enthält. Sie können auch Websites wie Content Credentials Verify verwenden, um zu überprüfen, ob ein Bild von Titan Image Generator generiert wurde.

Übersicht über Amazon Titan Image Generator v1

  • Model ID – amazon.titan-image-generator-v1

  • Max. Eingabezeichen – 512 Zeichen

  • Max. Eingabebildgröße – 5 MB (nur einige spezifische Auflösungen werden unterstützt)

  • Max. Bildgröße bei In-/Outpainting – 1 408 x 1 408 px

  • Maximale Bildgröße bei Verwendung der Bildvariation – 4 096 x 4 096 px

  • Sprachen: Englisch

  • Ausgabetyp: Bild

  • Unterstützte Bildtypen: JPEG, JPG, PNG

  • Inferenztypen: Auf Abruf bereitgestellter Durchsatz

  • Unterstützte Anwendungsfälle: Bilderzeugung, Bildbearbeitung, Bildvariationen

Übersicht über Amazon Titan Image Generator v2

  • Model ID – amazon.titan-image-generator-v2:0

  • Max. Eingabezeichen – 512 Zeichen

  • Max. Eingabebildgröße – 5 MB (nur einige spezifische Auflösungen werden unterstützt)

  • Max. Bildgröße bei In-/Outpainting, Entfernung des Hintergrunds, Bildkonditionierung, Farbpalette –1 408 x 1 408 px

  • Maximale Bildgröße bei Verwendung der Bildvariation – 4 096 x 4 096 px

  • Sprachen: Englisch

  • Ausgabetyp: Bild

  • Unterstützte Bildtypen: JPEG, JPG, PNG

  • Inferenztypen – Auf Abruf bereitgestellter Durchsatz

  • Unterstützte Anwendungsfälle – Bilderzeugung, Bildbearbeitung, Bildvariationen, Entfernung des Hintergrunds, farbgesteuerte Inhalte

Features

  • Generierung von Text zu Bild (T2I): Geben Sie eine Textaufforderung ein und generieren Sie ein neues Bild als Ausgabe. Das generierte Bild erfasst die in der Textaufforderung beschriebenen Konzepte.

  • Feinabstimmung eines T2I-Modells: Importieren Sie mehrere Bilder, um Ihren eigenen persönlichen Stil zu erfassen, und optimieren Sie dann das T2I-Kernmodell. Das optimierte Modell generiert Bilder, die dem Stil und der Anpassung der Benutzer entsprechen.

  • Bildbearbeitungsoptionen: Dazu gehören Inpainting, Outpainting, Generierung von Variationen und automatische Bearbeitung ohne Bildmaske.

  • Inpainting: Verwendet ein Bild und eine Segmentierungsmaske als Eingabe (entweder vom/von der Benutzer:in oder vom Modell geschätzt) und rekonstruiert den Bereich innerhalb der Maske. Verwenden Sie Inpainting, um maskierte Elemente zu entfernen und sie durch Hintergrundpixel zu ersetzen.

  • Outpainting: Verwendet ein Bild und eine Segmentierungsmaske als Eingabe (entweder vom/von der Benutzer:in oder vom Modell geschätzt) und generiert neue Pixel, die den Bereich nahtlos erweitern. Erhalten Sie die Pixel des maskierten Bilds mit präzisem Outpainting, wenn das Bild über seine Ränder erweitert wird. Verwenden Sie das Standard-Outpainting, um die Pixel des maskierten Bilds auf der Grundlage der Segmentierungseinstellungen bis zu den Bildrändern zu erweitern.

  • Bildvariation – Verwendet ein bis fünf Bilder und einen optionalen Prompt als Eingabe. Es wird ein neues Bild generiert, das den Inhalt des Eingabebilds/der Eingabebilder beibehält, aber dessen Stil und Hintergrund variiert.

  • Bildkonditionierung – (nur V2) Verwendet ein eingegebenes Referenzbild zur Steuerung der Bildgenerierung. Das Modell erzeugt ein Ausgabebild, das mit dem Layout und der Komposition des Referenzbilds übereinstimmt und gleichzeitig dem Text-Prompt folgt.

  • Motivkonsistenz – (nur V2) Motivkonsistenz wird durch Optimierung des Modells mit Referenzbildern erreicht, um das ausgewählte Motiv (z. B. Haustier, Schuh oder Handtasche) in den generierten Bildern beizubehalten.

  • Farbgesteuerte Inhalte – (nur V2) Sie können eine Liste mit Hex-Farbcodes zusammen mit einem Prompt bereitstellen. Es kann ein Bereich von 1 bis 10 Hex-Codes angegeben werden. Das von Titan Image Generator G1 V2 zurückgegebene Bild enthält die vom Benutzer bereitgestellte Farbpalette.

  • Hintergrundentfernung – (nur V2) Identifiziert automatisch mehrere Objekte im Eingabebild und entfernt den Hintergrund. Das Ausgabebild hat einen transparenten Hintergrund.

  • Inhaltsherkunft – Sie können auch Websites wie Content Credentials Verify verwenden, um zu überprüfen, ob ein Bild von Titan Image Generator generiert wurde. Damit wird angezeigt, dass das Bild generiert wurde, es sei denn, die Metadaten wurden entfernt.

Anmerkung

Wenn Sie ein optimiertes Modell verwenden, können Sie die Features für Inpainting, Outpainting oder die Farbpalette der API oder des Modells nicht verwenden.

Parameter

Informationen zu den Inferenzparametern der Modelle von Amazon Titan Image Generator G1 finden Sie unter Inferenzparameter der Modelle von Amazon Titan Image Generator G1.

Feinabstimmung

Weitere Informationen zur Feinabstimmung der G1-Modelle von Amazon Titan Image Generator finden Sie auf den folgenden Seiten.

Feinabstimmung und Preise der Modelle von Amazon Titan Image Generator G1

Das Modell verwendet die folgende Beispielformel, um den Gesamtpreis pro Auftrag zu berechnen:

Gesamtpreis = Schritte * Batchgröße * Preis pro betrachtetem Bild

Mindestwerte (automatisch):

  • Minimale Schritte (automatisch) – 500

  • Minimale Chargengröße – 8

  • Standardlernrate – 0,00001

  • Preis pro betrachtetem Bild – 0,005

Feinabstimmung der Hyperparameter-Einstellungen

Schritte – Häufigkeit, mit der das Modell den einzelnen Batches ausgesetzt wurde Es gibt keine Standardeinstellung für die Schrittanzahl. Sie müssen eine Zahl zwischen 10 und 40 000 oder den Zeichenkettenwert „Automatisch“ auswählen.

Schritteinstellungen – Automatisch – Amazon Bedrock ermittelt anhand von Trainingsinformationen einen angemessenen Wert. Wählen Sie diese Option, um der Modellleistung Vorrang vor den Schulungskosten einzuräumen. Die Anzahl der Schritte wird automatisch bestimmt. Diese Zahl liegt normalerweise zwischen 1 000 und 8 000, basierend auf Ihrem Datensatz. Die Auftragskosten werden durch die Anzahl der Schritte beeinflusst, die verwendet werden, um das Modell für die Daten verfügbar zu machen. Weitere Informationen zur Berechnung der Auftragskosten finden Sie im Abschnitt mit Preisbeispielen in den Preisdetails. (Anhand der Beispieltabelle oben können Sie ermitteln, wie die Schrittzahl mit der Anzahl der Bilder zusammenhängt, wenn „Auto“ ausgewählt ist.)

Schritteinstellungen – Benutzerdefiniert – Sie können die Anzahl der Schritte eingeben, mit der Bedrock Ihr benutzerdefiniertes Modell für die Trainingsdaten verfügbar machen soll. Dieser Wert muss zwischen 10 und 40 000 liegen. Sie können die Kosten pro Bild, das vom Modell erzeugt wurde, reduzieren, indem Sie einen niedrigeren Wert für die Anzahl der Schritte verwenden.

Batch-Größe – Die Anzahl der Stichproben, die vor der Aktualisierung der Modellparameter verarbeitet wurden. Dieser Wert liegt zwischen 8 und 192 und ist ein Vielfaches von 8.

Lernrate – Die Geschwindigkeit, mit der Modellparameter nach jedem Batch von Trainingsdaten aktualisiert werden. Dies ist ein Gleitkommawert zwischen 0 und 1. Die Lernrate ist standardmäßig auf 0,00001 festgelegt.

Weitere Informationen zum Feinabstimmungsverfahren finden Sie unter Einreichen eines Modellanpassungsauftrags.

Output

Modelle von Amazon Titan Image Generator G1 verwenden die Größe und Qualität des Ausgabebilds, um den Preis für ein Bild zu bestimmen. Modelle von Amazon Titan Image Generator G1 haben je nach Größe zwei Preissegmente: eines für 512*512-Bilder und eines für 1024*1024-Bilder. Die Preisgestaltung basiert auf der Bildgröße (Höhe*Breite), die mindestens 512*512 entspricht oder größer als 512*512 ist.

Weitere Informationen zu den Preisen von Amazon Bedrock finden Sie unter Amazon Bedrock – Preise.

Wasserzeichenerkennung

Anmerkung

Die Wasserzeichenerkennung für die Amazon-Bedrock-Konsole und -API ist in der öffentlichen Vorschauversion verfügbar und erkennt nur Wasserzeichen, die mit Titan Image Generator G1 generiert wurden. Dieses Feature ist derzeit nur in den Regionen us-west-2 und us-east-1 verfügbar. Die Wasserzeichenerkennung ist eine hochpräzise Erkennung des mit Titan Image Generator G1 generierten Wasserzeichens. Bilder, die gegenüber dem vom Modell generierten Originalbild verändert wurden, führen möglicherweise zu weniger genauen Ergebnissen.

Dieses Modell fügt allen generierten Bildern ein unsichtbares Wasserzeichen hinzu, um die Verbreitung von Desinformationen zu reduzieren, den Urheberrechtsschutz zu unterstützen und die Nutzung von Inhalten zu verfolgen. Mithilfe der Wasserzeichenerkennung können Sie überprüfen, ob ein Bild mit dem Modell von Titan Image Generator G1 generiert wurde, das überprüft, ob dieses Wasserzeichen vorhanden ist.

Anmerkung

Die API zur Erkennung von Wasserzeichen befindet sich in der Vorschauversion und unterliegt Änderungen. Wir empfehlen, dass Sie virtuelle Umgebung erstellen, um das SDK zu verwenden. Da APIs zur Erkennung von Wasserzeichen in den neuesten SDKs nicht verfügbar sind, empfehlen wir, die neueste Version des SDK aus der virtuellen Umgebung zu deinstallieren, bevor Sie die Version mit den APIs zur Erkennung von Wasserzeichen installieren.

Sie können Ihr Bild hochladen, um festzustellen, ob ein Wasserzeichen von Titan Image Generator G1 auf dem Bild vorhanden ist. Verwenden Sie die Konsole, um ein Wasserzeichen von diesem Modell zu erkennen, indem Sie die folgenden Schritte ausführen.

So erkennen Sie ein Wasserzeichen mit Titan Image Generator G1:
  1. Öffnen Sie die Amazon-Bedrock-Konsole unter Amazon-Bedrock-Konsole.

  2. Wählen Sie im Navigationsbereich von Amazon Bedrock die Option Übersicht aus. Wählen Sie die Registerkarte Erstellen und testen aus.

  3. Gehen Sie im Abschnitt Schutzmaßnahmen zu Wasserzeichenerkennung und wählen Sie Wasserzeichenerkennung anzeigen aus.

  4. Wählen Sie Bild hochladen aus, und suchen Sie nach einer Datei im JPG- oder PNG-Format. Die maximal zulässige Dateigröße beträgt 5 MB.

  5. Nach dem Hochladen wird eine Miniaturansicht des Bilds mit dem Namen, der Dateigröße und dem Datum der letzten Änderung angezeigt. Wählen Sie X, um das Bild aus dem Abschnitt Upload zu löschen oder zu ersetzen.

  6. Wählen Sie Analysieren aus, um mit der Analyse der Wasserzeichenerkennung zu beginnen.

  7. Das Bild wird unter Ergebnisse in der Vorschau angezeigt und gibt an, ob ein Wasserzeichen erkannt wurde, indem unter dem Bild Wasserzeichen erkannt und über dem Bild ein Banner angezeigt wird. Wenn kein Wasserzeichen erkannt wurde, wird unter dem Bild der Text Wasserzeichen NICHT erkannt angezeigt.

  8. Um das nächste Bild zu laden, wählen Sie X in der Miniaturansicht des Bilds im Abschnitt Upload und ein neues Bild zur Analyse aus.

Prompt-Engineering-Richtlinien

Maskenaufforderung: Dieser Algorithmus unterteilt Pixel in Konzepte. Benutzer können eine Texteingabeaufforderung eingeben, die basierend auf der Interpretation der Maskenaufforderung die Bereiche des Bilds, die maskiert werden sollen, klassifiziert. Mit der Eingabeaufforderungsoption können komplexere Prompts interpretiert und die Maske im Segmentierungsalgorithmus kodiert werden.

Bildmaske: Sie können auch eine Bildmaske verwenden, um die Maskenwerte festzulegen. Die Bildmaske kann zur Verbesserung der Genauigkeit mit dem Prompt für die Maske kombiniert werden. Die Bildmaskendatei muss den folgenden Parametern entsprechen:

  • Die Maskenbildwerte müssen für das Maskenbild 0 (schwarz) oder 255 (weiß) sein. Der Bildmaskenbereich mit dem Wert 0 wird mit dem Bild aus der Benutzeraufforderung und/oder dem Eingabebild regeneriert.

  • Das Feld maskImage muss eine base64-kodierte Bildzeichenfolge sein.

  • Das Maskenbild muss dieselben Abmessungen wie das Eingabebild haben (gleiche Höhe und Breite).

  • Für das Eingabebild und das Maskenbild können nur PNG- oder JPG-Dateien verwendet werden.

  • Das Maskenbild darf nur schwarze und weiße Pixelwerte verwenden.

  • Das Maskenbild kann nur die RGB-Kanäle verwenden (Alphakanal wird nicht unterstützt).

Weitere Informationen zum Prompt-Engineering für Amazon Titan Image Generator finden Sie unter Best Practices für Prompt-Engineering für Modelle von Amazon Titan Image Generator G1.

Allgemeine Prompt-Engineering-Richtlinien finden Sie unter Prompt-Engineering-Richtlinien.