Vorbereitung von Daten für die Feinabstimmung von Modellen zur Generierung kreativer Inhalte
Im Folgenden finden Sie Richtlinien und Anforderungen für die Vorbereitung von Daten für die Feinabstimmung von Modellen zur Generierung kreativer Inhalte.
-
Die optimale Menge an Trainingsdaten hängt von der Komplexität der Aufgabe und dem gewünschten Ergebnis ab.
-
Die Erhöhung der Vielfalt und des Umfangs Ihrer Trainingsdaten kann die Genauigkeit des Modells verbessern.
-
Je mehr Bilder Sie verwenden, desto länger kann es dauern, bis die Feinabstimmung abgeschlossen ist.
-
Die Anzahl der Bilder erhöht die Kosten für die Feinabstimmung. Weitere Informationen finden Sie unter Amazon-Bedrock-Preise
.
-
-
Trainings- und Validierungsdatensätze müssen JSONL-Dateien sein, wobei jede Zeile ein JSON-Objekt darstellt, das einem Datensatz entspricht. Diese Dateinamen dürfen nur aus alphanumerischen Zeichen, Unterstrichen, Bindestrichen, Schrägstrichen und Punkten bestehen.
-
Jeder Datensatz in Ihrer JSONL-Datei muss ein
image-ref-Attribut mit der Amazon-S3-URI für ein Bild und eincaption-Attribut mit einem Prompt für das Bild enthalten. Die Bilder müssen im JPEG- oder PNG-Format vorliegen. Beispiele finden Sie unter Erforderliches Datensatzformat. -
Ihre Trainings- und Validierungsdatensätze müssen den in Einschränkungen für Datensätze aufgeführten Größenanforderungen entsprechen.
-
Ihre Amazon-Bedrock-Servicerolle muss in der Lage sein, auf die Bilddateien in Amazon S3 zuzugreifen. Weitere Informationen über die Gewährung von Zugriffsrechten finden Sie unter Eine Servicerolle für die Modellanpassung erstellen.
Erforderliches Datensatzformat
Im Folgenden wird das erforderliche Format für Ihre JSONL-Dateien gezeigt.
{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}
Nachfolgend finden Sie ein Beispiel für einen Datensatz:
{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}
Einschränkungen für Datensätze
Im Folgenden werden die Einschränkungen für Datensätze zur Feinabstimmung von Amazon Nova Canvas aufgeführt. Amazon Nova Reel unterstützt keine Feinabstimmung.
Größenanforderungen für Trainings- und Validierungsdatensätze
Minimum |
Maximum |
|
|---|---|---|
Einträge in einem Trainingsdatensatz |
5 |
10 000 |
Länge der Text-Prompts im Trainingsbeispiel, in Zeichen |
3 |
1,024 |
Größenbeschränkungen für das Eingabebild
Minimum |
Maximum |
|
|---|---|---|
| Input image size | 0 | 50 MB |
| Input image height in pixels | 512 | 4,096 |
| Input image width in pixels | 512 | 4,096 |
| Input image total pixels | 0 | 12,582,912 |
| Input image aspect ratio | 1:4 | 4:1 |
Unterstützte Medienformate
-
PNG
-
JPEG