Vorbereitung von Daten für die Feinabstimmung von Modellen zur Generierung kreativer Inhalte - Amazon Nova

Vorbereitung von Daten für die Feinabstimmung von Modellen zur Generierung kreativer Inhalte

Im Folgenden finden Sie Richtlinien und Anforderungen für die Vorbereitung von Daten für die Feinabstimmung von Modellen zur Generierung kreativer Inhalte.

  1. Die optimale Menge an Trainingsdaten hängt von der Komplexität der Aufgabe und dem gewünschten Ergebnis ab.

    • Die Erhöhung der Vielfalt und des Umfangs Ihrer Trainingsdaten kann die Genauigkeit des Modells verbessern.

    • Je mehr Bilder Sie verwenden, desto länger kann es dauern, bis die Feinabstimmung abgeschlossen ist.

    • Die Anzahl der Bilder erhöht die Kosten für die Feinabstimmung. Weitere Informationen finden Sie unter Amazon-Bedrock-Preise.

  2. Trainings- und Validierungsdatensätze müssen JSONL-Dateien sein, wobei jede Zeile ein JSON-Objekt darstellt, das einem Datensatz entspricht. Diese Dateinamen dürfen nur aus alphanumerischen Zeichen, Unterstrichen, Bindestrichen, Schrägstrichen und Punkten bestehen.

  3. Jeder Datensatz in Ihrer JSONL-Datei muss ein image-ref-Attribut mit der Amazon-S3-URI für ein Bild und ein caption-Attribut mit einem Prompt für das Bild enthalten. Die Bilder müssen im JPEG- oder PNG-Format vorliegen. Beispiele finden Sie unter Erforderliches Datensatzformat.

  4. Ihre Trainings- und Validierungsdatensätze müssen den in Einschränkungen für Datensätze aufgeführten Größenanforderungen entsprechen.

  5. Ihre Amazon-Bedrock-Servicerolle muss in der Lage sein, auf die Bilddateien in Amazon S3 zuzugreifen. Weitere Informationen über die Gewährung von Zugriffsrechten finden Sie unter Eine Servicerolle für die Modellanpassung erstellen.

Erforderliches Datensatzformat

Im Folgenden wird das erforderliche Format für Ihre JSONL-Dateien gezeigt.

{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}

Nachfolgend finden Sie ein Beispiel für einen Datensatz:

{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}

Einschränkungen für Datensätze

Im Folgenden werden die Einschränkungen für Datensätze zur Feinabstimmung von Amazon Nova Canvas aufgeführt. Amazon Nova Reel unterstützt keine Feinabstimmung.

Größenanforderungen für Trainings- und Validierungsdatensätze

Minimum

Maximum

Einträge in einem Trainingsdatensatz

5

10 000

Länge der Text-Prompts im Trainingsbeispiel, in Zeichen

3

1,024

Größenbeschränkungen für das Eingabebild

Minimum

Maximum

Input image size 0 50 MB
Input image height in pixels 512 4,096
Input image width in pixels 512 4,096
Input image total pixels 0 12,582,912
Input image aspect ratio 1:4 4:1

Unterstützte Medienformate

  • PNG

  • JPEG