Preparazione dei dati per il fine-tuning dei modelli di generazione di contenuti creativi - Amazon Nova

Preparazione dei dati per il fine-tuning dei modelli di generazione di contenuti creativi

Di seguito sono riportate le linee guida e i requisiti per la preparazione dei dati per il fine-tuning dei modelli di generazione di contenuti creativi

  1. La quantità ottimale di dati di addestramento dipende dalla complessità dell’attività e dall’esito desiderato.

    • L’aumento della varietà e del volume dei dati di addestramento può migliorare la precisione del modello.

    • Maggiore è il numero di immagini utilizzate, maggiore è il tempo necessario per il completamento del fine-tuning del processo.

    • Il numero di immagini aumenta i costi del fine-tuning. Per ulteriori informazioni, consulta Amazon Bedrock Pricing.

  2. I set di dati di addestramento e convalida devono essere file JSONL, in cui ogni riga è un oggetto JSON corrispondente a un record. Questi nomi di file possono essere composti solo da caratteri alfanumerici, trattini, trattini bassi, barre e punti.

  3. Ogni record nel tuo JSONL deve includere un attributo image-ref con l’URI Amazon S3 per un’immagine, e un attributo caption con un prompt per l’immagine. L’immagine deve essere in formato PNG o JPEG. Per degli esempi, consulta Formato del set di dati richiesto.

  4. I tuoi set di dati di addestramento e convalida devono essere conformi ai requisiti di dimensione elencati in Vincoli dei set di dati.

  5. Il tuo ruolo di servizio Amazon Bedrock deve essere in grado di accedere ai file di immagine in Amazon S3. Per ulteriori informazioni sulla concessione dell’accesso, consulta Create a service role for model customization.

Formato del set di dati richiesto

Di seguito viene illustrato il formato richiesto per i file JSONL.

{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}

Di seguito è riportato un record di esempio.

{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}

Vincoli dei set di dati

Di seguito sono riportati i vincoli dei set di dati per il fine-tuning di Amazon Nova Canvas. Amazon Nova Reel non supporta il fine-tuning.

Requisiti di dimensione per i set di dati di addestramento e convalida

Minimo

Massimo

Record in un set di dati di addestramento

5

10.000

Lunghezza del prompt di testo nell’esempio di addestramento, in caratteri

3

1.024

Limiti di dimensione dell’immagine di input

Minimo

Massimo

Input image size 0 50 MB
Input image height in pixels 512 4,096
Input image width in pixels 512 4,096
Input image total pixels 0 12,582,912
Input image aspect ratio 1:4 4:1

Formati multimediali supportati

  • PNG

  • JPEG