Preparazione dei dati per il fine-tuning dei modelli di generazione di contenuti creativi
Di seguito sono riportate le linee guida e i requisiti per la preparazione dei dati per il fine-tuning dei modelli di generazione di contenuti creativi
-
La quantità ottimale di dati di addestramento dipende dalla complessità dell’attività e dall’esito desiderato.
-
L’aumento della varietà e del volume dei dati di addestramento può migliorare la precisione del modello.
-
Maggiore è il numero di immagini utilizzate, maggiore è il tempo necessario per il completamento del fine-tuning del processo.
-
Il numero di immagini aumenta i costi del fine-tuning. Per ulteriori informazioni, consulta Amazon Bedrock Pricing
.
-
-
I set di dati di addestramento e convalida devono essere file JSONL, in cui ogni riga è un oggetto JSON corrispondente a un record. Questi nomi di file possono essere composti solo da caratteri alfanumerici, trattini, trattini bassi, barre e punti.
-
Ogni record nel tuo JSONL deve includere un attributo
image-refcon l’URI Amazon S3 per un’immagine, e un attributocaptioncon un prompt per l’immagine. L’immagine deve essere in formato PNG o JPEG. Per degli esempi, consulta Formato del set di dati richiesto. -
I tuoi set di dati di addestramento e convalida devono essere conformi ai requisiti di dimensione elencati in Vincoli dei set di dati.
-
Il tuo ruolo di servizio Amazon Bedrock deve essere in grado di accedere ai file di immagine in Amazon S3. Per ulteriori informazioni sulla concessione dell’accesso, consulta Create a service role for model customization.
Formato del set di dati richiesto
Di seguito viene illustrato il formato richiesto per i file JSONL.
{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}
Di seguito è riportato un record di esempio.
{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}
Vincoli dei set di dati
Di seguito sono riportati i vincoli dei set di dati per il fine-tuning di Amazon Nova Canvas. Amazon Nova Reel non supporta il fine-tuning.
Requisiti di dimensione per i set di dati di addestramento e convalida
Minimo |
Massimo |
|
|---|---|---|
Record in un set di dati di addestramento |
5 |
10.000 |
Lunghezza del prompt di testo nell’esempio di addestramento, in caratteri |
3 |
1.024 |
Limiti di dimensione dell’immagine di input
Minimo |
Massimo |
|
|---|---|---|
| Input image size | 0 | 50 MB |
| Input image height in pixels | 512 | 4,096 |
| Input image width in pixels | 512 | 4,096 |
| Input image total pixels | 0 | 12,582,912 |
| Input image aspect ratio | 1:4 | 4:1 |
Formati multimediali supportati
-
PNG
-
JPEG