Formato del set di dati richiesto Vincoli dei set di dati

Preparazione dei dati per il fine-tuning dei modelli di generazione di contenuti creativi

Di seguito sono riportate le linee guida e i requisiti per la preparazione dei dati per il fine-tuning dei modelli di generazione di contenuti creativi

La quantità ottimale di dati di addestramento dipende dalla complessità dell’attività e dall’esito desiderato.
- L’aumento della varietà e del volume dei dati di addestramento può migliorare la precisione del modello.
- Maggiore è il numero di immagini utilizzate, maggiore è il tempo necessario per il completamento del fine-tuning del processo.
- Il numero di immagini aumenta i costi del fine-tuning. Per ulteriori informazioni, consulta Amazon Bedrock Pricing.
I set di dati di addestramento e convalida devono essere file JSONL, in cui ogni riga è un oggetto JSON corrispondente a un record. Questi nomi di file possono essere composti solo da caratteri alfanumerici, trattini, trattini bassi, barre e punti.
Ogni record nel tuo JSONL deve includere un attributo image-ref con l’URI Amazon S3 per un’immagine, e un attributo caption con un prompt per l’immagine. L’immagine deve essere in formato PNG o JPEG. Per degli esempi, consulta Formato del set di dati richiesto.
I tuoi set di dati di addestramento e convalida devono essere conformi ai requisiti di dimensione elencati in Vincoli dei set di dati.
Il tuo ruolo di servizio Amazon Bedrock deve essere in grado di accedere ai file di immagine in Amazon S3. Per ulteriori informazioni sulla concessione dell’accesso, consulta Create a service role for model customization.

Formato del set di dati richiesto

Di seguito viene illustrato il formato richiesto per i file JSONL.


{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"}
{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"}
{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}

Di seguito è riportato un record di esempio.


{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}

Vincoli dei set di dati

Di seguito sono riportati i vincoli dei set di dati per il fine-tuning di Amazon Nova Canvas. Amazon Nova Reel non supporta il fine-tuning.

Requisiti di dimensione per i set di dati di addestramento e convalida

	Minimo	Massimo
Record in un set di dati di addestramento	5	10.000
Lunghezza del prompt di testo nell’esempio di addestramento, in caratteri	3	1.024

Limiti di dimensione dell’immagine di input

	Minimo	Massimo
Input image size	0	50 MB
Input image height in pixels	512	4,096
Input image width in pixels	512	4,096
Input image total pixels	0	12,582,912
Input image aspect ratio	1:4	4:1

Formati multimediali supportati

PNG
JPEG

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Preparazione dei dati per il fine-tuning dei modelli di comprensione

Selezione degli iperparametri