Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Requisiti del modello per i set di dati di formazione e convalida
Le sezioni seguenti elencano i requisiti per l'addestramento e la convalida dei set di dati per un modello. Per informazioni sui vincoli dei set di dati per i modelli, consulta Fine-tuning Amazon Nova models. Amazon Nova
Descrizione | Massimo (messa a punto) |
---|---|
Somma dei token di input e output quando la dimensione del batch è 1 | 4,096 |
Somma dei token di input e output quando la dimensione del batch è 2, 3 o 4 | N/D |
Quota di caratteri per campione nel set di dati | Quota di token x 6 (stimata) |
Dimensione del file del set di dati di addestramento | 1 GB |
Dimensione del file del set di dati di convalida | 100 MB |
Descrizione | Massimo (formazione preliminare continua) | Massimo (messa a punto) |
---|---|---|
Somma dei token di input e output quando la dimensione del batch è 1 | 4,096 | 4,096 |
Somma dei token di input e output quando la dimensione del batch è 2, 3 o 4 | 2.048 | 2.048 |
Quota di caratteri per campione nel set di dati | Quota di token x 6 (stimata) | Quota di token x 6 (stimata) |
Dimensione del file del set di dati di addestramento | 10 GB | 1 GB |
Dimensione del file del set di dati di convalida | 100 MB | 100 MB |
Descrizione | Massimo (formazione preliminare continua) | Massimo (messa a punto) |
---|---|---|
Somma dei token di input e output quando la dimensione del batch è 1 o 2 | 4,096 | 4,096 |
Somma dei token di input e output quando la dimensione del batch è 3, 4, 5 o 6 | 2.048 | 2.048 |
Quota di caratteri per campione nel set di dati | Quota di token x 6 (stimata) | Quota di token x 6 (stimata) |
Dimensione del file del set di dati di addestramento | 10 GB | 1 GB |
Dimensione del file del set di dati di convalida | 100 MB | 100 MB |
Descrizione | Minimo (messa a punto) | Massimo (regolazione fine) |
---|---|---|
Lunghezza del prompt di testo nell'esempio di addestramento, in caratteri | 3 | 1,024 |
Record in un set di dati di addestramento | 5 | 10.000 |
Dimensione dell'immagine di input | 0 | 50 MB |
Altezza dell'immagine di input in pixel | 512 | 4,096 |
Larghezza dell'immagine di input in pixel | 512 | 4,096 |
Pixel totali dell'immagine di input | 0 | 12.582.912 |
Proporzioni dell'immagine in ingresso | 1:4 | 4:1 |
Descrizione | Minimo (messa a punto) | Massimo (regolazione fine) |
---|---|---|
Lunghezza del prompt di testo nell'esempio di addestramento, in caratteri | 0 | 2.560 |
Record in un set di dati di addestramento | 1.000 | 500.000 |
Dimensione dell'immagine di input | 0 | 5 MB |
Altezza dell'immagine di input in pixel | 128 | 4096 |
Larghezza dell'immagine di input in pixel | 128 | 4096 |
Pixel totali dell'immagine di input | 0 | 12.528.912 |
Proporzioni dell'immagine in ingresso | 1:4 | 4:1 |
Descrizione | Minimo (messa a punto) | Massimo (regolazione fine) |
---|---|---|
Token di input | 0 | 16,000 |
Token di output | 0 | 16,000 |
Quota di caratteri per campione nel set di dati | 0 | Quota di token x 6 (stimata) |
Somma dei token di input e output | 0 | 16,000 |
Somma dei record di formazione e convalida | 100 | 10.000 (regolabile utilizzando le quote di servizio) |
I formati di immagine supportati per Meta Llama-3.2 11B Vision Instruct e Meta
Llama-3.2 90B Vision Instruct includono:gif
, jpeg
png
, ewebp
. Per stimare la image-to-token conversione durante la messa a punto di questi modelli, puoi usare questa formula come approssimazione:. Tokens = min(2,
max(Height // 560, 1)) * min(2, max(Width // 560, 1)) * 1601
Le immagini vengono convertite in circa 1.601-6.404 token in base alle loro dimensioni.
Descrizione | Minimo (regolazione fine) | Massimo (regolazione fine) |
---|---|---|
Somma dei token di input e output | 0 | 16.000 (10.000 per Meta Llama 3.2 90B) |
Somma dei record di formazione e convalida | 100 | 10.000 (regolabile utilizzando le quote di servizio) |
Dimensione dell'immagine di input (per i Meta Llama 11B and 90B instruct modelli) | 0 | 10 MB |
Altezza dell'immagine di input in pixel per Meta Llama 11B and 90B instruct i modelli | 10 | 8192 |
Inserisci la larghezza dell'immagine in pixel per Meta Llama 11B and 90B90B instruct i modelli | 10 | 8192 |
Descrizione | Massima (regolazione fine) |
---|---|
Token di input | 4,096 |
Token di output | 2.048 |
Quota di caratteri per campione nel set di dati | Quota di token x 6 (stimata) |
Record in un set di dati di addestramento | 10.000 |
Record in un set di dati di convalida | 1.000 |
Descrizione | Massimo (regolazione fine) |
---|---|
Numero minimo di record | 32 |
Numero massimo di record di allenamento | 10.000 |
Numero massimo di record di convalida | 1.000 |
Numero massimo di record | 10.000 (regolabile utilizzando le quote di servizio) |
Numero massimo di token | 32.000 |
Dimensione massima del set di dati di addestramento | 10 GB |
Dimensione massima del set di dati di convalida | 1 GB |