Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Requisiti dei modelli per i set di dati di addestramento e convalida
Le sezioni seguenti elencano i requisiti per l’addestramento e la convalida dei set di dati per un modello. Per informazioni sui vincoli dei set di dati per i modelli Amazon Nova, consulta Fine-tuning dei modelli Amazon Nova.
| Descrizione |
Massimo (fine-tuning) |
| Somma dei token di input e output quando la dimensione del batch è 1 |
4.096 |
| Somma dei token di input e output quando la dimensione del batch è 2, 3 o 4 |
N/D |
| Quota di caratteri per campione nel set di dati |
Quota di token x 6 (stimata) |
| Dimensione del file del set di dati di addestramento |
1 GB |
| Dimensione del file del set di dati di convalida |
100 MB |
| Descrizione |
Massimo (pre-addestramento continuo) |
Massimo (fine-tuning) |
| Somma dei token di input e output quando la dimensione del batch è 1 |
4.096 |
4.096 |
| Somma dei token di input e output quando la dimensione del batch è 2, 3 o 4 |
2.048 |
2.048 |
| Quota di caratteri per campione nel set di dati |
Quota di token x 6 (stimata) |
Quota di token x 6 (stimata) |
| Dimensione del file del set di dati di addestramento |
10 GB |
1 GB |
| Dimensione del file del set di dati di convalida |
100 MB |
100 MB |
| Descrizione |
Massimo (pre-addestramento continuo) |
Massimo (fine-tuning) |
| Somma dei token di input e output quando la dimensione del batch è 1 o 2 |
4.096 |
4.096 |
| Somma dei token di input e output quando la dimensione del batch è 3, 4, 5 o 6 |
2.048 |
2.048 |
| Quota di caratteri per campione nel set di dati |
Quota di token x 6 (stimata) |
Quota di token x 6 (stimata) |
| Dimensione del file del set di dati di addestramento |
10 GB |
1 GB |
| Dimensione del file del set di dati di convalida |
100 MB |
100 MB |
| Descrizione |
Minimo (fine-tuning) |
Massimo (fine-tuning) |
| Lunghezza del prompt di testo nell’esempio di addestramento, in caratteri |
3 |
1.024 |
| Record in un set di dati di addestramento |
5 |
10.000 |
| Dimensioni dell’immagine di input |
0 |
50 MB |
| Altezza dell’immagine di input in pixel |
512 |
4.096 |
| Larghezza dell’immagine di input in pixel |
512 |
4.096 |
| Pixel totali dell’immagine di input |
0 |
12.582.912 |
| Proporzioni dell’immagine di input |
1:4 |
4:1 |
| Descrizione |
Minimo (fine-tuning) |
Massimo (fine-tuning) |
| Lunghezza del prompt di testo nell’esempio di addestramento, in caratteri |
0 |
2.560 |
| Record in un set di dati di addestramento |
1.000 |
500.000 |
| Dimensioni dell’immagine di input |
0 |
5 MB |
| Altezza dell’immagine di input in pixel |
128 |
4096 |
| Larghezza dell’immagine di input in pixel |
128 |
4096 |
| Pixel totali dell’immagine di input |
0 |
12.528.912 |
| Proporzioni dell’immagine di input |
1:4 |
4:1 |
| Descrizione |
Minimo (fine-tuning) |
Massimo (fine-tuning) |
| Token di input |
0 |
16.000 |
| Token di output |
0 |
16.000 |
| Quota di caratteri per campione nel set di dati |
0 |
Quota di token x 6 (stimata) |
| Somma di token di input e output |
0 |
16.000 |
| Somma dei record di addestramento e convalida |
100 |
10.000 (modificabile utilizzando le quote di servizio) |
I formati di immagine supportati per Meta Llama-3.2 11B Vision Instruct e Meta
Llama-3.2 90B Vision Instruct includono: gif, jpeg, png e webp. Per stimare la conversione da immagine a token durante il fine-tuning di questi modelli, puoi utilizzare come approssimazione la formula Tokens = min(2,
max(Height // 560, 1)) * min(2, max(Width // 560, 1)) * 1601. Le immagini vengono convertite in circa 1.601-6.404 token in base alle loro dimensioni.
| Descrizione |
Minimo (fine-tuning) |
Massimo (fine-tuning) |
| Somma di token di input e output |
0 |
16.000 (10.000 per Meta Llama 3.2 90B) |
| Somma dei record di addestramento e convalida |
100 |
10.000 (modificabile utilizzando le quote di servizio) |
| Dimensione dell’immagine di input per i modelli Meta Llama 11B and 90B instruct |
0 |
10 MB |
| Altezza dell’immagine di input per i modelli Meta Llama 11B and 90B
instruct |
10 |
8192 |
| Larghezza dell’immagine in pixel per i modelli Meta Llama 11B and 90B90B
instruct |
10 |
8192 |
| Descrizione |
Minimo (fine-tuning) |
Massimo (fine-tuning) |
| Somma di token di input e output |
0 |
16000 |
| Somma dei record di addestramento e convalida |
100 |
10.000 (modificabile utilizzando le quote di servizio) |
| Descrizione |
Massimo (fine-tuning) |
| Token di input |
4.096 |
| Token di output |
2.048 |
| Quota di caratteri per campione nel set di dati |
Quota di token x 6 (stimata) |
| Record in un set di dati di addestramento |
10.000 |
| Record di convalida in un set di dati |
1.000 |
| Descrizione |
Massimo (fine-tuning) |
| Numero minimo di record |
32 |
| Numero massimo di record di addestramento |
10.000 |
| Numero massimo di record di convalida |
1.000 |
| Numero massimo di record |
10.000 (modificabile utilizzando le quote di servizio) |
| Numero massimo di token |
32.000 |
| Dimensione massima del set di dati di addestramento |
10 GB |
| Dimensione massima dei set di dati di convalida |
1 GB |