Requisiti dei modelli per i set di dati di addestramento e convalida - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Requisiti dei modelli per i set di dati di addestramento e convalida

Le sezioni seguenti elencano i requisiti per l’addestramento e la convalida dei set di dati per un modello. Per informazioni sui vincoli dei set di dati per i modelli Amazon Nova, consulta Fine-tuning dei modelli Amazon Nova.

Descrizione Massimo (fine-tuning)
Somma dei token di input e output quando la dimensione del batch è 1 4.096
Somma dei token di input e output quando la dimensione del batch è 2, 3 o 4 N/D
Quota di caratteri per campione nel set di dati Quota di token x 6 (stimata)
Dimensione del file del set di dati di addestramento 1 GB
Dimensione del file del set di dati di convalida 100 MB
Descrizione Massimo (pre-addestramento continuo) Massimo (fine-tuning)
Somma dei token di input e output quando la dimensione del batch è 1 4.096 4.096
Somma dei token di input e output quando la dimensione del batch è 2, 3 o 4 2.048 2.048
Quota di caratteri per campione nel set di dati Quota di token x 6 (stimata) Quota di token x 6 (stimata)
Dimensione del file del set di dati di addestramento 10 GB 1 GB
Dimensione del file del set di dati di convalida 100 MB 100 MB
Descrizione Massimo (pre-addestramento continuo) Massimo (fine-tuning)
Somma dei token di input e output quando la dimensione del batch è 1 o 2 4.096 4.096
Somma dei token di input e output quando la dimensione del batch è 3, 4, 5 o 6 2.048 2.048
Quota di caratteri per campione nel set di dati Quota di token x 6 (stimata) Quota di token x 6 (stimata)
Dimensione del file del set di dati di addestramento 10 GB 1 GB
Dimensione del file del set di dati di convalida 100 MB 100 MB
Descrizione Minimo (fine-tuning) Massimo (fine-tuning)
Lunghezza del prompt di testo nell’esempio di addestramento, in caratteri 3 1.024
Record in un set di dati di addestramento 5 10.000
Dimensioni dell’immagine di input 0 50 MB
Altezza dell’immagine di input in pixel 512 4.096
Larghezza dell’immagine di input in pixel 512 4.096
Pixel totali dell’immagine di input 0 12.582.912
Proporzioni dell’immagine di input 1:4 4:1
Descrizione Minimo (fine-tuning) Massimo (fine-tuning)
Lunghezza del prompt di testo nell’esempio di addestramento, in caratteri 0 2.560
Record in un set di dati di addestramento 1.000 500.000
Dimensioni dell’immagine di input 0 5 MB
Altezza dell’immagine di input in pixel 128 4096
Larghezza dell’immagine di input in pixel 128 4096
Pixel totali dell’immagine di input 0 12.528.912
Proporzioni dell’immagine di input 1:4 4:1
Descrizione Minimo (fine-tuning) Massimo (fine-tuning)
Token di input 0 16.000
Token di output 0 16.000
Quota di caratteri per campione nel set di dati 0 Quota di token x 6 (stimata)
Somma di token di input e output 0 16.000
Somma dei record di addestramento e convalida 100 10.000 (modificabile utilizzando le quote di servizio)

I formati di immagine supportati per Meta Llama-3.2 11B Vision Instruct e Meta Llama-3.2 90B Vision Instruct includono: gif, jpeg, png e webp. Per stimare la conversione da immagine a token durante il fine-tuning di questi modelli, puoi utilizzare come approssimazione la formula Tokens = min(2, max(Height // 560, 1)) * min(2, max(Width // 560, 1)) * 1601. Le immagini vengono convertite in circa 1.601-6.404 token in base alle loro dimensioni.

Descrizione Minimo (fine-tuning) Massimo (fine-tuning)
Somma di token di input e output 0 16.000 (10.000 per Meta Llama 3.2 90B)
Somma dei record di addestramento e convalida 100 10.000 (modificabile utilizzando le quote di servizio)
Dimensione dell’immagine di input per i modelli Meta Llama 11B and 90B instruct 0 10 MB
Altezza dell’immagine di input per i modelli Meta Llama 11B and 90B instruct 10 8192
Larghezza dell’immagine in pixel per i modelli Meta Llama 11B and 90B90B instruct 10 8192
Descrizione Minimo (fine-tuning) Massimo (fine-tuning)
Somma di token di input e output 0 16000
Somma dei record di addestramento e convalida 100 10.000 (modificabile utilizzando le quote di servizio)
Descrizione Massimo (fine-tuning)
Token di input 4.096
Token di output 2.048
Quota di caratteri per campione nel set di dati Quota di token x 6 (stimata)
Record in un set di dati di addestramento 10.000
Record di convalida in un set di dati 1.000
Descrizione Massimo (fine-tuning)
Numero minimo di record 32
Numero massimo di record di addestramento 10.000
Numero massimo di record di convalida 1.000
Numero massimo di record 10.000 (modificabile utilizzando le quote di servizio)
Numero massimo di token 32.000
Dimensione massima del set di dati di addestramento 10 GB
Dimensione massima dei set di dati di convalida 1 GB