As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Requisitos de modelo para conjuntos de dados de treinamento e validação
As seções a seguir listam os requisitos para conjuntos de dados de treinamento e validação de um modelo. Para obter informações sobre restrições de conjunto de dados para Amazon Nova modelos, consulte Modelos de ajuste fino. Amazon Nova
Descrição | Máximo (ajuste) |
---|---|
Soma dos tokens de entrada e saída quando o tamanho do lote é 1 | 4.096 |
Soma dos tokens de entrada e saída quando o tamanho do lote é 2, 3 ou 4 | N/D |
Cota de caracteres por amostra no conjunto de dados | Cota de tokens x 6 (estimada) |
Tamanho do arquivo do conjunto de dados de treinamento | 1 GB |
Tamanho do arquivo do conjunto de dados de validação | 100 MB |
Descrição | Máximo (pré-treinamento contínuo) | Máximo (ajuste) |
---|---|---|
Soma dos tokens de entrada e saída quando o tamanho do lote é 1 | 4.096 | 4.096 |
Soma dos tokens de entrada e saída quando o tamanho do lote é 2, 3 ou 4 | 2.048 | 2.048 |
Cota de caracteres por amostra no conjunto de dados | Cota de tokens x 6 (estimada) | Cota de tokens x 6 (estimada) |
Tamanho do arquivo do conjunto de dados de treinamento | 10 GB | 1 GB |
Tamanho do arquivo do conjunto de dados de validação | 100 MB | 100 MB |
Descrição | Máximo (pré-treinamento contínuo) | Máximo (ajuste) |
---|---|---|
Soma dos tokens de entrada e saída quando o tamanho do lote é 1 ou 2 | 4.096 | 4.096 |
Soma dos tokens de entrada e saída quando o tamanho do lote é 3, 4, 5 ou 6 | 2.048 | 2.048 |
Cota de caracteres por amostra no conjunto de dados | Cota de tokens x 6 (estimada) | Cota de tokens x 6 (estimada) |
Tamanho do arquivo do conjunto de dados de treinamento | 10 GB | 1 GB |
Tamanho do arquivo do conjunto de dados de validação | 100 MB | 100 MB |
Descrição | Mínimo (ajuste) | Máximo (ajuste) |
---|---|---|
Tamanho do prompt de texto na amostra de treinamento, em caracteres | 3 | 1,024 |
Registros em um conjunto de dados de treinamento | 5 | 10.000 |
Tamanho da imagem de entrada | 0 | 50 MB |
Altura da imagem de entrada em pixels | 512 | 4.096 |
Largura da imagem de entrada em pixels | 512 | 4.096 |
Total de pixels da imagem de entrada | 0 | 12.582.912 |
Proporção da imagem de entrada | 1:4 | 4:1 |
Descrição | Mínimo (ajuste) | Máximo (ajuste) |
---|---|---|
Tamanho do prompt de texto na amostra de treinamento, em caracteres | 0 | 2.560 |
Registros em um conjunto de dados de treinamento | 1.000 | 500.000 |
Tamanho da imagem de entrada | 0 | 5 MB |
Altura da imagem de entrada em pixels | 128 | 4096 |
Largura da imagem de entrada em pixels | 128 | 4096 |
Total de pixels da imagem de entrada | 0 | 12.528.912 |
Proporção da imagem de entrada | 1:4 | 4:1 |
Descrição | Mínimo (ajuste) | Máximo (ajuste) |
---|---|---|
Tokens de entrada | 0 | 16.000 |
Tokens de saída | 0 | 16.000 |
Cota de caracteres por amostra no conjunto de dados | 0 | Cota de tokens x 6 (estimada) |
Soma dos tokens de entrada e saída | 0 | 16.000 |
Soma dos registros de treinamento e validação | 100 | 10.000 (ajustável usando cotas de serviço) |
Os formatos de imagem compatíveis Meta Llama-3.2 11B Vision Instruct e Meta
Llama-3.2 90B Vision Instruct incluem: gif
jpeg
png
,, webp
e. Para estimar a image-to-token conversão durante o ajuste fino desses modelos, você pode usar esta fórmula como uma aproximação:. Tokens = min(2,
max(Height // 560, 1)) * min(2, max(Width // 560, 1)) * 1601
As imagens são convertidas em aproximadamente 1.601 a 6.404 tokens com base em seu tamanho.
Descrição | Mínimo (ajuste) | Máximo (ajuste) |
---|---|---|
Soma dos tokens de entrada e saída | 0 | 16.000 (10.000 para Meta Llama 3.2 90B) |
Soma dos registros de treinamento e validação | 100 | 10.000 (ajustável usando cotas de serviço) |
Tamanho da imagem de entrada (para Meta Llama 11B and 90B instruct modelos) | 0 | 10 MB |
Altura da imagem de entrada em pixels para Meta Llama 11B and 90B instruct modelos | 10 | 8192 |
Largura da imagem de entrada em pixels para Meta Llama 11B and 90B90B instruct modelos | 10 | 8192 |
Descrição | Máximo (ajuste) |
---|---|
Tokens de entrada | 4.096 |
Tokens de saída | 2.048 |
Cota de caracteres por amostra no conjunto de dados | Cota de tokens x 6 (estimada) |
Registros em um conjunto de dados de treinamento | 10.000 |
Registros em um conjunto de dados de validação | 1.000 |
Descrição | Máximo (ajuste) |
---|---|
Número mínimo de registros | 32 |
Registros máximos de treinamento | 10.000 |
Registros máximos de validação | 1.000 |
Total máximo de registros | 10.000 (ajustável usando cotas de serviço) |
Máximo de tokens | 32.000 |
Tamanho máximo do conjunto de dados de treinamento | 10 GB |
Tamanho máximo do conjunto de dados de validação | 1 GB |