Preparar dados para o ajuste dos modelos de geração de conteúdo criativo
Veja a seguir as diretrizes e os requisitos para preparar dados para o ajuste dos modelos de geração de conteúdo criativo.
-
A quantidade ideal de dados de treinamento depende da complexidade da tarefa e do resultado desejado.
-
Aumentar a variedade e o volume dos dados de treinamento pode melhorar a precisão do modelo.
-
Quanto mais imagens você usar, mais tempo será necessário para que o trabalho de ajuste seja concluído.
-
O número de imagens aumenta o custo do ajuste. Para obter mais informações, consulte Preços do Amazon Bedrock
.
-
-
Os conjuntos de dados de treinamento e validação devem ser arquivos JSONL, em que cada linha é um objeto JSON correspondente a um registro. Esses nomes de arquivo podem consistir apenas em caracteres alfanuméricos, sublinhados, hifens, barras e pontos.
-
Cada registro em seu JSONL deve incluir um atributo
image-ref
com o URI do Amazon S3 para uma imagem e um atributocaption
com um prompt para a imagem. As imagens devem estar no formato JPEG ou PNG. Para obter exemplos, consulte Formato necessário do conjunto de dados. -
Os conjuntos de dados de treinamento e validação devem estar em conformidade com os requisitos de tamanho indicados em Restrições de conjunto de dados.
-
Seu perfil de serviço do Amazon Bedrock deve ser capaz de acessar os arquivos de imagem no Amazon S3. Para obter mais informações sobre a concessão de acesso, consulte Create a service role for model customization.
Formato necessário do conjunto de dados
Confira abaixo o formato necessário para os arquivos JSONL.
{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}
Confira abaixo um registro de exemplo:
{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}
Restrições de conjunto de dados
Veja a seguir as restrições do conjunto de dados para o ajuste do Amazon Nova Canvas. O Amazon Nova Reel não é compatível com o ajuste.
Requisitos de tamanho para conjuntos de dados de treinamento e validação
Mínimo |
Máximo |
|
---|---|---|
Registros em um conjunto de dados de treinamento |
5 |
10 mil |
Tamanho do prompt de texto na amostra de treinamento, em caracteres |
3 |
1,024 |
Restrições de tamanho da imagem de entrada
Mínimo |
Máximo |
|
---|---|---|
Input image size | 0 | 50 MB |
Input image height in pixels | 512 | 4,096 |
Input image width in pixels | 512 | 4,096 |
Input image total pixels | 0 | 12,582,912 |
Input image aspect ratio | 1:4 | 4:1 |
Formatos de mídia compatíveis
-
PNG
-
JPEG