Preparar dados para o ajuste dos modelos de geração de conteúdo criativo - Amazon Nova

Preparar dados para o ajuste dos modelos de geração de conteúdo criativo

Veja a seguir as diretrizes e os requisitos para preparar dados para o ajuste dos modelos de geração de conteúdo criativo.

  1. A quantidade ideal de dados de treinamento depende da complexidade da tarefa e do resultado desejado.

    • Aumentar a variedade e o volume dos dados de treinamento pode melhorar a precisão do modelo.

    • Quanto mais imagens você usar, mais tempo será necessário para que o trabalho de ajuste seja concluído.

    • O número de imagens aumenta o custo do ajuste. Para obter mais informações, consulte Preços do Amazon Bedrock.

  2. Os conjuntos de dados de treinamento e validação devem ser arquivos JSONL, em que cada linha é um objeto JSON correspondente a um registro. Esses nomes de arquivo podem consistir apenas em caracteres alfanuméricos, sublinhados, hifens, barras e pontos.

  3. Cada registro em seu JSONL deve incluir um atributo image-ref com o URI do Amazon S3 para uma imagem e um atributo caption com um prompt para a imagem. As imagens devem estar no formato JPEG ou PNG. Para obter exemplos, consulte Formato necessário do conjunto de dados.

  4. Os conjuntos de dados de treinamento e validação devem estar em conformidade com os requisitos de tamanho indicados em Restrições de conjunto de dados.

  5. Seu perfil de serviço do Amazon Bedrock deve ser capaz de acessar os arquivos de imagem no Amazon S3. Para obter mais informações sobre a concessão de acesso, consulte Create a service role for model customization.

Formato necessário do conjunto de dados

Confira abaixo o formato necessário para os arquivos JSONL.

{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}

Confira abaixo um registro de exemplo:

{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}

Restrições de conjunto de dados

Veja a seguir as restrições do conjunto de dados para o ajuste do Amazon Nova Canvas. O Amazon Nova Reel não é compatível com o ajuste.

Requisitos de tamanho para conjuntos de dados de treinamento e validação

Mínimo

Máximo

Registros em um conjunto de dados de treinamento

5

10 mil

Tamanho do prompt de texto na amostra de treinamento, em caracteres

3

1,024

Restrições de tamanho da imagem de entrada

Mínimo

Máximo

Input image size 0 50 MB
Input image height in pixels 512 4,096
Input image width in pixels 512 4,096
Input image total pixels 0 12,582,912
Input image aspect ratio 1:4 4:1

Formatos de mídia compatíveis

  • PNG

  • JPEG