창의적인 콘텐츠 생성 모델 미세 조정을 위한 데이터 준비 - Amazon Nova

창의적인 콘텐츠 생성 모델 미세 조정을 위한 데이터 준비

다음은 창의적인 콘텐츠 생성 모델을 미세 조정하기 위한 데이터 준비 지침과 요구 사항입니다.

  1. 최적의 훈련 데이터 양은 태스크의 복잡성과 원하는 결과에 따라 달라집니다.

    • 훈련 데이터의 다양성과 볼륨을 늘리면 모델 정확도가 향상될 수 있습니다.

    • 이미지를 많이 사용할수록 미세 조정 작업을 완료하는 데 더 많은 시간이 걸릴 수 있습니다.

    • 이미지 수가 많으면 미세 조정 비용이 늘어납니다. 자세한 내용은 Amazon Bedrock 요금을 참조하세요.

  2. 훈련 및 검증 데이터세트는 각 줄이 레코드에 해당하는 JSON 객체인 JSONL 파일이어야 합니다. 이러한 파일 이름은 영숫자, 밑줄, 하이픈, 슬래시 및 점으로만 구성할 수 있습니다.

  3. JSONL의 각 레코드에는 이미지의 Amazon S3 URI를 포함하는 image-ref 속성과 이미지에 대한 프롬프트를 포함하는 caption 속성이 포함되어야 합니다. 이미지는 JPEG 또는 PNG 형식이어야 합니다. 예시는 필수 데이터세트 형식 섹션을 참조하세요.

  4. 훈련 및 검증 데이터세트는 데이터세트 제약 조건에 나열된 크기 요구 사항을 준수해야 합니다.

  5. Amazon Bedrock 서비스 역할에서 Amazon S3의 이미지 파일에 액세스할 수 있어야 합니다. 액세스 권한 부여에 대한 자세한 내용은 Create a service role for model customization을 참조하세요.

필수 데이터세트 형식

다음은 JSONL 파일에 필요한 형식을 보여줍니다.

{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}

다음은 예제 레코드입니다.

{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}

데이터세트 제약 조건

다음은 Amazon Nova Canvas를 미세 조정하기 위한 데이터세트 제약 조건입니다. Amazon Nova Reel은 미세 조정을 지원하지 않습니다.

훈련 및 검증 데이터세트의 크기 요구 사항

최소

Maximum

훈련 데이터세트의 레코드

5

1만

훈련 샘플의 텍스트 프롬프트 길이(글자 수 기준)

3

1,024

입력 이미지 크기 제약 조건

최소

Maximum

Input image size 0 50 MB
Input image height in pixels 512 4,096
Input image width in pixels 512 4,096
Input image total pixels 0 12,582,912
Input image aspect ratio 1:4 4:1

지원되는 미디어 형식

  • PNG

  • JPEG