창의적인 콘텐츠 생성 모델 미세 조정을 위한 데이터 준비
다음은 창의적인 콘텐츠 생성 모델을 미세 조정하기 위한 데이터 준비 지침과 요구 사항입니다.
-
최적의 훈련 데이터 양은 태스크의 복잡성과 원하는 결과에 따라 달라집니다.
-
훈련 데이터의 다양성과 볼륨을 늘리면 모델 정확도가 향상될 수 있습니다.
-
이미지를 많이 사용할수록 미세 조정 작업을 완료하는 데 더 많은 시간이 걸릴 수 있습니다.
-
이미지 수가 많으면 미세 조정 비용이 늘어납니다. 자세한 내용은 Amazon Bedrock 요금
을 참조하세요.
-
-
훈련 및 검증 데이터세트는 각 줄이 레코드에 해당하는 JSON 객체인 JSONL 파일이어야 합니다. 이러한 파일 이름은 영숫자, 밑줄, 하이픈, 슬래시 및 점으로만 구성할 수 있습니다.
-
JSONL의 각 레코드에는 이미지의 Amazon S3 URI를 포함하는
image-ref
속성과 이미지에 대한 프롬프트를 포함하는caption
속성이 포함되어야 합니다. 이미지는 JPEG 또는 PNG 형식이어야 합니다. 예시는 필수 데이터세트 형식 섹션을 참조하세요. -
훈련 및 검증 데이터세트는 데이터세트 제약 조건에 나열된 크기 요구 사항을 준수해야 합니다.
-
Amazon Bedrock 서비스 역할에서 Amazon S3의 이미지 파일에 액세스할 수 있어야 합니다. 액세스 권한 부여에 대한 자세한 내용은 Create a service role for model customization을 참조하세요.
필수 데이터세트 형식
다음은 JSONL 파일에 필요한 형식을 보여줍니다.
{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}
다음은 예제 레코드입니다.
{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}
데이터세트 제약 조건
다음은 Amazon Nova Canvas를 미세 조정하기 위한 데이터세트 제약 조건입니다. Amazon Nova Reel은 미세 조정을 지원하지 않습니다.
훈련 및 검증 데이터세트의 크기 요구 사항
최소 |
Maximum |
|
---|---|---|
훈련 데이터세트의 레코드 |
5 |
1만 |
훈련 샘플의 텍스트 프롬프트 길이(글자 수 기준) |
3 |
1,024 |
입력 이미지 크기 제약 조건
최소 |
Maximum |
|
---|---|---|
Input image size | 0 | 50 MB |
Input image height in pixels | 512 | 4,096 |
Input image width in pixels | 512 | 4,096 |
Input image total pixels | 0 | 12,582,912 |
Input image aspect ratio | 1:4 | 4:1 |
지원되는 미디어 형식
-
PNG
-
JPEG