準備資料以微調創意內容產生模型
以下是準備資料以微調創意內容產生模型的指導方針和要求。
-
訓練資料的最佳數量取決於任務的複雜性和所需的結果。
-
增加訓練資料的多樣性和數量可以提高模型準確度。
-
您使用的影像越多,完成微調任務所需的時間就越多。
-
影像數量會增加您的微調成本。如需詳細資訊,請參閱 Amazon Bedrock 定價
。
-
-
訓練和驗證資料集必須是 JSONL 檔案,其中每一行都是對應於記錄的 JSON 物件。這些檔案名稱只能包含英數字元、底線、連字號、斜線和句點。
-
JSONL 中的每個記錄都必須包含一個具有影像之 Amazon S3 URI 的
image-ref屬性,以及一個具有影像提示詞的caption屬性。影像必須是 JPEG 或 PNG 格式。如需範例,請參閱 所需的資料集格式。 -
您的訓練和驗證資料集必須符合 資料集限制條件 中列出的大小要求。
-
您的 Amazon Bedrock 服務角色必須能夠存取 Amazon S3 中的影像檔案。如需授與存取權的詳細資訊,請參閱建立用於模型自訂的服務角色。
所需的資料集格式
以下顯示 JSONL 檔案所需的格式。
{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}
以下是一個範例記錄:
{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}
資料集限制條件
以下是用於微調 Amazon Nova Canvas 的資料集限制條件。Amazon Nova Reel 不支援微調。
訓練和驗證資料集的大小要求
下限 |
上限 |
|
|---|---|---|
訓練資料集中的記錄 |
5 |
10K |
訓練範例中的文字提示詞長度,以字元為單位 |
3 |
1,024 |
輸入影像大小限制條件
下限 |
上限 |
|
|---|---|---|
| Input image size | 0 | 50 MB |
| Input image height in pixels | 512 | 4,096 |
| Input image width in pixels | 512 | 4,096 |
| Input image total pixels | 0 | 12,582,912 |
| Input image aspect ratio | 1:4 | 4:1 |
支援的媒體格式
-
PNG
-
JPEG