準備資料以微調創意內容產生模型 - Amazon Nova

準備資料以微調創意內容產生模型

以下是準備資料以微調創意內容產生模型的指導方針和要求。

  1. 訓練資料的最佳數量取決於任務的複雜性和所需的結果。

    • 增加訓練資料的多樣性和數量可以提高模型準確度。

    • 您使用的影像越多,完成微調任務所需的時間就越多。

    • 影像數量會增加您的微調成本。如需詳細資訊,請參閱 Amazon Bedrock 定價

  2. 訓練和驗證資料集必須是 JSONL 檔案,其中每一行都是對應於記錄的 JSON 物件。這些檔案名稱只能包含英數字元、底線、連字號、斜線和句點。

  3. JSONL 中的每個記錄都必須包含一個具有影像之 Amazon S3 URI 的 image-ref 屬性,以及一個具有影像提示詞的 caption 屬性。影像必須是 JPEG 或 PNG 格式。如需範例,請參閱 所需的資料集格式

  4. 您的訓練和驗證資料集必須符合 資料集限制條件 中列出的大小要求。

  5. 您的 Amazon Bedrock 服務角色必須能夠存取 Amazon S3 中的影像檔案。如需授與存取權的詳細資訊,請參閱建立用於模型自訂的服務角色

所需的資料集格式

以下顯示 JSONL 檔案所需的格式。

{"image-ref": "s3://amzn-s3-demo-bucket/path/to/image001.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image002.png", "caption": "<prompt text>"} {"image-ref": "s3://amzn-s3-demo-bucket/path/to/image003.png", "caption": "<prompt text>"}

以下是一個範例記錄:

{"image-ref": "s3://amzn-s3-demo-bucket/my-pets/cat.png", "caption": "an orange cat with white spots"}

資料集限制條件

以下是用於微調 Amazon Nova Canvas 的資料集限制條件。Amazon Nova Reel 不支援微調。

訓練和驗證資料集的大小要求

下限

上限

訓練資料集中的記錄

5

10K

訓練範例中的文字提示詞長度,以字元為單位

3

1,024

輸入影像大小限制條件

下限

上限

Input image size 0 50 MB
Input image height in pixels 512 4,096
Input image width in pixels 512 4,096
Input image total pixels 0 12,582,912
Input image aspect ratio 1:4 4:1

支援的媒體格式

  • PNG

  • JPEG