Amazon Titan 圖像生成器 G1 模型概觀
Amazon Titan 圖像生成器 G1 是影像生成模型。有兩種版本:v1 和 v2。
Amazon Titan 圖像生成器 v1 可讓使用者以多種方式產生和編輯影像。使用者只需輸入自然語言提示,就可以建立與其文字描述相符的影像。此外,他們可以上傳和編輯現有的影像,包括套用文字提示而不需要遮罩,或使用影像遮罩編輯影像的特定部分。此模型也支援擴圖以擴展影像的界限,並支援修圖以填補缺少的區域。它能夠根據選用的文字提示產生影像的變化,及提供即時自訂選項,以允許使用者使用參考影像傳輸樣式,或從多個參考結合樣式,這一切皆無需任何微調。
Titan Image Generator v2 支援 Titan Image Generator v1 的所有現有功能,並新增數個新功能。它允許使用者利用參考影像來引導影像產生,其中輸出影像符合參考影像的配置和組成,同時仍遵循文字提示。此外還包含自動背景移除功能,可以從包含多個物件的影像中移除背景,無需任何使用者輸入。此模型可精確控制所產生影像的調色盤,讓使用者保留品牌的視覺化身分,而不需要額外的微調。此外,主體一致性功能可讓使用者使用參考影像微調模型,以在產生的影像中保留所選的主體 (例如寵物、鞋子或包包)。這一整套的功能可讓使用者釋放其創造性潛力,並實現他們的想像力。
如需 Amazon Titan 圖像生成器 G1 模型提示工程指導方針的詳細資訊,請參閱 Amazon Titan 圖像生成器提示工程最佳實務
為了繼續支援以負責任方式使用 AI 的最佳實務,Titan Foundation Model (FM) 可偵測並移除資料中的有害內容、拒絕使用者輸入中的不當內容,以及篩選模型中包含不適當內容 (例如仇恨言論、褻瀆和暴力) 的輸出。Titan Image Generator FM 會將隱藏浮水印和 C2PA
您可以使用 Amazon Bedrock 主控台中的浮水印偵測功能,或呼叫 Amazon Bedrock 浮水印偵測 API (預覽),來檢查影像是否包含來自 Titan Image Generator 的浮水印。您也可以使用 Content Credentials Verify
Amazon Titan 圖像生成器 v1 概觀
模型 ID –
amazon.titan-image-generator-v1輸入字元數上限 - 512 個字元
輸入影像大小上限 - 5 MB (僅支援某些特定解析度)
使用修圖/擴圖的影像大小上限 – 1,408 x 1,408 像素
使用影像變體的影像大小上限 - 4,096 x 4,096 像素
語言 — 英文
輸出類型 — 影像
支援的影像類型 — JPEG、JPG、PNG
推論類型 – 隨需、佈建的輸送量
支援的使用案例 - 產生影像、編輯影像、影像變體
Amazon Titan 圖像生成器 v2 概觀
模型 ID –
amazon.titan-image-generator-v2:0輸入字元數上限 - 512 個字元
輸入影像大小上限 - 5 MB (僅支援某些特定解析度)
使用修圖/擴圖、背景移除、影像調節、調色盤的影像大小上限 – 1,408 x 1,408 像素
使用影像變體的影像大小上限 - 4,096 x 4,096 像素
語言 — 英文
輸出類型 — 影像
支援的影像類型 — JPEG、JPG、PNG
推論類型 – 隨需、佈建的輸送量
支援的使用案例 – 產生影像、編輯影像、影像變體、背景移除、顏色引導式內容
功能
-
產生文字轉影像 (T2I) – 輸入文字提示並產生新影像作為輸出。產生的影像會擷取文字提示描述的概念。
-
T2I 模型的微調 — 導入數個影像以捕捉您自己的風格和個人特色,然後微調核心 T2I 模型。微調的模型會產生符合特定使用者風格和個人特色的影像。
-
影像編輯選項 – 包括:修圖、擴圖、產生變體,以及在沒有影像遮罩情況下自動編輯。
-
修圖 — 使用影像和分割遮罩做為輸入 (來自使用者或模型估計),並重建遮罩中的區域。使用修圖功能來移除遮罩元素,並以背景像素取而代之。
-
擴圖 — 使用影像和分割遮罩做為輸入 (來自使用者或由模型估算),並產生無縫延伸區域的新像素。將影像延伸至邊界時,使用精確的擴圖功能來保留遮罩影像的像素。使用預設擴圖功能,根據分割設定將遮罩影像的像素延伸至影像邊界。
-
影像變體 – 使用 1 到 5 個影像和選用的提示作為輸入。它會產生保留輸入影像內容的新影像,但會變更其樣式和背景。
-
影像調節 – (僅限 V2) 使用輸入參考影像來引導影像產生。模型會產生符合參考影像配置和組成的輸出影像,同時仍遵循文字提示。
-
主體一致性 – (僅限 V2) 主體一致性允許使用者使用參考影像微調模型,以在產生的影像中保留所選的主體 (例如寵物、鞋子或包包)。
-
顏色引導式內容 – (僅限 V2) 您可以提供十六進位顏色代碼清單以及提示。可提供 1 到 10 個十六進位代碼。Titan Image Generator G1 V2 傳回的影像將納入使用者提供的調色盤。
-
背景移除 – (僅限 V2) 自動識別輸入影像中的多個物件並移除背景。輸出影像的背景是透明的。
-
內容來源 – 使用 Content Credentials Verify
等網站檢查影像是否由 Titan Image Generator 產生。除非中繼資料已移除,否則這應該表示影像已產生。
注意
如果您使用的是微調的模型,則無法使用 API 或模型的修圖、擴圖或調色盤功能。
參數
如需 Amazon Titan 圖像生成器 G1 模型推論參數的相關資訊,請參閱 Amazon Titan 圖像生成器 G1 模型推論參數。
微調
如需微調 Amazon Titan 圖像生成器 G1 模型的詳細資訊,請參閱下列頁面。
Amazon Titan 圖像生成器 G1 模型微調和定價
模型使用以下範例公式計算每個任務的總價:
總價 = 步驟數 * 批次大小 * 顯示的影像單價
最小值 (自動):
-
步驟數下限 (自動) - 500
-
批次大小下限 - 8
-
預設學習速率 - 0.00001
-
顯示的影像單價 - 0.005
微調超參數設定
步驟數 – 模型對每個批次公開的次數。沒有設定預設步驟計數。您必須選取一個介於 10 到 40,000 之間的數字,或選取「自動」的字串值。
步驟設定 - 自動 – Amazon Bedrock 會根據訓練資訊決定合理的值。選取此選項可將模型效能的優先順序高於訓練成本。步驟數量會自動決定。根據您的資料集,此數字通常介於 1,000 到 8,000 之間。任務成本會受用於將模型向資料公開之步驟數量的影響。請參閱定價詳細資訊的定價範例區段,以了解如何計算任務成本。(請參閱上方範例表格,了解當選取「自動」時,步驟計數與影像數量的關係。)
步驟設定 - 自訂 – 您可以輸入您希望 Bedrock 向訓練資料公開自訂模型的步驟數量。此值介於 10 到 40,000 之間。您可以使用較低的步驟計數值來降低模型產生每個影像的成本。
批次大小 – 更新模型參數前處理的樣本數。此值介於 8 到 192 之間,且為 8 的倍數。
學習速率 – 每批次訓練資料後更新模型參數的速率。這是介於 0 到 1 之間的浮點數值。學習速率預設為 0.00001。
如需微調程序的詳細資訊,請參閱提交模型自訂任務。
輸出
Amazon Titan 圖像生成器 G1 模型使用輸出影像大小和品質來決定影像的定價方式。Amazon Titan 圖像生成器 G1 模型具有兩個根據大小的定價區段:一個用於 512*512 影像,另一個用於 1024*1024 影像。定價是根據影像尺寸高度 * 寬度,小於或等於 512* 512 或大於 512* 512。
如需 Amazon Bedrock 定價的詳細資訊,請參閱 Amazon Bedrock 定價
浮水印偵測
注意
Amazon Bedrock 主控台和 API 的浮水印偵測可在公開預覽版本中使用,而且只會偵測從 Titan Image Generator G1 產生的浮水印。這個功能目前只能在 us-west-2 和 us-east-1 區域中使用。浮水印偵測能夠對 Titan Image Generator G1 產生的浮水印進行高度準確的偵測。藉由修改原始影像而得的影像,可能會產生較不準確的偵測結果。
此模型隱藏浮水印新增至所有產生的影像,以減少散播錯誤資訊,並協助保護著作權並追蹤內容使用情形。浮水印偵測可協助您確認影像是否由 Titan Image Generator G1 模型產生,這會檢查此浮水印是否存在。
注意
浮水印偵測 API 處於預覽狀態,可能會有所變更。建議您建立虛擬環境以使用 SDK。由於最新的 SDK 不提供浮水印偵測 API,因此建議您先解除安裝虛擬環境中最新版的 SDK,再使用浮水印偵測 API 安裝該版本。
您可以上傳影像,以偵測影像上是否有來自 Titan Image Generator G1 的浮水印。依照下列步驟使用主控台偵測此模型中的浮水印。
若要使用 Titan Image Generator G1 偵測浮水印:
在 Amazon Bedrock 主控台
開啟 Amazon Bedrock 主控台 -
從 Amazon Bedrock 的導覽窗格中選取概觀。選擇建置並測試索引標籤。
-
在保護措施區段中,前往水印偵測,然後選擇檢視水印偵測。
-
選取上傳影像,並尋找 JPG 或 PNG 格式的檔案。允許的檔案大小上限為 5 MB。
-
上傳後,會顯示影像的縮圖及名稱、檔案大小和上次修改日期。選取 X 可刪除或取代上傳區段中的影像。
-
選取分析以開始浮水印偵測分析。
-
影像可在結果下方預覽,並會在影像下方及影像上的橫幅指出偵測到水印是否偵測到浮水印。如果未偵測到浮水印,則影像下方的文字會顯示未偵測到水印。
-
若要載入下一個影像,請在上傳區段中選取影像縮圖中的 X,然後選擇要分析的新影像。
提示工程指導方針
遮罩提示 — 此演算法會將像素歸類為概念。使用者可以提供文字提示,用於根據遮罩提示的解釋對要遮罩的影像區域進行分類。提示選項可以解譯更複雜的提示,並將遮罩編碼為分割演算法。
影像遮罩 — 您也可以使用影像遮罩來設定遮罩值。影像遮罩可與遮罩的提示輸入結合使用,以提高準確度。影像遮罩檔必須符合以下參數:
-
遮罩影像的遮罩影像值必須是 0 (黑) 或 255 (白)。值為 0 的影像遮罩區域,會以使用者提示和/或輸入影像中的影像重新產生。
-
maskImage欄位必須是 base64 編碼的影像字串。 -
遮罩影像必須具有與輸入影像相同的尺寸 (相同的高度和寬度)。
-
輸入影像和遮罩影像只能使用 PNG 或 JPG 檔案。
-
遮罩影像只能使用黑白像素值。
-
遮罩影像只能使用 RGB 色頻 (不支援 Alpha 色頻)。
如需 Amazon Titan 圖像生成器提示工程的詳細資訊,請參閱 Amazon Titan 圖像生成器 G1 提示工程最佳實務
如需一般提示工程指導方針,請參閱提示工程指導方針。