本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Amazon Titan Image Generator G1 模型
<a name="titan-image-models"></a>

Amazon Titan Image Generator G1 是一種影像產生模型，可讓使用者以多種方式產生和編輯影像。使用者只需輸入自然語言提示，就可以建立與其文字描述相符的影像。此外，他們可以上傳和編輯現有的影像，包括套用文字提示而不需要遮罩，或使用影像遮罩編輯影像的特定部分。此模型也支援擴圖以擴展影像的界限，並支援修圖以填補缺少的區域。它能夠根據選用的文字提示產生影像的變化，及提供即時自訂選項，以允許使用者使用參考影像傳輸樣式，或從多個參考結合樣式，這一切皆無需任何微調。

Amazon Titan Image Generator G1 v2 新增了數種進階功能。它允許使用者利用參考影像來引導影像產生，其中輸出影像符合參考影像的配置和組成，同時仍遵循文字提示。此外還包含自動背景移除功能，可以從包含多個物件的影像中移除背景，無需任何使用者輸入。此模型可精確控制所產生影像的調色盤，讓使用者保留品牌的視覺化身分，而不需要額外的微調。此外，主體一致性功能可讓使用者使用參考影像微調模型，以在產生的影像中保留所選的主體 (例如寵物、鞋子或包包)。這一整套的功能可讓使用者釋放其創造性潛力，並實現他們的想像力。

如需 Amazon Titan Image Generator G1 模型提示工程準則的詳細資訊，請參閱 [Amazon Titan Image Generator Prompt Engineering 最佳實務](https://d2eo22ngex1n9g.cloudfront.net/Documentation/User+Guides/Titan/Amazon+Titan+Image+Generator+Prompt+Engineering+Guidelines.pdf)。

為了繼續支援以負責任方式使用 AI 的最佳實務，Titan Foundation Model (FM) 可偵測並移除資料中的有害內容、拒絕使用者輸入中的不當內容，以及篩選模型中包含不適當內容 (例如仇恨言論、褻瀆和暴力) 的輸出。Titan Image Generator FM 會將隱藏浮水印和 [C2PA](https://c2pa.org/) 中繼資料新增至所有產生的影像。

您可以使用 Amazon Bedrock 主控台中的浮水印偵測功能，或呼叫 Amazon Bedrock 浮水印偵測 API (預覽)，來檢查影像是否包含來自 Titan Image Generator 的浮水印。您也可以使用 [Content Credentials Verify](https://contentcredentials.org/verify) 等網站來檢查影像是否由 Titan Image Generator 產生。

**Amazon Titan 圖像生成器 v2** 概觀
+ **模型 ID** – `amazon.titan-image-generator-v2:0 `
+ **最大輸入字元** – 512 個字元
+ **最大輸入影像大小** – 5 MB （僅支援某些特定解析度）
+ **使用修圖/擴圖、背景移除、影像調節、調色盤的影像大小上限** – 1,408 x 1,408 像素
+ **使用影像變體的影像大小上限** - 4,096 x 4,096 像素
+ **語言** — 英文
+ **輸出類型** — 影像
+ **支援的影像類型** — JPEG、JPG、PNG
+ **推論類型** — 隨需、佈建的輸送量
+ **支援的使用案例** – 產生影像、編輯影像、影像變體、背景移除、顏色引導式內容 

## 功能
<a name="titanimage-features"></a>
+ 產生文字轉影像 (T2I) – 輸入文字提示並產生新影像作為輸出。產生的影像會擷取文字提示描述的概念。
+ T2I 模型的微調 — 導入數個影像以捕捉您自己的風格和個人特色，然後微調核心 T2I 模型。微調的模型會產生符合特定使用者風格和個人特色的影像。
+ 影像編輯選項 – 包括：修圖、擴圖、產生變體，以及在沒有影像遮罩情況下自動編輯。
+ 修圖 — 使用影像和分割遮罩做為輸入 (來自使用者或模型估計)，並重建遮罩中的區域。使用修圖功能來移除遮罩元素，並以背景像素取而代之。
+ 擴圖 — 使用影像和分割遮罩做為輸入 (來自使用者或由模型估算)，並產生無縫延伸區域的新像素。將影像延伸至邊界時，使用精確的擴圖功能來保留遮罩影像的像素。使用預設擴圖功能，根據分割設定將遮罩影像的像素延伸至影像邊界。
+ 影像變體 – 使用 1 到 5 個影像和選用的提示作為輸入。它會產生保留輸入影像內容的新影像，但會變更其樣式和背景。
+ 影像調節 – (僅限 V2) 使用輸入參考影像來引導影像產生。模型會產生符合參考影像配置和組成的輸出影像，同時仍遵循文字提示。
+ 主體一致性 – (僅限 V2) 主體一致性允許使用者使用參考影像微調模型，以在產生的影像中保留所選的主體 (例如寵物、鞋子或包包)。
+ 顏色引導式內容 – (僅限 V2) 您可以提供十六進位顏色代碼清單以及提示。可提供 1 到 10 個十六進位代碼。Titan Image Generator G1 V2 傳回的影像將納入使用者提供的調色盤。
+ 背景移除 – (僅限 V2) 自動識別輸入影像中的多個物件並移除背景。輸出影像的背景是透明的。
+ 內容來源 – 使用 [Content Credentials Verify](https://contentcredentials.org/verify) 等網站檢查影像是否由 Titan Image Generator 產生。除非中繼資料已移除，否則這應該表示影像已產生。

**注意**  
如果您使用的是微調的模型，則無法使用 API 或模型的修圖、擴圖或調色盤功能。

## Parameters
<a name="titanimage-parameters"></a>

如需 Amazon Titan Image Generator G1 模型推論參數的資訊，請參閱 [Amazon Titan Image Generator G1 模型推論參數](model-parameters-titan-image.md)。

## 微調
<a name="titanimage-finetuning"></a>

如需微調 Amazon Titan Image Generator G1 模型的詳細資訊，請參閱下列頁面。
+ [準備資料以微調模型](model-customization-prepare.md)
+ [Amazon Titan 圖像生成器 G1 模型自訂超參數](custom-models-hp.md#cm-hp-titan-image)

**Amazon Titan Image Generator G1 模型微調和定價**

模型使用以下範例公式計算每個任務的總價：

總價 = 步驟數 \$1 批次大小 \$1 顯示的影像單價

最小值 (自動)：
+ 步驟數下限 (自動) - 500
+ 批次大小下限 - 8
+ 預設學習速率 - 0.00001
+ 顯示的影像單價 - 0.005

**微調超參數設定**

**步驟數** – 模型對每個批次公開的次數。沒有設定預設步驟計數。您必須選取一個介於 10 到 40,000 之間的數字，或選取「自動」的字串值。

**步驟設定 - 自動** – Amazon Bedrock 會根據訓練資訊決定合理的值。選取此選項可將模型效能的優先順序高於訓練成本。步驟數量會自動決定。根據您的資料集，此數字通常介於 1,000 到 8,000 之間。任務成本會受用於將模型向資料公開之步驟數量的影響。請參閱定價詳細資訊的定價範例區段，以了解如何計算任務成本。(請參閱上方範例表格，了解當選取「自動」時，步驟計數與影像數量的關係。) 

**步驟設定 - 自訂** – 您可以輸入您希望 Bedrock 向訓練資料公開自訂模型的步驟數量。此值介於 10 到 40,000 之間。您可以使用較低的步驟計數值來降低模型產生每個影像的成本。

**批次大小** – 更新模型參數前處理的樣本數。此值介於 8 到 192 之間，且為 8 的倍數。

**學習速率** – 每批次訓練資料後更新模型參數的速率。這是介於 0 到 1 之間的浮點數值。學習速率預設為 0.00001。

如需微調程序的詳細資訊，請參閱[提交模型自訂任務](https://docs.aws.amazon.com/bedrock/latest/userguide/model-customization-submit.html)。

## Output
<a name="titanimage-output"></a>

Amazon Titan Image Generator G1 模型使用輸出映像大小和品質來判斷映像的定價方式。根據大小，模型有兩個定價區段：一個用於 512\$1512 映像，另一個用於 1024\$11024 映像。定價是根據影像尺寸高度 \$1 寬度，小於或等於 512\$1 512 或大於 512\$1 512。

如需 Amazon Bedrock 定價的詳細資訊，請參閱 [Amazon Bedrock 定價](https://aws.amazon.com/bedrock/pricing/)。

## 浮水印偵測
<a name="titanimage-watermark"></a>

**注意**  
Amazon Bedrock 主控台和 API 的浮水印偵測可在公開預覽版本中使用，而且只會偵測從 Titan Image Generator G1 產生的浮水印。這個功能目前只能在 `us-west-2` 和 `us-east-1` 區域中使用。浮水印偵測能夠對 Titan Image Generator G1 產生的浮水印進行高度準確的偵測。藉由修改原始影像而得的影像，可能會產生較不準確的偵測結果。

此模型隱藏浮水印新增至所有產生的影像，以減少散播錯誤資訊，並協助保護著作權並追蹤內容使用情形。浮水印偵測可協助您確認影像是否由 Titan Image Generator G1 模型產生，這會檢查此浮水印是否存在。

**注意**  
浮水印偵測 API 處於預覽狀態，可能會有所變更。建議您建立虛擬環境以使用 SDK。由於最新的 SDK 不提供浮水印偵測 API，因此建議您先解除安裝虛擬環境中最新版的 SDK，再使用浮水印偵測 API 安裝該版本。

您可以上傳影像，以偵測影像上是否有來自 Titan Image Generator G1 的浮水印。依照下列步驟使用主控台偵測此模型中的浮水印。

**若要使用 Titan Image Generator G1 偵測浮水印：**

1. 在 [Amazon Bedrock 主控台](https://console.aws.amazon.com/bedrock)開啟 Amazon Bedrock 主控台

1. 從 Amazon Bedrock 的導覽窗格中選取**概觀**。選擇**建置並測試**索引標籤。

1. 在**保護措施**區段中，前往**水印偵測**，然後選擇**檢視水印偵測**。

1. 選取**上傳影像**，並尋找 JPG 或 PNG 格式的檔案。允許的檔案大小上限為 5 MB。

1. 上傳後，會顯示影像的縮圖及名稱、檔案大小和上次修改日期。選取 X 可刪除或取代**上傳**區段中的影像。

1. 選取**分析**以開始浮水印偵測分析。

1. 影像可在**結果**下方預覽，並會在影像下方及影像上的橫幅指出**偵測到水印**是否偵測到浮水印。如果未偵測到浮水印，則影像下方的文字會顯示**未偵測到水印**。

1. 若要載入下一個影像，請在**上傳**區段中選取影像縮圖中的 X，然後選擇要分析的新影像。

## 提示工程指導方針
<a name="titanimage-prompt"></a>

**遮罩提示** — 此演算法會將像素歸類為概念。使用者可以提供文字提示，用於根據遮罩提示的解釋對要遮罩的影像區域進行分類。提示選項可以解譯更複雜的提示，並將遮罩編碼為分割演算法。

**影像遮罩** — 您也可以使用影像遮罩來設定遮罩值。影像遮罩可與遮罩的提示輸入結合使用，以提高準確度。影像遮罩檔必須符合以下參數：
+ 遮罩影像的遮罩影像值必須是 0 (黑) 或 255 (白)。值為 0 的影像遮罩區域，會以使用者提示和/或輸入影像中的影像重新產生。
+ `maskImage` 欄位必須是 base64 編碼的影像字串。
+ 遮罩影像必須具有與輸入影像相同的尺寸 (相同的高度和寬度)。
+ 輸入影像和遮罩影像只能使用 PNG 或 JPG 檔案。
+ 遮罩影像只能使用黑白像素值。
+ 遮罩影像只能使用 RGB 色頻 (不支援 Alpha 色頻)。

如需 Amazon Titan 圖像生成器提示工程的詳細資訊，請參閱 [Amazon Titan 圖像生成器 G1 提示工程最佳實務](https://d2eo22ngex1n9g.cloudfront.net/Documentation/User+Guides/Titan/Amazon+Titan+Image+Generator+Prompt+Engineering+Guidelines.pdf)。

如需一般提示工程指導方針，請參閱[提示工程指導方針](https://docs.aws.amazon.com/bedrock/latest/userguide/prompt-engineering-guidelines.html)。