虛擬試戴 - Amazon Nova

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

虛擬試戴

虛擬試戴是一種影像引導的使用案例,其中參考影像的內容會根據遮罩影像的引導疊加到來源影像中。Amazon Nova Canvas 已針對服裝、配件、家具和相關物件進行調校。此模型也很適合其他案例,例如將標誌或文字新增至影像。

您可以使用虛擬試用 API 產生最多五個映像。根據預設,只會產生一個映像。

若要執行虛擬試戴,您必須提供三個映像:

  • 來源映像 - 您要修改的原始映像。例如,這可能是影像、人物或房間場景。

  • 參考影像 - 包含您要疊加至來源影像的項目、物件或文章的影像。例如,這可能包含夾克、保齡球或沙發。對於服裝,參考影像可以包含身體上或身體外的服裝,並且可以包含代表不同服裝組件的多種產品 (例如單一影像中的衣服、褲子和鞋子)。

  • 遮罩影像 - 定義您要修改之來源部分的影像。遮罩影像是黑白影像,用於定義應該修改來源影像的哪個部分。黑色像素表示要修改的來源影像區域,而白色像素表示要保留的影像區域。您可以提供自己的遮罩影像,也可以讓模型根據您提供的其他輸入參數為您建立一個。

    如果指定,則可以將遮罩映像傳回為輸出的一部分。

以下是模型運作方式的一些範例。

Upper body clothing

下圖顯示 Amazon Nova 如何將上半身衣物附加至模型的範例。

來源映像

參考影像

輸出

戴著太陽鏡、向左看、戴著藍色襯衫的男性。
粉紅色的排扣襯衫。
表示戴著太陽眼鏡、注視左側、戴著粉紅色的排扣襯衫。
Couch in a room

下圖顯示 Amazon Nova 如何將沙發疊加到家具房間中的範例。

來源映像

參考影像

輸出

房間中世紀的現代灰色沙發,被其他裝飾包圍。
白色背景上的橘色沙發。
房間中的橘色沙發被其他裝飾包圍。

與其他 Amazon Nova Canvas 任務類型不同,虛擬試用不支援文字提示或負面文字提示。

定義遮罩映像

您可以直接提供遮罩影像,方法是指定maskType: "IMAGE"或允許模型使用輔助輸入,例如 maskType: "GARMENT"或 自動運算maskType: "PROMPT"

"GARMENT" 指定 的遮罩類型時,Amazon Nova Canvas 會根據您指定的garmentClass輸入參數值建立服裝感知遮罩。在大多數情況下,您可以使用下列其中一種高階衣物類別:

  • "UPPER_BODY" - 建立包含完整手臂長度的遮罩。

  • "LOWER_BODY" - 建立遮罩, 包含完整腿部長度,且腿部之間沒有間隙。

  • "FOOTWEAR" - 建立符合來源影像中示範的鞋子描述檔的遮罩。

  • "FULL_BODY" - 建立相當於 "UPPER_BODY"和 組合的遮罩"LOWER_BODY"

您可以使用"PROMPT"遮罩類型,使用自然語言來描述您要取代的來源映像中的項目。這對於非服裝案例很有用。此功能會使用與透過 maskPrompt 參數存在於"INPAINTING"任務類型中的相同自動遮罩功能。

警告

使用 遮罩類型建立的"PROMPT"遮罩將緊密遵守您描述的項目形狀。在許多情況下,這可能有問題,因為您新增的產品可能不會共用您正在取代的項目的相同剪影或大小。因此,虛擬試用 API 也提供可設定為 的選用maskShape參數"BOUNDING_BOX"。我們建議在使用 "PROMPT"遮罩類型時,在大多數情況下使用此設定 (這是預設值)。

產生新的姿勢、手或臉部

您可以指示模型保留或重新產生來源影像中人物的姿勢、手或臉部。當您選擇保留這些元素時,它們會自動從遮罩影像中移除,無論您maskType選擇哪個元素。

在下列情況下,您可能想要保留姿勢、手或臉部:

  • 您正在開發一個應用程式,允許最終使用者繪製自己的遮罩。保留這些功能可防止最終使用者意外地在遮罩中包含手或臉。

  • 您正在使用 ,maskShape: BOUNDING_BOX但不想產生新的手或臉。使用 preserveFace: ON或 時preserveHands: ON,這些功能會自動從遮罩中移除。

  • 您使用 maskType:GARMENTmaskShape: BOUNDING_BOX搭配非直立姿勢的模型。在這種情況下,週框方塊遮罩可以重疊臉部,我們建議您使用 preserveFace: ON

相反地,您可能想要在下列情況中重新產生姿勢、手或臉部:

  • 對於覆蓋脖子的服裝, preserveFace: ON可以排除足夠的脖子,以對輸出產生不利影響。

  • 當模型穿著高跟鞋子,而參考影像是平跟鞋子,反之亦然。在這種情況下,保留身體姿勢會產生不自然的外觀結果。

  • 與上一點類似,在嘗試包包或其他配件時,產生新的姿勢或手可能會產生更自然的結果。

樣式提示

garmentStyling 參數可讓您保留或修改您可能會在相片拍攝中找到的特定服裝樣式提示。例如,Amazon Nova Canvas 可以修改襯衫的樣式,使其套套上或收下,也可以修改襯衫,使其卡入或不卡入。以下是可用的選項:

  • "longSleeveStyle" - 控制長筒襯衫的套套是否捲起或收下。

    • "SLEEVE_DOWN" - 可在來源映像使用長型套衣 (套套上或下套)、短型套衣或無套衣套時套用。

    • "SLEEVE_UP" - 可在來源映像使用長套裘裘裘裘裘、短套裘裘裘裘裘裘裘裘裘裘裘裘裘裘裘裘裘裘裘�����裘裘裘�

  • "tuckingStyle" - 控制上身衣物是否卡入或鬆動。

    • "UNTUCKED" - 無論來源映像是否塞入或未塞入,都可以套用。

    • "TUCKED" - 當來源映像已塞入襯衫時,即可套用。

  • "outerLayerStyle" - 控制上身服裝的樣式為開啟或關閉。此預設值"CLOSED"適用於大多數衣物 (例如襯衫和毛線衣)。對於夾克等外部服裝,請設定此值,"OPEN"以確保來源影像的原始上半身服裝將保留,並將新的外部服裝分層。"CLOSED" 搭配外部衣服使用 值,不一定會將衣服呈現為關閉。這是因為 的值"CLOSED"僅保證來源影像中的每個上半身衣服都會被替換,並且有時可能會導致開放的外層,並在底下可見新的底層。

    • "CLOSED"

    • "OPEN"

如需詳細資訊,請參閱 中的garmentStyling參數產生映像的請求和回應結構

影像拼接

虛擬試戴可讓您判斷影像如何拼接在一起以建立最終影像。您可以選擇 "BALANCED""SEAMLESS""DETAILED"。每個合併樣式都採用不同的方法來將元素拼接在一起以建立最終影像,每個都具有自己的優點和權衡。

  • "BALANCED" - 保護原始映像中的任何非遮罩像素,確保它們與原始映像保持 100% 準確。在某些情況下,輸出影像中會有輕微可見的顏色或紋理不相符,而輸出影像會呈現為遮罩形狀的「幽靈」影像。當影像特徵為一個人站在純色或均勻紋理背景上時,最可能發生這種情況。若要避免這種情況,您可以改為使用"SEAMLESS"合併樣式。

  • "SEAMLESS" - 確保最終影像中遮罩和非遮罩影像區域之間永遠不會有明顯的接縫。權衡是影像中的所有像素都會稍微變更,有時在影像的非遮罩區域中會減少精細細節。

  • "DETAILED" - 可大幅改善標誌和文字等精細細節,特別是遮罩區域與整體影像相比相對較小時。模型透過對僅包含遮罩區域的原始映像的緊密裁剪、更高解析度版本執行注入來實現此目標。然後,它會將結果合併回原始影像。如同使用 "BALANCED" 模式,此模式有時可能會導致可見的接縫。