0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GTN可以勾勒出夸張的幾何線條?

lhl545545 ? 來(lái)源:中科院長(zhǎng)春光機(jī)所 ? 作者:中科院長(zhǎng)春光機(jī)所 ? 2020-06-05 15:37 ? 次閱讀

漫畫(huà)是很多人的童年回憶,除了經(jīng)典的《銀魂》、《海賊王》、《火影》,久保帶人的作品《死神》也很有人氣。最近,六位來(lái)自北航的研究者推出了一款漫畫(huà)臉轉(zhuǎn)換模型「MangaGAN」,實(shí)現(xiàn)了真人照片到漫畫(huà)臉的完美轉(zhuǎn)換。

我們可以合理懷疑,幾位論文作者都是久保帶人的粉絲。

這篇論文中提出的「MangaGAN」,是一種基于生成對(duì)抗網(wǎng)絡(luò)(GAN)的非成對(duì)照片到漫畫(huà)轉(zhuǎn)換方法。用來(lái)訓(xùn)練 MangaGAN 的數(shù)據(jù)集也來(lái)源于一部非常受歡迎的漫畫(huà)作品——久保帶人的《死神(Bleach)》,包含漫畫(huà)人臉的面部特征、特征點(diǎn)、身體等元素,所以生成結(jié)果也帶有強(qiáng)烈的久保帶人風(fēng)格。

標(biāo)準(zhǔn)漫畫(huà)臉是如何生成的?

MangaGAN 生成漫畫(huà)臉的整體流程。

總體來(lái)說(shuō),MangaGAN 包含兩個(gè)分支:

一個(gè)分支通過(guò)幾何轉(zhuǎn)換網(wǎng)絡(luò)(Geometric Transformation Network,GTN)學(xué)習(xí)幾何映射;

另一個(gè)分支通過(guò)外觀轉(zhuǎn)換網(wǎng)絡(luò)(Appearance Transformation Network,ATN)學(xué)習(xí)外觀映射。

最后通過(guò)合成模塊將二者融合,從而生成漫畫(huà)臉。

假設(shè) P 表示照片,M 表示生成的漫畫(huà)臉,二者之間不存在成對(duì)關(guān)系。給定一張照片 p∈P,MangaGAN 學(xué)習(xí)映射

 GTN可以勾勒出夸張的幾何線條?

將 p 遷移至樣本

 GTN可以勾勒出夸張的幾何線條?

(m∈M),同時(shí)為 m 加上漫畫(huà)風(fēng)格和面部相似度。

圖中(f)步驟通過(guò) GTN 勾勒出夸張的幾何線條,并確定五官的幾何分布位置;圖中(e)步驟則通過(guò) ATN 生成所有的面部特征,包括眼睛、鼻子和嘴巴。繼而通過(guò)合成模塊將幾何輪廓和面部特征相融合,輸出漫畫(huà)臉 m∈M。

外觀轉(zhuǎn)換:ATN

 GTN可以勾勒出夸張的幾何線條?

ATN 是一個(gè) multi-GAN 結(jié)構(gòu)的網(wǎng)絡(luò),包含四個(gè)局部 GAN,分別用來(lái)轉(zhuǎn)換眼、口、鼻和頭發(fā)這四個(gè)面部位置。針對(duì)每個(gè)部位的 GAN,會(huì)有專屬的訓(xùn)練策略和編碼器以改善其性能。

眼睛和嘴巴是漫畫(huà)臉的靈魂所在,但也是最難轉(zhuǎn)換的部分,隨著表情的變化,這兩個(gè)部位的特征也會(huì)變化。

對(duì)于眼睛和嘴巴部位,為了實(shí)現(xiàn)更好的非成對(duì)數(shù)據(jù)匹配,研究者將 CycleGAN 與反向映射(reverse mapping)相結(jié)合,并進(jìn)行了三項(xiàng)改進(jìn):

第一,設(shè)計(jì)了一個(gè)帶有 SP loss L_SP 的 Similarity Preserving (SP) 模塊,以增強(qiáng)相似度;

第二,訓(xùn)練編碼器 E^eye 用于提取 p^eye 的主干,訓(xùn)練編碼器 E^mouth 用于提取 p^mouth 的輪廓線條;

第三,提出結(jié)構(gòu)平滑損失 L_SS,幫助網(wǎng)絡(luò)生成筆觸平滑的漫畫(huà)臉。

使用不同的改進(jìn)方法得到的眼部和嘴部區(qū)域?qū)Ρ惹闆r。

上圖第 5 列和第 11 列展示了使用 SP 模塊進(jìn)行改進(jìn)的效果;第 6 列和第 12 列分別展示了使用編碼器 E^eye 和 E^mouth 的改進(jìn)效果;第 4 列和第 10 列展示了使用結(jié)構(gòu)平滑損失進(jìn)行改進(jìn)的效果。

鼻子和頭發(fā)的生成則相對(duì)簡(jiǎn)單,大部分動(dòng)漫人物的鼻型相似,因此該研究使用基于 ProGAN 的架構(gòu)生成鼻子。頭發(fā)部分則使用了 APDdrawingGAN,通過(guò)頭發(fā)分割方法劃分出大致的頭發(fā)區(qū)域,然后使用肖像分割方法移除多余的背景區(qū)域,即可生成類似漫畫(huà)風(fēng)格的頭發(fā)樣式。

幾何轉(zhuǎn)換:GTN

在轉(zhuǎn)換面部特征點(diǎn)時(shí)會(huì)遇到一個(gè)問(wèn)題:面部特征的搭配模式限制了結(jié)果的多樣性。比如,臉型相同的人可能有著不同的眼口鼻大小或位置,但 GAN 在接受全局人臉特征點(diǎn)訓(xùn)練時(shí)可能遵循固定或類似的搭配模式。因此研究者也將「幾何特征」分解為三種屬性:臉型、位置、大小,并使用三個(gè) sub-GAN 分別轉(zhuǎn)換。

GTN pipeline。幾何信息被分為三種獨(dú)立屬性:位置、大小和臉型,然后使用 N_loc、N_siz、N_sha 三個(gè) sub-GAN 分別進(jìn)行轉(zhuǎn)換。

最終,如圖 5(b) 所示,基于預(yù)定義的臉頰和額頭比例,生成了整張漫畫(huà)臉的幾何特征。

最后一步:融合

這一步的目的是融合人臉特征和幾何特征,從而生成漫畫(huà)臉。

如上圖所示,首先,根據(jù)幾何特征來(lái)調(diào)整和定位各面部特征組件;

其次,基于分段三次 Hermite 插值多項(xiàng)式 (PCHIP) 方法,獲得平滑的曲線并保留臉部形狀,然后通過(guò)擬合生成人臉特征點(diǎn)的曲線來(lái)繪制臉型;

然后,模型提供了 10 種漫畫(huà)式耳朵供選擇,而非按照片重新生成,因?yàn)槎涞臉邮綄?duì)面部表情來(lái)說(shuō)影響不大;

此外,研究者還收集了 8 種漫畫(huà)人物身體(manga body),用來(lái)與生成的漫畫(huà)臉搭配。

最后就可以輸出漫畫(huà)結(jié)果啦。該模型提供了快速微調(diào)尺寸和位置的工具,以及鼻子、耳朵和骨架等組件的切換工具,用戶可以按照個(gè)人喜好進(jìn)行調(diào)整,生成自己喜歡的漫畫(huà)臉。

MangaGAN 效果如何?

該研究所用的實(shí)驗(yàn)數(shù)據(jù)集包括三部分:漫畫(huà)數(shù)據(jù)集、照片數(shù)據(jù)集和人像數(shù)據(jù)集。漫畫(huà)數(shù)據(jù)集來(lái)源于一部流行的漫畫(huà)作品《死神》,包括 448 雙眼睛、109 個(gè)鼻子、179 個(gè)嘴巴和 106 張正面漫畫(huà)臉。

研究者將 MangaGAN 與 9 種漫畫(huà)臉生成 SOTA 方法進(jìn)行了對(duì)比,效果生成如下圖所示:

可以看到,其他方法生成的漫畫(huà)臉都會(huì)有扭曲和突兀的線條,或是面部存在莫名的陰影,其原因在于生成過(guò)程中忽視了幾何特征的轉(zhuǎn)換。相比之下,MangaGAN 生成的臉部十分干凈利落,沒(méi)有多余的部分。

接下來(lái)是跨域轉(zhuǎn)換層面中 MangaGAN 與其他方法的對(duì)比。為公平起見(jiàn),CycleGAN 和 UNIT 先轉(zhuǎn)換全臉再轉(zhuǎn)換每個(gè)人臉特征。最終效果如下圖所示:

很明顯,其他方法在匹配照片和漫畫(huà)時(shí)容易出現(xiàn)問(wèn)題,它們更關(guān)心二者的黑暗區(qū)域是否匹配,但沒(méi)有轉(zhuǎn)換臉型和筆觸。MangaGAN 的生成結(jié)果則更接近理想中的漫畫(huà)臉,臉型棱角分明,眉形平滑,嘴巴也進(jìn)行了簡(jiǎn)化,幾乎完全符合手繪漫畫(huà)的人物長(zhǎng)相特征。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 幾何
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    12323
  • 合成
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    13761
  • ATN
    ATN
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    3598
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    低壓線性恒流LED恒流驅(qū)動(dòng)芯片:用于洗墻燈和線條

    洗墻燈和線條燈是兩種常見(jiàn)的LED照明產(chǎn)品,它們都需要使用LED恒流驅(qū)動(dòng)芯片來(lái)確保穩(wěn)定、可靠的電流供應(yīng),從而保證LED的使用壽命和亮度。 ? 洗墻燈樣式 對(duì)于洗墻燈而言,由于其發(fā)出的光線需要覆蓋較大
    的頭像 發(fā)表于 08-16 10:04 ?508次閱讀

    機(jī)床的幾何精度什么和什么時(shí)是有區(qū)別的

    機(jī)床的幾何精度是指機(jī)床在加工過(guò)程中,其各部件的幾何形狀和相互位置精度。它直接關(guān)系到機(jī)床的加工精度和加工質(zhì)量。機(jī)床的幾何精度主要包括機(jī)床的直線度、平面度、圓度、同軸度、垂直度等。下面將詳細(xì)介紹機(jī)床
    的頭像 發(fā)表于 06-07 10:31 ?785次閱讀

    數(shù)控機(jī)床的幾何精度是表明所測(cè)量的什么

    數(shù)控機(jī)床的幾何精度是衡量機(jī)床加工精度的重要指標(biāo)之一,它直接關(guān)系到機(jī)床的加工質(zhì)量、生產(chǎn)效率和使用壽命。本文將詳細(xì)介紹數(shù)控機(jī)床幾何精度的基本概念、測(cè)量方法、影響因素以及提高措施。 一、數(shù)控機(jī)床幾何精度
    的頭像 發(fā)表于 06-07 10:00 ?829次閱讀

    Thinborne揭示Galaxy Z Fold6 CAD渲染圖,線條硬朗,重量輕盈

    據(jù)了解,美國(guó)知名手機(jī)配件制造商Thinborne近期在其社交媒體上曝光了尚未公布的三星GalaxyZFold6CAD渲染圖(現(xiàn)已撤回),該產(chǎn)品外觀線條更為硬朗,尺寸較前代有所增加。
    的頭像 發(fā)表于 05-07 14:57 ?432次閱讀

    WD4000無(wú)圖晶圓幾何量測(cè)系統(tǒng)

    在wafer基材加工階段,從第一代硅,第二代砷化鎵到第三代也是現(xiàn)階段熱門(mén)的碳化硅、氮化鎵襯底都是通過(guò)晶錠切片、研磨、拋光后獲得,每片襯底在各工藝后及出廠前,都要對(duì)厚度、翹曲度、彎曲度、粗糙度等幾何
    發(fā)表于 03-18 10:47 ?1次下載

    低壓線性恒流LED恒流驅(qū)動(dòng)芯片SM15633EH:用于洗墻燈和線條

    洗墻燈和線條燈是兩種常見(jiàn)的LED照明產(chǎn)品,它們都需要使用LED恒流驅(qū)動(dòng)芯片來(lái)確保穩(wěn)定、可靠的電流供應(yīng),從而保證LED的使用壽命和亮度。
    的頭像 發(fā)表于 03-12 16:36 ?684次閱讀
    低壓線性恒流LED恒流驅(qū)動(dòng)芯片SM15633EH:用于洗墻燈和<b class='flag-5'>線條</b>燈

    “芯”動(dòng)未來(lái),無(wú)圖晶圓幾何量測(cè)系統(tǒng)提升半導(dǎo)體競(jìng)爭(zhēng)力

    無(wú)圖晶圓幾何量測(cè)系統(tǒng),適用于線切、研磨、拋光工藝后,進(jìn)行wafer厚度(THK)、整體厚度變化(TTV)、翹曲度(Warp)、彎曲度(Bow)等相關(guān)幾何形貌數(shù)據(jù)測(cè)量,能夠提供Thickness
    的頭像 發(fā)表于 02-29 09:14 ?755次閱讀
    “芯”動(dòng)未來(lái),無(wú)圖晶圓<b class='flag-5'>幾何</b>量測(cè)系統(tǒng)提升半導(dǎo)體競(jìng)爭(zhēng)力

    基于圖像處理技術(shù)的螺紋幾何參數(shù)測(cè)量系統(tǒng)設(shè)計(jì)

    摘要:針對(duì)螺紋幾何參數(shù)測(cè)量過(guò)程中,傳統(tǒng)人工測(cè)量效率低、儀器昂貴、耗時(shí)費(fèi)力、偶伴有人為誤差等不足。本研究采用非接觸測(cè)量的方法, 利用計(jì)算機(jī)視覺(jué)的圖像處理技術(shù),通過(guò)系統(tǒng)標(biāo)定、圖像采集、圖像預(yù)處理、邊緣
    的頭像 發(fā)表于 01-15 11:13 ?791次閱讀
    基于圖像處理技術(shù)的螺紋<b class='flag-5'>幾何</b>參數(shù)測(cè)量系統(tǒng)設(shè)計(jì)

    LED洗墻燈跟線條燈的區(qū)別,使用的芯片有何差異?

    LED洗墻燈跟線條燈的區(qū)別,使用的芯片有何差異?
    的頭像 發(fā)表于 01-05 14:30 ?1553次閱讀

    幾何尺寸測(cè)量工具介紹

    傳統(tǒng)的幾何尺寸測(cè)量?jī)x器設(shè)備包括千分尺、角度尺、游標(biāo)卡尺等,這些儀器能夠滿足一般的幾何量測(cè)量需求。但是隨著科技的發(fā)展,越來(lái)越多高精度測(cè)量?jī)x器被應(yīng)用于幾何量測(cè)量領(lǐng)域。從納米級(jí)光學(xué)3D表面輪廓儀通過(guò)光學(xué)
    的頭像 發(fā)表于 12-26 17:16 ?947次閱讀
    <b class='flag-5'>幾何</b>尺寸測(cè)量工具介紹

    幾何量測(cè)量基本原理及精密儀器

    從納米級(jí)光學(xué)3D表面輪廓儀通過(guò)光學(xué)原理測(cè)量物體的三維形狀,到百米級(jí)激光跟蹤儀高精度(μm級(jí))、大工作空間(百米級(jí))的坐標(biāo)和空間姿態(tài)測(cè)量,越來(lái)越多高精度測(cè)量?jī)x器被應(yīng)用于幾何量測(cè)量領(lǐng)域。
    的頭像 發(fā)表于 12-20 16:43 ?739次閱讀
    <b class='flag-5'>幾何</b>量測(cè)量基本原理及精密儀器

    幾何量公差與檢測(cè)基本原理及測(cè)量?jī)x器

    三本精密儀器小編獲悉,在現(xiàn)代科技的發(fā)展中,幾何量測(cè)量已經(jīng)成為許多工程領(lǐng)域不可或缺的一部分。通過(guò)準(zhǔn)確測(cè)量物體的形狀、尺寸等幾何屬性,可以為產(chǎn)品設(shè)計(jì)、機(jī)械加工、工程測(cè)量等提供重要的依據(jù)。如何進(jìn)行
    的頭像 發(fā)表于 12-20 15:48 ?589次閱讀
    <b class='flag-5'>幾何</b>量公差與檢測(cè)基本原理及測(cè)量?jī)x器

    雙超透鏡:根據(jù)光線條件在拍攝模式之間切換

    拍攝物體的過(guò)程中,會(huì)采用兩種不同的模式:一是正常模式,用于提取基本信息;二是邊緣模式,該模式僅專注于勾勒對(duì)象的輪廓。傳統(tǒng)上,這些模式需
    的頭像 發(fā)表于 12-06 06:31 ?348次閱讀
    雙超透鏡:根據(jù)光<b class='flag-5'>線條</b>件在拍攝模式之間切換

    如何在 CFD 設(shè)計(jì)中利用網(wǎng)格維護(hù)幾何形狀并減少運(yùn)行時(shí)間?

    如何在 CFD 設(shè)計(jì)中利用網(wǎng)格維護(hù)幾何形狀并減少運(yùn)行時(shí)間?
    的頭像 發(fā)表于 11-24 17:07 ?444次閱讀
    如何在 CFD 設(shè)計(jì)中利用網(wǎng)格維護(hù)<b class='flag-5'>幾何</b>形狀并減少運(yùn)行時(shí)間?

    基于幾何分析的神經(jīng)輻射場(chǎng)編輯方法

    神經(jīng)輻射場(chǎng)作為近期一個(gè)廣受關(guān)注的隱式表征方法,能合成照片級(jí)真實(shí)的多視角圖像。但因?yàn)槠潆[式建模的性質(zhì),用戶難以直觀編輯神經(jīng)輻射場(chǎng)建模對(duì)象的幾何。面對(duì)這一問(wèn)題,最新被IEEE TPAMI接收的論文
    的頭像 發(fā)表于 11-20 16:56 ?488次閱讀
    基于<b class='flag-5'>幾何</b>分析的神經(jīng)輻射場(chǎng)編輯方法