標識設(shè)計是一個費時費力的過程。而最近生成式模型領(lǐng)域進展飛速,這就讓人好奇AI可不可以用來設(shè)計標識?生成對抗網(wǎng)絡(luò)(GAN)據(jù)說能夠?qū)W習模擬任何數(shù)據(jù)分布,已經(jīng)取得了廣泛的應(yīng)用,但目前很少有人研究如何用GAN來設(shè)計標識。年底召開的ICMLA 2018上有一篇論文,馬斯特里赫特大學的Ajkel Mino和Gerasimos Spanakis,提出了根據(jù)顏色自動生成標識的LoGAN模型,可以說是這一方向上的初步探索。
LoGAN架構(gòu)
GAN
在介紹LoGAN架構(gòu)之前,先溫習下GAN網(wǎng)絡(luò)。
GAN由生成器和判別器兩個神經(jīng)網(wǎng)絡(luò)組成,以對抗的形式同時訓練。
GAN是出名的難訓練,飽受訓練不穩(wěn)定、無法收斂、模式崩塌之苦。近年來有不少研究都試圖改進GAN的訓練過程,例如在GAN中引入深度卷積層(DCGAN),修改目標函數(shù)(LSGAN和WGAN)。
條件GAN
如前所述,LoGAN是根據(jù)顏色自動生成標識,換句話說,是以顏色為條件。能夠基于標簽數(shù)據(jù)生成特定分類的圖像的GAN架構(gòu),主要有兩種:
CGAN,生成器和判別器都額外接受一個類別標簽數(shù)據(jù)。
AC-GAN,判別器不僅需要識別圖像的真?zhèn)?,還需要判斷圖像的類別(不論真?zhèn)危?/p>
GAN、CGAN、AC-GAN架構(gòu)對比
LoGAN即基于AC-GAN改造得到。
AC-WGAN-GP
在AC-GAN架構(gòu)中(參見上圖),判別器同時優(yōu)化真?zhèn)握`差和類別誤差:
不過,考慮到WGAN-GP更穩(wěn)定,所以LoGAN用WGAN-GP的損失函數(shù)替換了AC-GAN的損失函數(shù):
但是這就造成了一個問題,類別損失沒有了。所以,LoGAN在AC-GAN的基礎(chǔ)上額外增加了一個分類器Q,輔助判別器進行分類。也就是說,和AC-GAN不同,LoGAN由三個網(wǎng)絡(luò)組成:生成器G、判別器D、分類器Q。
經(jīng)過改造的AC-GAN
分類器Q的損失函數(shù)定義如下:
為了避免訓練不穩(wěn)和模式崩塌,LoGAN的訓練借鑒了一些最新研究成果,采取了以下措施:
判別器每迭代5次,分別迭代一次生成器和分類器。
z取樣自高斯分布。
應(yīng)用了批歸一化。
試驗
數(shù)據(jù)集
LoGAN基于LLD-icons數(shù)據(jù)集訓練,該數(shù)據(jù)集包含486377張32×32像素的圖標。
使用了K均值聚類(k = 3)從圖像中提取主要色彩,然后分為黑、藍、棕等12類:
訓練
下為判別器、生成器、分類器的訓練損失圖像。
從圖中我們可以看到,判別器和生成器的損失圖像有下降趨勢,沒有收斂。不過這并不意味著訓練有問題,因為WGAN和WGAN-GP都不保證收斂。另一方面,分類器收斂至接近1的損失值。實際上,生成圖像的分類損失收斂至零,這意味著生成圖像都能被正確分類。
結(jié)果
400個epoch的訓練后,每個分類生成了64個標識:
由于是在32×32像素的圖標上訓練的,所以生成的標識有點模糊。生成的標識大多為圓形或方形,但也有不規(guī)則形狀,如心形和X形。
各個分類主要顏色的準確率、召回、F1數(shù)據(jù)如下表所示:
有些分類的評分偏低,這是因為很多圖標周圍使用白色作為背景,同理,灰色作為中性色,也有很多圖標使用。
各分類主要顏色分布
改進方向
盡管取得了很有潛力的結(jié)果,LoGAN目前還是有不少限制:
對抗生成網(wǎng)絡(luò)的常見問題,生成的標識很模糊。使用分辨率更高的訓練圖像應(yīng)該能緩解這一問題。
僅僅使用顏色作為關(guān)鍵詞局限性太大。未來考慮加入形狀、公司的重心等其他關(guān)鍵詞。
-
GaN
+關(guān)注
關(guān)注
19文章
1896瀏覽量
72330 -
生成器
+關(guān)注
關(guān)注
7文章
313瀏覽量
20923
原文標題:LoGAN:根據(jù)顏色自動生成標識
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論