0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

現(xiàn)有GAN存在哪些關鍵屬性缺失?

zhKF_jqr_AI ? 來源:未知 ? 作者:胡薇 ? 2018-07-07 09:26 ? 次閱讀

近日,加拿大猶太綜合醫(yī)院Lady Davis Institute的生物統(tǒng)計學家Alexia Jolicoeur-Martineau發(fā)表了一篇令人矚目的論文,引起“GAN之父”Ian Goodfellow的注意。在論文中,她指出現(xiàn)有的標準GAN(SGAN)還缺少一個基本屬性,即訓練生成器時,我們不僅應該提高偽數(shù)據(jù)是真實數(shù)據(jù)的概率,還應該降低實際數(shù)據(jù)是真實數(shù)據(jù)的概率。這個屬性是一個重要基礎,它也是所有GAN都應該遵守的。

在標準生成對抗網絡(SGAN)中,判別器負責估計輸入數(shù)據(jù)是真實數(shù)據(jù)的概率,根據(jù)這個數(shù)值,我們再訓練生成器以提高偽數(shù)據(jù)是真實數(shù)據(jù)的概率。但本文認為,判別器在提高“偽數(shù)據(jù)為真”的概率的同時,也應該降低“實際數(shù)據(jù)為真”的概率,原因有三:

mini-batch中一半的數(shù)據(jù)是偽數(shù)據(jù),這個先驗會帶來不合邏輯的結果;

在最小化散度(divergence minimization)的過程中,兩個概率不是同步變化;

實驗證實,經過相對判別器誘導,SGAN的性能可以媲美基于IPM的GAN(WGAN、WGAN-GP等),而后者實際上已經具有相對判別器的雛形,因此也更穩(wěn)定。

本文提出相對GAN(RGAN),并在它的基礎上又提出了一個變體——相對均值GAN(RaGAN),變體用平均估計計算判別器概率。此外,論文還顯示基于IPM的GAN其實是RGAN的子集。

通過比較,文章發(fā)現(xiàn):(1)相比非相對GAN,RGAN和RaGAN更穩(wěn)定,產出的數(shù)據(jù)樣本質量更高;(2)在RaGAN上加入梯度懲罰后,它能生成比WGAN-GP質量更高的數(shù)據(jù),同時訓練時長僅為原先的1/5;(3)RaGAN能夠基于非常小的樣本(N = 2011)生成合理的高分辨率圖像(256x256),撇開做不到的GAN和LSGAN,這些圖像在質量上也明顯優(yōu)于WGAN-GP和SGAN生成的歸一化圖像。

背景簡介

GAN是Ian Goodfellow等人在2014年提出的新型神經網絡,它一經面世就收獲大量關注,并在學界持續(xù)發(fā)酵。本文把最原始的GAN稱為標準GAN,也就是SGAN,它由一個生成器G和一個判別器D構成,前者負責生成偽圖像,后者負責評估這個偽圖像是真實圖像的概率,然后輸出結果幫助生成器繼續(xù)訓練,直到最后生成判別器都難辨真假的偽圖。

從計算角度看,GAN的生成器和判別器如下所示。其中f1,f2, g1, g2都是輸入標量-輸出標量的函數(shù),P表示真實數(shù)據(jù)分布(xr實際數(shù)據(jù)),Q表示偽數(shù)據(jù)分布(xf偽數(shù)據(jù)),Pz是以0為中心的多元正態(tài)分布,方差為1,D(x)是判別器在x出的評估值。

一般形式

獨立形式:谷歌論文Are GANs Created Equal?

對于生成器,SGAN提出了兩種損失函數(shù):saturating和non-saturating。其中前者不穩(wěn)定,后者較穩(wěn)定。如果GAN能100%分類真?zhèn)螖?shù)據(jù),那saturating函數(shù)的梯度是0,non-saturating的梯度雖然不為0,但它是易變的(volatile)。這意味著如果學習率過高,判別器很可能會“放棄”學習,導致模型性能很差,這種現(xiàn)象在高維數(shù)據(jù)中尤為明顯。

雖然近幾年許多研究人員提出了很多新的損失函數(shù),但它們相比SGAN沒有太多根本上的進展,因此大多數(shù)GAN可以用non-saturating和saturating函數(shù)簡單地分成兩類:g1=? f1and g2=? f2,saturating;g1=f1and g2=f2,non-saturating。從本質上來說,它們有一定的相通之處,為了后面方便對比,本文假設所有GAN都用non-saturating損失函數(shù)。

另外,一些研究人員發(fā)現(xiàn)把IPM(Integral probability metrics積分概率指標)用于GAN可以大幅提高最終結果,但至于IPM為什么能得到這樣的效果,他們并沒有給出說明。而根據(jù)本文的研究,IPM GAN背后起作用的正是相對判別器。

SGAN遺漏的關鍵元素

本文論證的過程分為兩塊,一是直接分析“降低實際圖像是真實圖像概率”的必要性,二是用提出的RGAN和RaGAN和上述GAN做對比。本章是第一部分。

先驗知識

這塊內容比較簡單。經過足夠訓練后,判別器如果性能過關,那它就應該能正確區(qū)分大多數(shù)圖像的真?zhèn)涡?,把實際圖像歸類為真實圖像,把偽圖像歸類為非真實圖像。而生成器的目標是“愚弄”判別器,讓后者把更多的偽圖像分類為真實圖像,所以它會把一半實際圖像和一半偽圖像輸入判別器,期待從中學到更多真實圖像的分布。

雖然聽起來很有道理,但這是不合邏輯的。如果實際數(shù)據(jù)和偽數(shù)據(jù)看起來差不多,那大多數(shù)圖像的評估都符合C(xf) ≈ C(xr)。這時,如果判別器事先知道輸入圖像中一半真一半假,那它會認為每張圖像為真的概率是0.5;如果判別器事先不知道,那它很可能就直接輸出D(x) ≈ 1。

如果生成器的學習率設得很高/迭代次數(shù)很多,再加上判別器輸出了個約等于1的概率,這時生成器“眼里”的實際數(shù)據(jù)和偽數(shù)據(jù)是不平等的,它會認為偽數(shù)據(jù)更真實,C(xf) > C(xr)。而如果是堅信有一半偽數(shù)據(jù)的判別器,它會被迫把實際圖像分類成偽數(shù)據(jù),背離正確分類的目標。

最小化散度

在SGAN中,我們認為判別器損失函數(shù)等于Jensen-Shannon散度(JSD)。因此,計算JSD可以等同為計算這個式子的最大值:

對于xr∈P和xf∈Q,如果D(xr) = D(xf) = 0.5,JSD最小化;如果D(xr) = 1,D(xf) = 0,JSD最大化。

如果我們想在JSD的最大值和最小值之間得出一個最小化的散度,這相當于D(xr)的閾值是(0.5, 1),D(xf)的閾值是(0, 0.5)。但如下圖所示,當我們執(zhí)行最小化時,變化的只有D(xf),而對實際圖像計算出的概率D(xr)卻沒有發(fā)生改變,這不合理。

梯度

下面是SGAN和IPM GAN的損失函數(shù)對比:

SGAN

基于IPM的GAN

從這幾個方程可以看出,當同時滿足以下幾點時,SGAN和 IPM GAN的結果是差不多的:

SGAN的判別器:D(xr) = 0,D(xf) = 1;

SGAN的生成器:D(xf) = 0;

C(x)∈F。

換句話說,如果生成器能直接影響判別器,那SGAN和基于IPM的GAN可以性能相近。對于后者,GAN在計算判別器損失函數(shù)梯度時會同時考慮實際數(shù)據(jù)和偽數(shù)據(jù),但SGAN的D(xr)是不會隨著D(xf)變化而變化的,它會停止學習,轉而更關注偽數(shù)據(jù)。另一方面,如果D(xr)會隨D(xf)的上升而下降,這就意味著真實數(shù)據(jù)會被納入梯度計算中,這也是基于IPM的GAN更穩(wěn)定,而SGAN更容易崩潰的原因。

實驗對比

簡而言之,相對的GAN和普通GAN的區(qū)別如下所示。

標準GAN(SGAN)的判別器:

相對標準GAN(RSGAN)的判別器:

相對均值標準GAN(RaSGAN)的判別器:

翻譯后的論文圖

CIFAR-10上的FID值對比,RSGAN表現(xiàn)出眾

在LSGAN中引入相對判別器后生成的128×128貓圖,F(xiàn)ID值僅為15.85

WGAN-GP生成的256×256貓圖,F(xiàn)ID>100

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1899

    瀏覽量

    72382

原文標題:相對的判別器:現(xiàn)有GAN存在關鍵屬性缺失

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于GaN的開關器件

    和電機控制中。他們的接受度和可信度正在逐漸提高。(請注意,基于GaN的射頻功放或功放也取得了很大的成功,但與GaN器件具有不同的應用場合,超出了本文的范圍。)本文探討了GaN器件的潛力,GaN
    發(fā)表于 06-21 08:27

    GaN HEMT在電機設計中有以下優(yōu)點

    器件的商業(yè)可用性,比如電機逆變器的GaN HEMT和直流部分的高性能電容器正在不斷滿足設計人員對于大功率電機驅動的可靠性需求,這些關鍵部件讓設計人員能夠提升現(xiàn)有的產品,是電機變得更加緊湊、輕便而且價格
    發(fā)表于 07-16 00:27

    如何正確理解GaN?

    您已了解GaN晶體管出色的性能,您很興奮。樣品總算來到,您將它們放入板中。您打開電源,施加負載,結果……性能并沒有比以前更好。更糟糕的是,遇到了以前不存在的開關問題。這些晶體管不好。真遺憾。為何出現(xiàn)這種情況?有沒有可能遺漏了什么?如何正確理解
    發(fā)表于 07-30 06:21

    物聯(lián)網存在哪些不足之處?

    物聯(lián)網存在哪些不足之處?
    發(fā)表于 05-19 06:46

    深度學習存在哪些問題?

    深度學習常用模型有哪些?深度學習常用軟件工具及平臺有哪些?深度學習存在哪些問題?
    發(fā)表于 10-14 08:20

    關鍵遙信量性能缺失包含幾個方面

    **關鍵遙信量性能缺失的分析報告**關鍵遙信量性能缺失是指鐵塔基站的開關電源監(jiān)控異?;驘o法正常監(jiān)控,目前考核性能缺失包含三個方面:一級低壓脫
    發(fā)表于 11-12 07:28

    Armv8-A和Armv9-A的內存屬性屬性介紹

    1. 本指南介紹Armv8-A和Armv9-A的內存屬性屬性。它首先解釋內存的屬性來自何處,如何分配到內存區(qū)域,然后介紹現(xiàn)有的不同屬性,并
    發(fā)表于 08-02 09:03

    無線傳感網絡缺失值估計方法

    針對無線傳感器網絡(WSN)中感知數(shù)據(jù)易缺失問題,提出了一種基于感知數(shù)據(jù)屬性相關性的缺失值估計方法。該方法采用多元線性回歸模型,對屬性相關的感知數(shù)據(jù)的
    發(fā)表于 12-27 16:56 ?0次下載

    毫米波到底存在哪些缺點

    電子發(fā)燒友網站提供《毫米波到底存在哪些缺點.pdf》資料免費下載
    發(fā)表于 11-26 02:22 ?318次下載

    基于稀疏表示的電力負荷缺失數(shù)據(jù)補全方法

    數(shù)括缺失在電力負荷數(shù)據(jù)采集過程中經常發(fā)生,對提髙算法的預測精確度帶來了不利影響。現(xiàn)有缺失數(shù)據(jù)補全算法只適用于缺失數(shù)據(jù)量較少的情況,而對于缺失
    發(fā)表于 04-13 15:43 ?15次下載
    基于稀疏表示的電力負荷<b class='flag-5'>缺失</b>數(shù)據(jù)補全方法

    基于模糊選項關系 的關鍵屬性提取綜述

    基于模糊選項關系 的關鍵屬性提取綜述
    發(fā)表于 06-07 16:45 ?5次下載

    關鍵遙信量性能缺失的分析報告

    **關鍵遙信量性能缺失的分析報告**關鍵遙信量性能缺失是指鐵塔基站的開關電源監(jiān)控異?;驘o法正常監(jiān)控,目前考核性能缺失包含三個方面:一級低壓脫
    發(fā)表于 11-07 12:35 ?9次下載
    <b class='flag-5'>關鍵</b>遙信量性能<b class='flag-5'>缺失</b>的分析報告

    存在太空中存在哪些優(yōu)缺點

    Microchip 最近將其商用現(xiàn)貨 (COTS) 耐輻射技術擴展到閃存。但是,閃存在太空中存在哪些優(yōu)缺點?
    的頭像 發(fā)表于 04-28 16:54 ?1550次閱讀
    閃<b class='flag-5'>存在</b>太空中<b class='flag-5'>存在哪</b>些優(yōu)缺點

    單片機中ADC采集都存在哪些誤差?

    單片機中ADC采集都存在哪些誤差?
    的頭像 發(fā)表于 09-18 16:31 ?2708次閱讀
    單片機中ADC采集都<b class='flag-5'>存在哪</b>些誤差?

    GaN-FET的關鍵參數(shù)和驅動要求

    電子發(fā)燒友網站提供《GaN-FET的關鍵參數(shù)和驅動要求.pdf》資料免費下載
    發(fā)表于 09-12 09:57 ?0次下載
    <b class='flag-5'>GaN</b>-FET的<b class='flag-5'>關鍵</b>參數(shù)和驅動要求