0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)全靠調(diào)參?谷歌大腦新研究:神經(jīng)網(wǎng)絡(luò)構(gòu)建超強(qiáng)網(wǎng)絡(luò)

5RJg_mcuworld ? 來(lái)源:YXQ ? 2019-08-06 14:18 ? 次閱讀

機(jī)器學(xué)習(xí)全靠調(diào)參?這個(gè)思路已經(jīng)過(guò)時(shí)了。

谷歌大腦團(tuán)隊(duì)發(fā)布了一項(xiàng)新研究:只靠神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索出的網(wǎng)絡(luò),不訓(xùn)練,不調(diào)參,就能直接執(zhí)行任務(wù)。這樣的網(wǎng)絡(luò)叫做WANN,權(quán)重不可知神經(jīng)網(wǎng)絡(luò)。它在MNIST數(shù)字分類任務(wù)上,未經(jīng)訓(xùn)練和權(quán)重調(diào)整,就達(dá)到了92%的準(zhǔn)確率,和訓(xùn)練后的線性分類器表現(xiàn)相當(dāng)。除了監(jiān)督學(xué)習(xí),WANN還能勝任許多強(qiáng)化學(xué)習(xí)任務(wù)。

團(tuán)隊(duì)成員之一的大佬David Ha,把成果發(fā)上了推特,已經(jīng)獲得了1300多贊:

那么,先來(lái)看看效果吧。

谷歌大腦用WANN處理了3種強(qiáng)化學(xué)習(xí)任務(wù)。(給每一組神經(jīng)元,共享同一個(gè)權(quán)重。)

第一項(xiàng)任務(wù),Cart-Pole Swing-Up。

這是經(jīng)典的控制任務(wù),一條滑軌,一臺(tái)小車,車上一根桿子。小車在滑軌的范圍里跑,要把桿子從自然下垂的狀態(tài)搖上來(lái),保持在直立的位置不掉下來(lái)。(這個(gè)任務(wù)比單純的Cart-Pole要難一些:Cart-Pole桿子的初始位置就是向上直立,不需要小車把它搖上來(lái),只要保持就可以。)

難度體現(xiàn)在,沒(méi)有辦法用線性控制器 (Linear Controller) 來(lái)解決。每一個(gè)時(shí)間步的獎(jiǎng)勵(lì),都是基于小車到滑軌一頭的距離,以及桿子擺動(dòng)的角度。

WANN的最佳網(wǎng)絡(luò) (Champion Network) 長(zhǎng)這樣:

它在沒(méi)有訓(xùn)練的狀態(tài)下,已經(jīng)表現(xiàn)優(yōu)異:

表現(xiàn)最好的共享權(quán)重,給了團(tuán)隊(duì)十分滿意的結(jié)果:只用幾次擺動(dòng)便達(dá)到了平衡狀態(tài)。

第二項(xiàng)任務(wù),Bipedal Waker-v2。

一只兩足“生物”,要在隨機(jī)生成的道路上往前走,越過(guò)凸起,跨過(guò)陷坑。獎(jiǎng)勵(lì)多少,就看它從出發(fā)到掛掉走了多長(zhǎng)的路,以及電機(jī)扭矩的成本(為了鼓勵(lì)高效運(yùn)動(dòng)) 。每條腿的運(yùn)動(dòng),都是由一個(gè)髖關(guān)節(jié)、和一個(gè)膝關(guān)節(jié)來(lái)控制的。有24個(gè)輸入,會(huì)指導(dǎo)它的運(yùn)動(dòng):包括“激光雷達(dá)”探測(cè)的前方地形數(shù)據(jù),本體感受到的關(guān)節(jié)運(yùn)動(dòng)速度等等。比起第一項(xiàng)任務(wù)中的低維輸入,這里可能的網(wǎng)絡(luò)連接就更多樣了。所以,需要WANN對(duì)從輸入到輸出的布線方式,有所選擇。這個(gè)高維任務(wù),WANN也優(yōu)質(zhì)完成了。

你看,這是搜索出的最佳架構(gòu),比剛才的低維任務(wù)復(fù)雜了許多:

它在-1.5的權(quán)重下奔跑,長(zhǎng)這樣:

第三項(xiàng)任務(wù),CarRacing-v0。

這是一個(gè)自上而下的 (Top-Down) 、像素環(huán)境里的賽車游戲。一輛車,由三個(gè)連續(xù)命令來(lái)控制:油門、轉(zhuǎn)向、制動(dòng)。目標(biāo)是在規(guī)定的時(shí)間里,經(jīng)過(guò)盡可能多的磚塊。賽道是隨機(jī)生成的。研究人員把解釋每個(gè)像素 (Pixel Interpretation) 的工作交給了一個(gè)預(yù)訓(xùn)練的變分自編碼器 (VAE) ,它可以把像素表征壓縮到16個(gè)潛在維度。這16維就是網(wǎng)絡(luò)輸入的維度。學(xué)到的特征是用來(lái)檢測(cè)WANN學(xué)習(xí)抽象關(guān)聯(lián) (Abstract Associations) 的能力,而不是編碼不同輸入之間顯式的幾何關(guān)系。

這是WANN最佳網(wǎng)絡(luò),在-1.4共享權(quán)重下、未經(jīng)訓(xùn)練的賽車成果:

雖然路走得有些蜿蜒,但很少偏離跑到。而把最佳網(wǎng)絡(luò)微調(diào)一下,不用訓(xùn)練,便更加順滑了:

總結(jié)一下,在簡(jiǎn)單程度和模塊化程度上,第二、三項(xiàng)任務(wù)都表現(xiàn)得優(yōu)秀,兩足控制器只用了25個(gè)可能輸入中的17個(gè),忽略了許多LIDAR傳感器和膝關(guān)節(jié)的速度。

WANN架構(gòu)不止能在不訓(xùn)練單個(gè)權(quán)重的情況下完成任務(wù),而且只用了210個(gè)網(wǎng)絡(luò)連接(Connections) ,比當(dāng)前State-of-the-Art模型用到的2804個(gè)連接,少了一個(gè)數(shù)量級(jí)。做完強(qiáng)化學(xué)習(xí),團(tuán)隊(duì)又瞄準(zhǔn)了MNIST,把WANN拓展到了監(jiān)督學(xué)習(xí)的分類任務(wù)上。一個(gè)普通的網(wǎng)絡(luò),在參數(shù)隨機(jī)初始化的情況下,MNIST上面的準(zhǔn)確率可能只有10%左右。

而新方法搜索到的網(wǎng)絡(luò)架構(gòu)WANN,用隨機(jī)權(quán)重去跑,準(zhǔn)確率已經(jīng)超過(guò)了80%;如果像剛剛提到的那樣,喂給它多個(gè)權(quán)值的合集,準(zhǔn)確率就達(dá)到了91.6%。

對(duì)比一下,經(jīng)過(guò)微調(diào)的權(quán)重,帶來(lái)的準(zhǔn)確率是91.9%,訓(xùn)練過(guò)的權(quán)重,可以帶來(lái)94.2%的準(zhǔn)確率。再對(duì)比一下,擁有幾千個(gè)權(quán)重的線性分類器:

也只是和WANN完全沒(méi)訓(xùn)練、沒(méi)微調(diào)、僅僅喂食了一些隨機(jī)權(quán)重時(shí)的準(zhǔn)確率相當(dāng)。論文里強(qiáng)調(diào),MINST手寫數(shù)字分類是高維分類任務(wù)。WANN表現(xiàn)得非常出色。并且沒(méi)有哪個(gè)權(quán)值,顯得比其他值更優(yōu)秀,大家表現(xiàn)得十分均衡:所以隨機(jī)權(quán)重是可行的。

不過(guò),每個(gè)不同的權(quán)重形成的不同網(wǎng)絡(luò),有各自擅長(zhǎng)分辨的數(shù)字,所以可以把一個(gè)擁有多個(gè)權(quán)值的WANN,用作一個(gè)自給自足的合集 (Self-Contained Ensemble) 。

實(shí)現(xiàn)原理

不訓(xùn)練權(quán)重參數(shù)獲得極高準(zhǔn)確度,WANN是如何做到的呢?神經(jīng)網(wǎng)絡(luò)不僅有權(quán)重偏置這些參數(shù),網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、激活函數(shù)的選擇都會(huì)影響最終結(jié)果。

谷歌大腦的研究人員在論文開(kāi)頭就提出質(zhì)疑:神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)與其架構(gòu)相比有多重要?在沒(méi)有學(xué)習(xí)任何權(quán)重參數(shù)的情況下,神經(jīng)網(wǎng)絡(luò)架構(gòu)可以在多大程度上影響給定任務(wù)的解決方案。

為此,研究人員提出了一種神經(jīng)網(wǎng)絡(luò)架構(gòu)的搜索方法,無(wú)需訓(xùn)練權(quán)重找到執(zhí)行強(qiáng)化學(xué)習(xí)任務(wù)的最小神經(jīng)網(wǎng)絡(luò)架構(gòu)。谷歌研究人員還把這種方法用在監(jiān)督學(xué)習(xí)領(lǐng)域,僅使用隨機(jī)權(quán)重,就能在MNIST上實(shí)現(xiàn)就比隨機(jī)猜測(cè)高得多的準(zhǔn)確率。

論文從架構(gòu)搜索、貝葉斯神經(jīng)網(wǎng)絡(luò)、算法信息論、網(wǎng)絡(luò)剪枝、神經(jīng)科學(xué)這些理論中獲得啟發(fā)。為了生成WANN,必須將權(quán)重對(duì)網(wǎng)絡(luò)的影響最小化,用權(quán)重隨機(jī)采樣可以保證最終的網(wǎng)絡(luò)是架構(gòu)優(yōu)化的產(chǎn)物,但是在高維空間進(jìn)行權(quán)重隨機(jī)采樣的難度太大。研究人員采取了“簡(jiǎn)單粗暴”的方法,對(duì)所有權(quán)重強(qiáng)制進(jìn)行權(quán)重共享(weight-sharing),讓權(quán)重值的數(shù)量減少到一個(gè)。這種高效的近似可以推動(dòng)對(duì)更好架構(gòu)的搜索。

操作步驟

解決了權(quán)重初始化的問(wèn)題,接下來(lái)的問(wèn)題就是如何收搜索權(quán)重不可知神經(jīng)網(wǎng)絡(luò)。它分為四個(gè)步驟:

1、創(chuàng)建初始的最小神經(jīng)網(wǎng)絡(luò)拓?fù)淙骸?/p>

2、通過(guò)多個(gè)rollout評(píng)估每個(gè)網(wǎng)絡(luò),并對(duì)每個(gè)rollout分配不同的共享權(quán)重值。

3、根據(jù)性能和復(fù)雜程度對(duì)網(wǎng)絡(luò)進(jìn)行排序。

4、根據(jù)排名最高的網(wǎng)絡(luò)拓?fù)鋪?lái)創(chuàng)建新的群,通過(guò)競(jìng)爭(zhēng)結(jié)果進(jìn)行概率性的選擇。

然后,算法從第2步開(kāi)始重復(fù),在連續(xù)迭代中,產(chǎn)生復(fù)雜度逐漸增加的權(quán)重不可知拓?fù)洌╳eight agnostic topologies )。

拓?fù)渌阉?/strong>

用于搜索神經(jīng)網(wǎng)絡(luò)拓?fù)涞牟僮魇艿缴窠?jīng)進(jìn)化算法(NEAT)的啟發(fā)。在NEAT中,拓?fù)浜蜋?quán)重值同時(shí)優(yōu)化,研究人員忽略權(quán)重,只進(jìn)行拓?fù)渌阉鞑僮鳌?/p>

上圖展示了網(wǎng)絡(luò)拓?fù)淇臻g搜索的具體操作:

一開(kāi)始網(wǎng)絡(luò)上是最左側(cè)的最小拓?fù)浣Y(jié)構(gòu),僅有部分輸入和輸出是相連的。

然后,網(wǎng)絡(luò)按以下三種方式進(jìn)行更改:

1、插入節(jié)點(diǎn):拆分現(xiàn)有連接插入新節(jié)點(diǎn)。

2、添加連接:連接兩個(gè)之前未連接的節(jié)點(diǎn),添加新連接。

3、更改激活函數(shù):重新分配隱藏節(jié)點(diǎn)的激活函數(shù)。

圖的最右側(cè)展示了權(quán)重在[2,2]取值范圍內(nèi)可能的激活函數(shù),如線性函數(shù)、階躍函數(shù)、正弦余弦函數(shù)、ReLU等等。

權(quán)重依然重要

WANN與傳統(tǒng)的固定拓?fù)渚W(wǎng)絡(luò)相比,可以使用單個(gè)的隨機(jī)共享權(quán)重也能獲得更好的結(jié)果。

雖然WANN在多項(xiàng)任務(wù)中取得了最佳結(jié)果,但WANN并不完全獨(dú)立于權(quán)重值,當(dāng)隨機(jī)分配單個(gè)權(quán)重值時(shí),有時(shí)也會(huì)失敗。WANN通過(guò)編碼輸入和輸出之間的關(guān)系起作用,雖然權(quán)重的大小的重要性并不高,但它們的一致性,尤其是符號(hào)的一致性才是關(guān)鍵。

隨機(jī)共享權(quán)重的另一個(gè)好處是,調(diào)整單個(gè)參數(shù)的影響變得不重要,無(wú)需使用基于梯度的方法。強(qiáng)化學(xué)習(xí)任務(wù)中的結(jié)果讓作者考慮推廣WANN方法的應(yīng)用范圍。他們又測(cè)試了WANN在圖像分類基礎(chǔ)任務(wù)MNIST上的表現(xiàn),結(jié)果在權(quán)重接近0時(shí)效果不佳。

有Reddit網(wǎng)友質(zhì)疑WANN的結(jié)果,對(duì)于隨機(jī)權(quán)重接近于0的情況,該網(wǎng)絡(luò)的性能并不好,先強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)中的具體表現(xiàn)就是,小車會(huì)跑出限定范圍。

對(duì)此,作者給出解釋,在權(quán)重趨于0的情況下,網(wǎng)絡(luò)的輸出也會(huì)趨于0,所以后期的優(yōu)化很難達(dá)到較好的性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:谷歌發(fā)布顛覆性研究:不訓(xùn)練不調(diào)參,AI自動(dòng)構(gòu)建超強(qiáng)網(wǎng)絡(luò)!

文章出處:【微信號(hào):mcuworld,微信公眾號(hào):嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何構(gòu)建多層神經(jīng)網(wǎng)絡(luò)

    構(gòu)建多層神經(jīng)網(wǎng)絡(luò)(MLP, Multi-Layer Perceptron)模型是一個(gè)在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域廣泛使用的技術(shù),尤其在處理分類和
    的頭像 發(fā)表于 07-19 17:19 ?550次閱讀

    BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機(jī)制

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network),即反向傳播神經(jīng)網(wǎng)絡(luò),是一種基于梯度下降算法的多層前饋神經(jīng)網(wǎng)絡(luò),其學(xué)習(xí)機(jī)制的核心在于通過(guò)反向傳播算法
    的頭像 發(fā)表于 07-10 15:49 ?307次閱讀

    BP神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是兩種在人工智能和機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-10 15:24 ?892次閱讀

    PyTorch神經(jīng)網(wǎng)絡(luò)模型構(gòu)建過(guò)程

    PyTorch,作為一個(gè)廣泛使用的開(kāi)源深度學(xué)習(xí)庫(kù),提供了豐富的工具和模塊,幫助開(kāi)發(fā)者構(gòu)建、訓(xùn)練和部署神經(jīng)網(wǎng)絡(luò)模型。在神經(jīng)網(wǎng)絡(luò)模型中,輸出層是尤為關(guān)鍵的部分,它負(fù)責(zé)將模型的預(yù)測(cè)結(jié)果以合適
    的頭像 發(fā)表于 07-10 14:57 ?382次閱讀

    機(jī)器神經(jīng)網(wǎng)絡(luò)系統(tǒng)的特點(diǎn)包括

    機(jī)器神經(jīng)網(wǎng)絡(luò)系統(tǒng)是一種模擬人類大腦神經(jīng)網(wǎng)絡(luò)的計(jì)算模型,具有高度的復(fù)雜性和靈活性。在本文中,我們將詳細(xì)介紹機(jī)器神經(jīng)網(wǎng)絡(luò)系統(tǒng)的特點(diǎn),包括其結(jié)
    的頭像 發(fā)表于 07-09 09:45 ?297次閱讀

    深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別

    在探討深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)與基本神經(jīng)網(wǎng)絡(luò)(通常指?jìng)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)或前向神經(jīng)網(wǎng)絡(luò))的區(qū)別時(shí),我們需要從多個(gè)維度進(jìn)行深入分析。這些維度包括
    的頭像 發(fā)表于 07-04 13:20 ?508次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,如語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言處理等。然而,BP神經(jīng)網(wǎng)絡(luò)也存在一些問(wèn)題,如容易陷入局部最優(yōu)解、訓(xùn)練時(shí)間長(zhǎng)、對(duì)初始權(quán)重敏感等。為了解決這些問(wèn)題,研究者們提出了一些改進(jìn)的BP
    的頭像 發(fā)表于 07-03 11:00 ?525次閱讀

    如何使用神經(jīng)網(wǎng)絡(luò)進(jìn)行建模和預(yù)測(cè)

    神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù),可以用于建模和預(yù)測(cè)變量之間的關(guān)系。 神經(jīng)網(wǎng)絡(luò)的基本概念 神經(jīng)網(wǎng)絡(luò)是一種受人腦啟發(fā)的計(jì)算模型,由大量的節(jié)點(diǎn)(
    的頭像 發(fā)表于 07-03 10:23 ?538次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    化能力。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,神經(jīng)網(wǎng)絡(luò)已經(jīng)成為人工智能領(lǐng)域的重要技術(shù)之一。卷積神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)
    的頭像 發(fā)表于 07-02 14:24 ?1845次閱讀

    使用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò)

    PyTorch是一個(gè)流行的深度學(xué)習(xí)框架,它以其簡(jiǎn)潔的API和強(qiáng)大的靈活性在學(xué)術(shù)界和工業(yè)界得到了廣泛應(yīng)用。在本文中,我們將深入探討如何使用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò),包括從基礎(chǔ)概念到高級(jí)特性的全面解析。本文旨在為讀者提供一個(gè)完整的
    的頭像 發(fā)表于 07-02 11:31 ?580次閱讀

    基于神經(jīng)網(wǎng)絡(luò)算法的模型構(gòu)建方法

    神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)算法,廣泛應(yīng)用于各種領(lǐng)域,如圖像識(shí)別、自然語(yǔ)言處理、語(yǔ)音識(shí)別等。本文詳細(xì)介紹了基于神經(jīng)網(wǎng)絡(luò)算法的模型構(gòu)建方法,包
    的頭像 發(fā)表于 07-02 11:21 ?392次閱讀

    構(gòu)建神經(jīng)網(wǎng)絡(luò)模型方法有幾種

    構(gòu)建神經(jīng)網(wǎng)絡(luò)模型是深度學(xué)習(xí)領(lǐng)域的核心任務(wù)之一。本文將詳細(xì)介紹構(gòu)建神經(jīng)網(wǎng)絡(luò)模型的幾種方法,包括前饗神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-02 10:15 ?274次閱讀

    神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

    神經(jīng)網(wǎng)絡(luò)架構(gòu)是機(jī)器學(xué)習(xí)領(lǐng)域中的核心組成部分,它們模仿了生物神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式,通過(guò)復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)實(shí)現(xiàn)信息的處理、存儲(chǔ)和傳遞。隨著深度
    的頭像 發(fā)表于 07-01 14:16 ?493次閱讀

    詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    處理技術(shù)也可以通過(guò)深度學(xué)習(xí)來(lái)獲得更優(yōu)異的效果,比如去噪、超分辨率和跟蹤算法等。為了跟上時(shí)代的步伐,必須對(duì)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù)有所學(xué)習(xí)研究
    的頭像 發(fā)表于 01-11 10:51 ?1776次閱讀
    詳解深度<b class='flag-5'>學(xué)習(xí)</b>、<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>與卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的應(yīng)用

    NNI:自動(dòng)幫你做機(jī)器學(xué)習(xí)調(diào)的神器

    。 想要在 不同的環(huán)境中 加速運(yùn)行機(jī)器學(xué)習(xí)。 想要更容易 實(shí)現(xiàn)或試驗(yàn)新的機(jī)器學(xué)習(xí)算法 的研究員或數(shù)據(jù)科學(xué)家,包括:超
    的頭像 發(fā)表于 10-30 10:28 ?2241次閱讀
    NNI:自動(dòng)幫你做<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>調(diào)</b><b class='flag-5'>參</b>的神器