0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

FAIR何愷明團隊近日發(fā)表神經(jīng)結(jié)構(gòu)搜索NAS方面的最新力作

DPVg_AI_era ? 來源:lp ? 2019-04-19 14:34 ? 次閱讀

FAIR何愷明團隊近日發(fā)表神經(jīng)結(jié)構(gòu)搜索NAS方面的最新力作,通過隨機連接的神經(jīng)網(wǎng)絡,探索了更多樣化的連接模式,所提出的RandWire網(wǎng)絡ImageNet基準測試中獲得了有競爭力的準確度。

用于圖像識別的神經(jīng)網(wǎng)絡經(jīng)過大量的人工設計,已經(jīng)從簡單的鏈狀模型發(fā)展到具有多個連接路徑的結(jié)構(gòu)。ResNets和DenseNets的成功在很大程度上歸功于它們創(chuàng)新的連接規(guī)劃。

目前,神經(jīng)結(jié)構(gòu)搜索(NAS)的研究正在探索連接(wiring)與操作類型(operation types)的聯(lián)合優(yōu)化,然而,由于可能的連接空間受到限制,盡管采用了神經(jīng)結(jié)構(gòu)搜索,優(yōu)化仍然是由人工設計驅(qū)動的。

近日,F(xiàn)AIR何愷明等人發(fā)表最新論文,探討了在圖像識別中NAS方法的優(yōu)化。研究人員通過隨機連接的神經(jīng)網(wǎng)絡,探索了更多樣化的連接模式。

論文地址:

https://arxiv.org/pdf/1904.01569.pdf

作者首先定義了一個隨機網(wǎng)絡生成器(network generator)的概念,該生成器封裝了整個網(wǎng)絡生成過程,從而提供了NAS和隨機連接網(wǎng)絡的統(tǒng)一視圖。

然后,研究人員采用三種經(jīng)典的隨機圖模型來生成網(wǎng)絡的隨機連接圖。

實驗結(jié)果令人驚訝:這些隨機生成器生成的網(wǎng)絡實例在ImageNet基準測試中獲得了有競爭力的準確度。

研究人員表示,這些結(jié)果表明,專注于設計更好的網(wǎng)絡生成器的研究可以通過探索更少約束的搜索空間,為新設計提供更多空間,從而帶來新的突破。

不過,該研究被指其思想早已在2013年PCA-Net論文中提出過,在算法設計思想方面沒有本質(zhì)的創(chuàng)新。

何愷明等人的這一新研究到底意義如何?本文對這篇論文進行了譯介:

研究概述:網(wǎng)絡生成器的設計很重要

今天我們所稱的深度學習是從連接主義方法發(fā)展起來的,這一范式反映了這樣一種假設,即計算網(wǎng)絡的連接方式對構(gòu)建智能機器至關重要。

與這一觀點相呼應的是,計算機視覺領域的最新進展是由使用鏈狀連接的模型向更精細的連接模式(如ResNet和DenseNet)的轉(zhuǎn)變所驅(qū)動的,這些連接模式之所以有效,在很大程度上是因為它們的連接方式。

在這一趨勢的推進中,神經(jīng)結(jié)構(gòu)搜索(neural architecture search, NAS)已經(jīng)成為聯(lián)合搜索連接模式和執(zhí)行操作方式的一個有前景的方向。NAS方法專注于搜索,同時隱式地依賴于一個重要但常常被忽視的組件——網(wǎng)絡生成器(network generator)。

NAS網(wǎng)絡生成器定義了一系列可能的連接模式,并根據(jù)可學習的概率分布對網(wǎng)絡進行采樣。然而,就像ResNet和DenseNet中的連接模式一樣,NAS網(wǎng)絡生成器是手工設計的,允許的連接模式的空間被限制在所有可能的圖的一個小的子集中。從這個角度來看,我們會問:如果我們放開這種約束,并設計新的網(wǎng)絡生成器,會發(fā)生什么?

我們通過隨機網(wǎng)絡生成器采樣的隨機連接神經(jīng)網(wǎng)絡來探討這個問題,其中人工設計的隨機過程定義了生成。

圖1:隨機連接網(wǎng)絡的計算圖

我們使用了三個經(jīng)典的隨機圖模型:Erdos-R?enyi (ER),Barabasi-Albert (BA),以及Watts-Strogatz (WS)模型。

如圖1所示,隨機連接網(wǎng)絡的三個實例在ImageNet基準測試中分別達到79.1%、79.1%和79.0%的精度,超過了ResNet-50的77.1%。

為了定義完整的網(wǎng)絡,我們將一個隨機圖轉(zhuǎn)換成一個有向無環(huán)圖(DAG),并應用從節(jié)點到其函數(shù)角色(例如,到相同類型的卷積)的一個簡單映射。

結(jié)果令人驚訝:這些隨機生成器的幾個變體在ImageNet上產(chǎn)生了準確率上具有競爭力的網(wǎng)絡。

使用WS模型的最佳生成器生成的多個網(wǎng)絡性能優(yōu)于或可與完全手工設計的同類網(wǎng)絡和通過各種神經(jīng)結(jié)構(gòu)搜索方法找到的網(wǎng)絡相媲美。

我們還觀察到,對于同一生成器生成的不同隨機網(wǎng)絡,精度的方差較低,但不同生成器之間存在明顯的精度差距。這些觀察結(jié)果表明,網(wǎng)絡生成器的設計很重要。

最后,我們的工作表明,從設計單個網(wǎng)絡到設計網(wǎng)絡生成器的新過渡是可能的,類似于如何從設計特征過渡到設計學習特征的網(wǎng)絡。

我們建議設計新的網(wǎng)絡生成器來生成用于搜索的新模型家族,而不是主要關注使用固定生成器進行搜索。設計的網(wǎng)絡生成器的重要性還意味著機器學習尚未實現(xiàn)自動化——底層的人工設計只是從網(wǎng)絡工程轉(zhuǎn)變到網(wǎng)絡生成器工程(network generator engineering)。

研究方法

接下來介紹網(wǎng)絡生成器的概念,這是隨機連接神經(jīng)網(wǎng)絡的基礎。

網(wǎng)絡生成器(network generator)

我們定義一個網(wǎng)絡生成器為從參數(shù)空間Θ到神經(jīng)網(wǎng)絡結(jié)構(gòu)空間N的一個映射g,表示為g:Θ→N。對于一個給定的θ∈Θ,g(θ)返回一個神經(jīng)網(wǎng)絡實例n∈N。N通常是一組相關網(wǎng)絡,例如VGG nets、ResNets或DenseNets。

生成器g決定了計算圖的連接方式。

隨機連接神經(jīng)網(wǎng)絡(Randomly Wired Neural Networks)

對NAS的分析表明,網(wǎng)絡生成器是人工設計的,并且是人類知識的先驗編碼。網(wǎng)絡生成器的設計很可能起了相當大的作用,如果是這樣的話,目前的方法還沒有實現(xiàn)“AutoML”,仍然需要大量的人工。

為了研究生成器設計的重要性,僅比較相同NAS生成器的不同優(yōu)化器是不夠的;有必要研究新的網(wǎng)絡生成器,它們與NAS生成器有本質(zhì)的不同。

這就引出了我們對隨機連接神經(jīng)網(wǎng)絡的探索。也就是說,我們將定義網(wǎng)絡生成器,這些生成器生成具有隨機圖的網(wǎng)絡,受不同的人類特定先驗影響。

我們在研究中使用了三個經(jīng)典的隨機圖模型(如上文所述)。生成隨機連接網(wǎng)絡的方法涉及以下概念:

生成通用的圖(general graphs)。

網(wǎng)絡生成器首先生成一個general graph,包含一組節(jié)點和連接節(jié)點的邊,而不受限于圖和神經(jīng)網(wǎng)絡的對應關系。這允許我們自由地使用圖理論中的任意通用圖生成器(ER/BA/WS)。一旦生成一個圖,它就被映射到一個可計算的神經(jīng)網(wǎng)絡。

邊操作(Edge operations)。

假設生成的圖是有方向的,我們定義邊是數(shù)據(jù)流,即有向邊將數(shù)據(jù)(張量)從一個節(jié)點發(fā)送到另一個節(jié)點。

節(jié)點操作(Node operations)。

有向圖中的節(jié)點可以具有一些輸入邊和一些輸出邊。如圖2所示。

圖2:節(jié)點操作

輸入和輸出節(jié)點。

到目前為止,即使給定邊/節(jié)點操作,通用圖也不是一個有效的神經(jīng)網(wǎng)絡,因為它可能有多個輸入節(jié)點和多個輸出節(jié)點。對于典型的神經(jīng)網(wǎng)絡,如圖像分類,最好有一個單一的輸入和輸出。我們應用了一個簡單的后處理步驟。

階段(Stages)。

由于具有唯一的輸入和輸出節(jié)點,一個圖就足以表示一個有效的神經(jīng)網(wǎng)絡。然而,特別是在圖像分類中,始終保持完整輸入分辨率的網(wǎng)絡是不可取的。通常的方法是將網(wǎng)絡劃分為逐步向下采樣特征映射的階段。

表1:RandWire架構(gòu)

表1總結(jié)了我們實驗中使用的隨機連接神經(jīng)網(wǎng)絡,稱為RandWire。網(wǎng)絡以一個分類器輸出結(jié)束(表1,最后一行)。

圖1顯示了三個隨機連接網(wǎng)絡樣本的完整計算圖。

實驗和結(jié)果

我們對ImageNet 1000類分類任務進行了實驗。訓練在~1.28M圖像的訓練集上進行,并在50K驗證圖像上進行測試。

實驗結(jié)果如下:

隨機生成器

圖3

圖3比較了小型計算環(huán)境中不同生成器的結(jié)果:每個RandWire網(wǎng)絡有~580M FLOPs。

圖4

圖4顯示了每個生成器的一個示例圖。圖生成器由隨機圖模型(ER/BA/WS)及其參數(shù)集指定,如ER(0.2)。我們觀察到:

所有隨機生成器在所有5個隨機網(wǎng)絡實例上都提供良好的準確度,而且它們沒有一個不收斂。

此外,隨機網(wǎng)絡實例之間的差異很小。圖3中的幾乎所有隨機生成器的標準偏差(std)都為0.2 ~ 0.4%。

Graph damage.

我們通過隨機移除一個節(jié)點或邊來探索Graph damage。

圖5

當刪除邊時,我們評估了精度損失與該邊的目標節(jié)點的輸入程度(圖5,底部)。

節(jié)點操作

圖6

圖6顯示了圖3中列出的每個生成器的平均精度。

結(jié)果比較

小型計算設置

表2

表2比較了在較小計算條件下的結(jié)果,這是現(xiàn)有NAS論文中研究的一種常見設置

表3

表3比較了RandWire與ResNet和ResNeXt在與ResNet-50/101類似的FLOPs的情況下的性能。RandWire的平均準確率分別比ResNet50和ResNet-101高1.9%和1.3%,比ResNeXt高0.6%。

更大的計算條件

表4

表4比較了在更大計算條件下的結(jié)果

COCO對象檢測

最后,我們報告了通過微調(diào)網(wǎng)絡進行COCO對象檢測的結(jié)果。我們使用Faster R-CNN和FPN作為目標探測器

表5

表5比較了對象檢測結(jié)果。觀察到的趨勢與表3中的ImageNet實驗相似。這些結(jié)果表明,我們的隨機連接網(wǎng)絡學習到的特征也可以遷移。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4729

    瀏覽量

    100351
  • NAS
    NAS
    +關注

    關注

    11

    文章

    276

    瀏覽量

    112319
  • 深度學習
    +關注

    關注

    73

    文章

    5449

    瀏覽量

    120812

原文標題:何愷明團隊神經(jīng)結(jié)構(gòu)搜索最新力作:設計隨機連接網(wǎng)絡,效果超ResNet

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    人工智能神經(jīng)元的基本結(jié)構(gòu)

    人工智能神經(jīng)元的基本結(jié)構(gòu)是一個復雜而深入的話題,涉及到計算機科學、數(shù)學、神經(jīng)科學等多個領域的知識。 引言 人工智能(Artificial Intelligence,簡稱AI)是計算機科學的一個分支
    的頭像 發(fā)表于 07-11 11:19 ?797次閱讀

    神經(jīng)網(wǎng)絡三層結(jié)構(gòu)的作用是什么

    網(wǎng)絡的三層結(jié)構(gòu)是最基本的神經(jīng)網(wǎng)絡結(jié)構(gòu),包括輸入層、隱藏層和輸出層。下面介紹神經(jīng)網(wǎng)絡三層結(jié)構(gòu)的作用。 輸入層 輸入層是神經(jīng)網(wǎng)絡的第一層,負責接
    的頭像 發(fā)表于 07-11 11:03 ?491次閱讀

    遞歸神經(jīng)網(wǎng)絡和循環(huán)神經(jīng)網(wǎng)絡的模型結(jié)構(gòu)

    遞歸神經(jīng)網(wǎng)絡是一種旨在處理分層結(jié)構(gòu)神經(jīng)網(wǎng)絡,使其特別適合涉及樹狀或嵌套數(shù)據(jù)的任務。這些網(wǎng)絡明確地模擬了層次結(jié)構(gòu)中的關系和依賴關系,例如語言中的句法
    的頭像 發(fā)表于 07-10 17:21 ?451次閱讀
    遞歸<b class='flag-5'>神經(jīng)</b>網(wǎng)絡和循環(huán)<b class='flag-5'>神經(jīng)</b>網(wǎng)絡的模型<b class='flag-5'>結(jié)構(gòu)</b>

    華為將正式揭開5.5G技術(shù)領域的最新力作

    場科技盛宴上,華為將正式揭開其5.5G技術(shù)領域的最新力作——Apollo Version的神秘面紗,標志著5G技術(shù)邁向了全新的發(fā)展階段,即5G-Advanced(簡稱5G-A或5.5G)時代。
    的頭像 發(fā)表于 07-04 14:56 ?474次閱讀

    人工智能神經(jīng)網(wǎng)絡的結(jié)構(gòu)是什么

    人工智能神經(jīng)網(wǎng)絡是一種模擬人腦神經(jīng)網(wǎng)絡的計算模型,其結(jié)構(gòu)和功能非常復雜。 引言 人工智能神經(jīng)網(wǎng)絡是一種模擬人腦神經(jīng)網(wǎng)絡的計算模型,其
    的頭像 發(fā)表于 07-04 09:37 ?358次閱讀

    卷積神經(jīng)網(wǎng)絡與循環(huán)神經(jīng)網(wǎng)絡的區(qū)別

    的網(wǎng)絡結(jié)構(gòu),分別適用于不同的應用場景。本文將從基本概念、結(jié)構(gòu)組成、工作原理及應用領域等方面對這兩種神經(jīng)網(wǎng)絡進行深入解讀。
    的頭像 發(fā)表于 07-03 16:12 ?1695次閱讀

    神經(jīng)元的結(jié)構(gòu)及功能是什么

    神經(jīng)元是神經(jīng)系統(tǒng)的基本結(jié)構(gòu)和功能單位,它們通過電信號和化學信號進行信息傳遞和處理。神經(jīng)元的結(jié)構(gòu)和功能非常復雜,涉及到許多不同的
    的頭像 發(fā)表于 07-03 11:33 ?818次閱讀

    神經(jīng)網(wǎng)絡算法的結(jié)構(gòu)有哪些類型

    神經(jīng)網(wǎng)絡算法是深度學習的基礎,它們在許多領域都有廣泛的應用,如圖像識別、自然語言處理、語音識別等。神經(jīng)網(wǎng)絡的結(jié)構(gòu)有很多種類型,每種類型都有其獨特的特點和應用場景。以下是對神經(jīng)網(wǎng)絡算法
    的頭像 發(fā)表于 07-03 09:50 ?340次閱讀

    卷積神經(jīng)網(wǎng)絡的基本結(jié)構(gòu)及其功能

    卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經(jīng)網(wǎng)絡的基本結(jié)構(gòu)及其功能
    的頭像 發(fā)表于 07-02 14:45 ?843次閱讀

    綠聯(lián)NAS產(chǎn)品榮獲TüV南德網(wǎng)絡安全認證

    近日,深圳市綠聯(lián)科技股份有限公司傳來喜訊,其網(wǎng)絡存儲服務器產(chǎn)品(簡稱“NAS”)DXP2800等9款型號成功獲得了TüV南德意志集團首個NAS產(chǎn)品的ETSI EN 303 645認證標志。這一榮譽不僅彰顯了綠聯(lián)科技在網(wǎng)絡安全與隱
    的頭像 發(fā)表于 05-28 10:20 ?433次閱讀

    洪亮團隊在生信期刊JCIM發(fā)布最新成果,蛋白質(zhì)工程邁入通用人工智能時代

    Networks)。在此項研究中,該團隊設計了一種微環(huán)境感知圖神經(jīng)網(wǎng)絡ProtLGN。ProtLGN能夠從蛋白質(zhì)三維結(jié)構(gòu)中學習有益的氨基酸突變位點,建立自然選擇下的氨基酸序列分
    的頭像 發(fā)表于 04-19 17:42 ?498次閱讀
    洪亮<b class='flag-5'>團隊</b>在生信期刊JCIM發(fā)布最新成果,蛋白質(zhì)工程邁入通用人工智能時代

    fpga在通信方面的應用

    FPGA在通信方面的應用非常廣泛,以下是一些主要的應用場景。
    的頭像 發(fā)表于 03-27 14:10 ?854次閱讀

    谷歌搜索引擎優(yōu)化的各個方面和步驟

    或SEMrush等專業(yè)工具,來幫助你找到相關的關鍵字。注意關鍵字的搜索量和競爭度,選擇適合你網(wǎng)站的關鍵字。 網(wǎng)站結(jié)構(gòu)和鏈接優(yōu)化 谷歌搜索引擎優(yōu)化的一個重要方面是網(wǎng)站
    的頭像 發(fā)表于 01-25 10:29 ?786次閱讀

    NAS設備及硬盤的選購與安裝使用

    面對海量的存儲需求難題,眾多企業(yè)與工作室往往會首選NAS存儲解決方案。但市面上NAS設備與硬盤產(chǎn)品繁多,如何組建適合自己的一套NAS系統(tǒng)也常常令人頭疼。
    的頭像 發(fā)表于 01-07 15:39 ?1005次閱讀
    <b class='flag-5'>NAS</b>設備及硬盤的選購與安裝使用

    穿透局域網(wǎng)訪問威聯(lián)通nas

    背景: 威聯(lián)通nas 可以自帶的myQNAPcloud 云服務,在外網(wǎng)訪問內(nèi)網(wǎng)的威聯(lián)通nas,如下圖 問題 筆者用的時候發(fā)現(xiàn)訪問速度很慢,訪問成功率不高,可能和筆者家里的移動寬帶有關,據(jù)說電信聯(lián)通
    發(fā)表于 11-16 18:34