0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談深度神經(jīng)網(wǎng)絡(luò)發(fā)展歷程

mK5P_AItists ? 來源:未知 ? 作者:胡薇 ? 2018-11-26 11:16 ? 次閱讀

2018年11月18日下午,計(jì)算機(jī)科學(xué)與技術(shù)學(xué)部主任、人工智能學(xué)院焦李成教授在成都參加了由中國人工智能學(xué)會主辦的人工智能大講堂并做特邀報(bào)告,焦李成教授在報(bào)告中回顧了深度神經(jīng)網(wǎng)絡(luò)發(fā)展歷程,闡述了復(fù)雜影像的智能解譯與識別問題,并激勵大家在人工智能領(lǐng)域勇攀學(xué)術(shù)高峰,以下為報(bào)告記錄。

焦李成:很高興有這個機(jī)會跟大家一起交流。今天的演講是命題作文,人工智能學(xué)會今年開始做人工智能大講堂,學(xué)會理事會將其作為重要的品牌在做,以前是到各個學(xué)校去做,現(xiàn)在拿到高峰論壇來做是第一次。上午的也是張?jiān)洪L的命題作文,一定要談人工智能,人才的培養(yǎng),我覺得很高興有這個機(jī)會,跟大家一起交流。

一個名字,深度神經(jīng)網(wǎng)絡(luò),兩句話大家記住了,李院士講的是深度學(xué)習(xí)不是萬能的,但是離開深度學(xué)習(xí)是萬萬不能的。這件事情作為我們內(nèi)行人來講,今年講的也比較多,內(nèi)行人也很自然能理解,給我們行業(yè)內(nèi)講是不講這個事的,但是給一般的聽眾講,包括給政府機(jī)關(guān)、百千萬人才、長江杰青大講堂都講了這句話,這句話的意思是只要是能夠結(jié)構(gòu)化的、只要是能夠有規(guī)則的、只要你是有數(shù)據(jù)的,那么這個問題,你不要企圖和人工智能去拼。圍棋就是這樣,象棋也是這樣,它們是封閉、完備的,在這些問題上你算不過人工智能,沒有它算得快,同時(shí)這些規(guī)則在短時(shí)間內(nèi)的實(shí)施性,人做不到,人有感情,機(jī)器沒有感情,它下錯一步,你說它怎么這么臭,它并不正視你,而是繼續(xù)下,人工智能一秒鐘算三千步,三萬步,而人看三十步已經(jīng)很偉大了。

這兩個視頻,一個是我學(xué)生做的,西安英卓未來公寓,另外一個是曠視做的。英卓未來公寓從房門開啟一直到最后的離開都是通過智能完成的。當(dāng)然你見不著人,但是人通過智能給了你最好的服務(wù)。所以他們開了第四家酒店,讓大眾能夠體驗(yàn)到智能家居的生活、享受到智能的品質(zhì)。曠視在做人臉識別這件事情,最早做這個事是商湯的Mark,我的學(xué)生、也是湯曉鷗老師的第一個學(xué)生,他做了20年的人臉識別,20年的堅(jiān)守厚積薄發(fā),去年的7月份到9月份,三個月內(nèi)機(jī)場、高鐵、銀行全都用了他的技術(shù)。

大家都知道,這是波士頓動力狗。大家看,它的三級跳,人都不一定能夠做得到,就是這么靈活,整個機(jī)器人經(jīng)過這么幾代以后,智能的行為、協(xié)調(diào)、所有的動作做的很棒,我覺得對我們?nèi)祟愂且环N挑戰(zhàn)。在反恐、排爆、探險(xiǎn),救險(xiǎn)這些領(lǐng)域當(dāng)中,這些技術(shù)是非常有用且必要的。我的學(xué)生做了一款為漸凍人服務(wù)的眼球控制智能出行及家居生活的輪椅系統(tǒng),做了三代,正好有一位漸凍人“泰山英雄”,他的腿動不了,手也不能完全控制,但他靠著手登上了泰山、華山,所以公眾叫他“泰山英雄”,有媒體聯(lián)系到了我們,那么我們將贈送一臺智能輪椅給他,人工智能確實(shí)能夠改變我們?nèi)嗽谀承┣闆r下的不方便,我個人感覺還是一件非常有意義的事。這套輪椅系統(tǒng)能讓漸凍人及其他肌肉或骨骼受損的人不僅在室外能自己走,跟剛才說的智能公寓結(jié)合起來,通過眼睛的控制,能完成從開門到開關(guān)燈、開關(guān)窗簾、洗澡間等所有的智能生活起居。在杭州的一個比賽中,這套系統(tǒng)也很轟動,得到了大家的認(rèn)可,拿了一個獎項(xiàng)。當(dāng)然回來了我們認(rèn)識了“泰山英雄”,能讓他有了適合他的輪椅、能切切實(shí)實(shí)的幫到漸凍人,這是更重要的,我和我的學(xué)生都感到非常高興。

大家可能看不見,這是星載的,就是照相機(jī)和雷達(dá)裝在衛(wèi)星上然后拍攝地面的視頻,船在動、高速上面的車在動、然后機(jī)場的飛機(jī)在起飛,這是衛(wèi)星的視頻。衛(wèi)星視頻數(shù)據(jù)量非常大也非常高維,我們同時(shí)做到了在衛(wèi)星視頻數(shù)據(jù)量級上的艦船、飛機(jī)、車輛的監(jiān)測、跟蹤和分類,就是你傳送多少、運(yùn)動速度多少、未知的信息全部能夠同時(shí)的實(shí)時(shí)識別出來。

將來首先失業(yè)的有可能是播音員,為什么呢?現(xiàn)在的語音合成技術(shù)完全可以和董卿一樣、和李梓萌一樣,聽上去有感情,但是聲音是合成的。(視頻)這樣的話就可以全天候的進(jìn)行播音。剛才舉的波士頓動力、漸凍人的輪椅和智能工藝的結(jié)合、播音員的語音合成等例子都是活生生正在發(fā)生的。所以教育部也很重視人工智能,教育部各個專家組+咨詢組31個人,整個分布在十幾個高校。

其實(shí)我國的人工智能發(fā)展計(jì)劃歸結(jié)為三步走,四大任務(wù),五大智能技術(shù)方向。三步走我們怎么跟、四大任務(wù)我們怎么去完成,還有五大方向我們在科研人才的培養(yǎng)上怎樣去進(jìn)行匹配,這是我們需要考慮的問題。我認(rèn)為可以從四個部分考慮,一是基礎(chǔ)理論,二是共性技術(shù),第三是基礎(chǔ)支撐平臺,第四是智能化基礎(chǔ)設(shè)施,智能基礎(chǔ)設(shè)施建設(shè)怎么和物聯(lián)網(wǎng)云計(jì)算的基礎(chǔ)設(shè)施的建設(shè)相互協(xié)調(diào)起來,是我們需要思考的。

工信部的《新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計(jì)劃》大家應(yīng)該去看,目標(biāo)很清楚,產(chǎn)品要出來,核心技術(shù)要突破,實(shí)際上是為整個智能社會和2025智能制造做準(zhǔn)備,這件事大家一定要去做,要思考互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能三個支撐體系和基礎(chǔ)設(shè)施怎么樣相互協(xié)同,相互協(xié)調(diào),共同促進(jìn),你跟不上,你一定會落后。人工智能對全社會來講是共性的技術(shù)、普適的技術(shù),對教育來講同樣是共性的、普適的課程,這一點(diǎn)我們現(xiàn)在都無法去想象,人工智能對于教育或者是智慧教育帶來的挑戰(zhàn),我希望大家一定要去關(guān)注。

高校的行動計(jì)劃,今年教育部連發(fā)五文,時(shí)間規(guī)劃涉及到2020年、2025年、2030年,內(nèi)容涉及創(chuàng)新體系,人才培養(yǎng)體系,成果轉(zhuǎn)化和示范應(yīng)用的基地,它的目標(biāo)是想干什么?對于高校教師,寫寫論文,帶帶學(xué)生已經(jīng)不夠了。人工智能的方向有什么呢?李院士講了,這是經(jīng)過多少次爭論后列出來的主要方向,6到8個,要根據(jù)各個不同的學(xué)校、不同的單位,不同的特色去建相應(yīng)的方向,一定要有特色而不能同質(zhì)化。

圍繞基礎(chǔ)理論的研究基金委是有布局的,也經(jīng)過了專家組充分的論證。人工智能的理論研究從56年到現(xiàn)在,一直在爭論也一直在斗爭,但不管你是三起三落還是八起八落,搞學(xué)術(shù)的人都得搞。別人不做的時(shí)候我們在做,別人不待見的時(shí)候我們也在做,高潮來的時(shí)候,該怎么樣還怎么樣,做學(xué)術(shù)的人就要初心不改做自己的事。所以人工智能從誕生之初到現(xiàn)在,從需要模擬人的基本智能,推理、知識、規(guī)劃、學(xué)習(xí)、交流、感知到移動和操作物體的能力,始終在延伸,始終在往前走,水平在不斷的去提高。人工智能不是人的智能,而是希望能夠像人那樣去思考,像自然演化那樣去學(xué)習(xí)和進(jìn)化。另外,進(jìn)化計(jì)算和自然計(jì)算結(jié)合起來有一些挑戰(zhàn)和問題,我覺得這兩個之間的概括需要有人去做,我已經(jīng)講過幾回,今天先不講,未來希望有機(jī)會也跟大家聊一聊進(jìn)化計(jì)算和自然計(jì)算的結(jié)合。

智能的兩條道,學(xué)習(xí)和感知、優(yōu)化和識別的能力什么時(shí)候都需要、什么時(shí)候都是智能的主體,怎么樣能夠把這兩個結(jié)合起來?我認(rèn)為這個時(shí)代說對了一部分,這部分就是可以用梯度算法去做,另外一部分是,進(jìn)化計(jì)算在結(jié)構(gòu)優(yōu)化上一定是比BP強(qiáng)的,梯度從哪兒求這件事情我覺得還是值得思考,無法獲得梯度怎么辦?人工智能從開始的符號、聯(lián)結(jié)、行為、貝葉斯到類推,人怎么認(rèn)知、自然怎么學(xué)習(xí)演化、人是怎么想的、怎么看的、怎么聽的、怎么說的、怎么走的、怎么動的……神經(jīng)網(wǎng)絡(luò)都做到了嗎?我想說的是,從專家系統(tǒng)到中間基于特征的,再到聲音、語言,文字、圖像以及現(xiàn)在的感知行動結(jié)合起來,這件事上是值得我們?nèi)プ叩摹?/p>

我個人認(rèn)為人工智能四大挑戰(zhàn),無教師的學(xué)習(xí)何時(shí)能來?無監(jiān)督的學(xué)習(xí)深度何時(shí)能做?機(jī)器人能夠像人一樣去感知和理解這個世界嗎?機(jī)器的情感在哪里?前面說的這些都是網(wǎng)絡(luò)范式去做的,而人是在環(huán)境、場景中、運(yùn)動中去感知,首先是感知這個世界,然后理解這個世界,之后去指揮自己的行為,最后再做一系列的事情。所以最終人工智能要對環(huán)境、對場景、對情感去感知和理解,形成動力系統(tǒng)。更進(jìn)一步,人工智能的發(fā)展最重要的還是人,這個時(shí)候帶來的倫理、法律、道德、宗教等等深刻的社會問題我們怎么去思考它、怎么去理解它以及怎么去面對它。

美國白宮成立了人工智能研究中心,這是絕無僅有的,MIT結(jié)合AI成立新的計(jì)算機(jī)學(xué)院。這件事情我覺得對我們整個改革學(xué)校的教育,改革下一代的教育都有影響,我們要思考這意味著什么。人工智能改造了計(jì)算機(jī)的教育,斯坦福始終在創(chuàng)新引領(lǐng)的前沿,我們要思考他們做什么事情,我們要做以人為中心的人工智能的教育和改革。這件事情上,我們教育部的官員和教育工作者都要去好好學(xué)習(xí),更要去看別人怎么去做。

所以說到對人工智能的戰(zhàn)略投資,包括對社會的變革、長期的革命,MIT這件事情拿了10億美金,CMU創(chuàng)辦了世界上第一個人工智能本科專業(yè),我知道在紐約辦了一個藝術(shù)學(xué)院與人工智能的結(jié)合,他們用6.4億美金,專門辦了一個藝術(shù)學(xué)院。我們不能只知道人家做了這件事,更要看這件事的內(nèi)容是什么,要眼光面向全世界,要看清楚怎么去做,我們要去引領(lǐng)。我就覺得這三件事情都是今年的,都是剛剛發(fā)生的事,所以這件事情上,我覺得美國還是清醒的,站在這個制高點(diǎn),不能說我們?nèi)斯ぶ悄苡?jì)劃已經(jīng)很完美。當(dāng)然國內(nèi)的布局也很快,這件事情應(yīng)該說叫做“順勢而為,趁勢而上”,但我們千萬不要說吃了一碗面條,我們腦子就很聰明,好像不是那么回事,要懂得做全局優(yōu)化。

我想再強(qiáng)調(diào)一下,人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)我們內(nèi)行人應(yīng)該要搞清楚?,F(xiàn)在當(dāng)然說沒有比深度學(xué)習(xí)更有效的機(jī)器學(xué)習(xí)的辦法,人工智能當(dāng)然要去做事,肯定得靠深度學(xué)習(xí),因?yàn)槟忝鎸Φ氖呛谙?、不完全的?shù)據(jù),而且宏觀上是大數(shù)據(jù),微觀上對問題來講又是小樣本。所以對于深度學(xué)習(xí),我們內(nèi)行人離不開他但也不要起哄。在傳統(tǒng)的體系結(jié)構(gòu)下,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是什么?這個對話不在一個頻道上。

有監(jiān)督、無監(jiān)督、半監(jiān)督和強(qiáng)化的算法怎么用要看是什么情況,我們自己做這個內(nèi)行的人,千萬不要說你那個能干什么,這個能干什么,用的場合和問題不一樣,你可能在不同的場合,不同的任務(wù),不同的問題需要用不同的方法去解決。我現(xiàn)在就害怕大家陷入一個坑,我們再回到神經(jīng)網(wǎng)絡(luò),最早1990年我出的書里神經(jīng)網(wǎng)絡(luò)的四個范式,反饋網(wǎng)絡(luò)就是現(xiàn)在大家通常講的網(wǎng)絡(luò),或者是遞歸反饋的。還有自組織網(wǎng),以及沒有體現(xiàn)的完全無監(jiān)督的學(xué)習(xí)。

大數(shù)據(jù)就講一句,我們所有處理的問題、深度學(xué)習(xí)的方法,機(jī)器學(xué)習(xí)的方法都一定是面向大數(shù)據(jù)的問題,但是單個問題拿到的又只是小樣本,一定得記住這一點(diǎn),這個意義上來講,是大數(shù)據(jù)小樣本再加學(xué)習(xí),這件事情上我們一定要把它結(jié)合起來做。面對大數(shù)據(jù),面對海量數(shù)據(jù),面對結(jié)構(gòu)和非結(jié)構(gòu)的數(shù)據(jù)大部分深度神經(jīng)網(wǎng)絡(luò)是不可解釋的、是黑箱的。大數(shù)據(jù)處理的很多方法,同樣是不可解釋的,因?yàn)槲覀儸F(xiàn)在處理這些數(shù)據(jù)時(shí)只講大、只講海,但處理數(shù)據(jù)其實(shí)也是物理過程,應(yīng)當(dāng)像人的認(rèn)知過程那樣是有生物意義和物理意義的,這個層面上來講,你把那兩個意義丟掉了,拿一堆數(shù)據(jù)就玩、算法遞歸迭代,最后什么都不解釋,人的經(jīng)驗(yàn)、規(guī)則哪里去了呢?你沒有用上。

我經(jīng)常講的,過馬路的時(shí)候,對面有一個大美女,打了一個手機(jī),還接了一個領(lǐng)導(dǎo)的電話,大車也穿過來了,旁邊還有一個小偷跟著你,你怎么處理?肯定保命要緊,先過馬路再說,人會分輕重緩急,而且是協(xié)同去做?;剡^頭來,我認(rèn)為最初研究神經(jīng)網(wǎng)絡(luò)的幾個人是要提的。通過學(xué)習(xí)的概念,通過學(xué)習(xí)感知的思想,通過學(xué)習(xí)優(yōu)化的思想,這個是神經(jīng)網(wǎng)絡(luò)的精髓。然后在這個基礎(chǔ)上再去做。中間需要把任務(wù)完成得好,就要優(yōu)化去做這件事情。所以說一定是學(xué)習(xí)、優(yōu)化、協(xié)同、控制和數(shù)據(jù)結(jié)合的。

我的印象應(yīng)該是在1988年Lippman的文章,所有神經(jīng)網(wǎng)絡(luò)做模式識別邊界的分析,邊界是那個時(shí)候劃出來的。大家第一次知道,非線性的問題變得如此簡單。那個時(shí)候才出來三層神經(jīng)網(wǎng)絡(luò),但三層神經(jīng)網(wǎng)絡(luò)可以逼近任意函數(shù),是理論上證明的,不是今天才做的。之后結(jié)構(gòu)的設(shè)計(jì)、算法的構(gòu)造,使得方法變得更加有效、實(shí)用,離問題更近。以前是數(shù)據(jù)不夠、訓(xùn)練方法欠缺,同時(shí)人們的要求也沒有那么迫切,硬件的運(yùn)行也沒有那么好,而現(xiàn)在這四個條件,大概相對30年前已經(jīng)有了巨大的改善,我第一次看神經(jīng)網(wǎng)絡(luò)大概是83年,那個時(shí)候在成都聽加州大學(xué)伯克利分校的蔡少棠講了學(xué)一個月,講的非線性和混沌,那時(shí)因?yàn)榭陀^條件所限,研究發(fā)展不像現(xiàn)在那么迅速,而大數(shù)據(jù)的出現(xiàn)是應(yīng)景了,這兩者是契合了。這個意義上來講,在具備了有利客觀條件的今天,我們要把問題研究得更透徹,你怎么去進(jìn)行感知、判斷、決策,哪一個是決策者、哪一個是訓(xùn)練層、哪一個是推理層、哪一個是優(yōu)化層得搞清楚了。非線性的嵌套是有結(jié)構(gòu)的。從簡單的特征,到特征的表征,到特征的學(xué)習(xí),特征的表征與學(xué)習(xí),現(xiàn)在演變成特征的表征學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)的演化進(jìn)程是有脈絡(luò)、有邏輯的。

關(guān)于神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng),專家系統(tǒng)三個要點(diǎn)要記?。褐R的表示,知識的學(xué)習(xí),知識的推理。早期推理知識的辦法不多、表征的框架不多、手段不多。神經(jīng)網(wǎng)絡(luò)給了大家思想和方法,我希望大家記住對神經(jīng)網(wǎng)絡(luò)真正有貢獻(xiàn)的是這些人,43年Hebb規(guī)則和MP模型。1962年Widrow和他的學(xué)生提出了LMS。第一臺PC機(jī)是他發(fā)明的,其算法奠定了自適應(yīng)信號處理和自適應(yīng)控制技術(shù)基礎(chǔ)。這個是俄羅斯籍的斯坦福的教授,這個人記住,其貌不揚(yáng),我覺得大家都應(yīng)該記住他Werbos,BP算法是他提出來的,1974年在哈佛大學(xué)拿博士學(xué)位的時(shí)候,就發(fā)表了一篇論文就沒有論文了,但是博士學(xué)位是拿到了,真正的BP算法是他提出來的,使三層神經(jīng)網(wǎng)絡(luò)可學(xué)習(xí)。整個大概十幾年的時(shí)間很紅火,而且是自己也做過世界神經(jīng)網(wǎng)絡(luò)學(xué)會的主席和先驅(qū),加州工學(xué)院Hopfield,三篇文章奠定了他的基礎(chǔ)。另外一個記住一個C.Mead,美國的三院院士,世界第一塊神經(jīng)網(wǎng)絡(luò)的芯片是他做的,這個人在集成電路一直是明星,大家一定要記住這件事情,神經(jīng)網(wǎng)絡(luò)不僅是今天。這個是芬蘭皇家科學(xué)院的院長T.Kohonen教授,他來過很多回,提出了自組織特征映射網(wǎng)。徑向基神經(jīng)網(wǎng)絡(luò)出自Billing手,因?yàn)樗怯没瘮?shù)來做這件事情,做控制的人全部是用的,很高效。支撐向量機(jī),這些都是神經(jīng)網(wǎng)絡(luò)模型,而且都是學(xué)習(xí)機(jī),大家不要認(rèn)為是完全跟神經(jīng)網(wǎng)絡(luò)沒有關(guān)系,只是說那一陣跟神經(jīng)網(wǎng)絡(luò)“劃清界限”。淺層到深層的學(xué)習(xí),大家要明白,本質(zhì)性上改變的是什么?你說前面的網(wǎng)絡(luò)淺,那在哪里深呢?規(guī)模深、特征深、還是機(jī)理深?還是怎么做的呢?我說理解深度的時(shí)候,我們要去做深在什么地方,對數(shù)據(jù)的匹配在哪些上面是做了本質(zhì)性的突破和改變,這件事情上我們一定要去做的。

我還是把他們列在一起,你記住所謂深度大咖的時(shí)候,別忘了上面這些人,這些人是他們的祖師爺。

中國神經(jīng)網(wǎng)絡(luò)的發(fā)展也是有一個過程的。

我們一直不說,但是路一直在走。簡單的數(shù)據(jù)到了具體的對象,到了圖像,從小波變換到了小波網(wǎng)絡(luò),從伸縮平移到了方向,到了圖像旋轉(zhuǎn)變換。所以說包括從地上到了天上,到了空中機(jī)載的。對象在變,需求在變,神經(jīng)網(wǎng)絡(luò)也好,機(jī)器學(xué)習(xí)也好,方法也在不斷的往前走。所以我們是把這個結(jié)合起來在走。剛才為什么說我希望講一下這些道理,因?yàn)檫M(jìn)化計(jì)算的第一篇文章,不叫人工智能,是優(yōu)化和學(xué)習(xí)在走,包括免疫的學(xué)習(xí)優(yōu)化,包括我們用到多目標(biāo)上面去做,包括做協(xié)同的、量子的,而且用到了真正目標(biāo)的識別上,我們都做了。這個過程我們回過頭來說,對于人工智能人才的培養(yǎng),為什么我們心里面不太慌,經(jīng)過了十四五年的實(shí)踐和培養(yǎng),反正我們也出了這些書,不敢說水平有多高,但是研究生,本科的教材是有參考的,我自己寫的,我也在不斷的更新。我們幾十本書,應(yīng)了人才培養(yǎng)教材之需,去年就包括做量子的,光學(xué)的,紅外的,包括到認(rèn)知的,稀疏的,一直到高分辨遙感,老先生一定要改成雷達(dá)圖像,我們一路走過來,今年完成的是量子計(jì)算,計(jì)算智能,簡明人工智能等七八本,大概也有好幾十萬字。計(jì)算智能還有模式識別,反正都是在50、60萬字以上,還有自然計(jì)算的前沿,就是相當(dāng)于深度學(xué)習(xí)的前沿,還有一個大數(shù)據(jù)智能挖掘的。

從第一代到第二代,一直到現(xiàn)在的第三代神經(jīng)網(wǎng)絡(luò),變化在什么地方,本質(zhì)在什么地方,做這件事情,我們一定要去。第一個是卷積神經(jīng)網(wǎng)絡(luò),我理解的跟別人理解的卷積神經(jīng)網(wǎng)絡(luò)不一樣,很簡單就是內(nèi)積。然后在電路里面,在學(xué)習(xí)信息里面,很簡單,怎么走?一卷不就出來了嘛,卷積的概念大家知道是從數(shù)字信號處理出來的概念,物理概念和描述很清楚。其實(shí)最開始的時(shí)候,卷積也不火,不像現(xiàn)在牛哄哄的。

遞歸神經(jīng)網(wǎng)絡(luò),一定有聯(lián)想記憶的。其實(shí)模式識別,以前叫做聯(lián)想記憶,聯(lián)想記憶學(xué)習(xí)優(yōu)化。這四件事情,要是在神經(jīng)網(wǎng)絡(luò)里實(shí)現(xiàn)了,你的功能就比單純的卷積去做要強(qiáng)大得多。所以遞歸同樣是可以做這件事情。

深度置信網(wǎng)提供的思想一定要記住,我能夠通過概率的判斷做某件事情。我通過概率的判斷和生成,能夠使這個神經(jīng)網(wǎng)絡(luò)的構(gòu)造性設(shè)計(jì)更加合理和有效。這是置信網(wǎng)的貢獻(xiàn)。其實(shí)現(xiàn)在更熱的是貝葉斯網(wǎng)絡(luò)學(xué)習(xí)。貝葉斯的分布。

分布完了以后,參數(shù)少。接下來就是可學(xué)習(xí),這個參數(shù)我們可以學(xué)出來,學(xué)習(xí)關(guān)鍵的參數(shù),那么這個分布就找到了,或者優(yōu)化的分布就找到了。實(shí)際上就是做了一個分布的估計(jì)。貝葉斯的描述、表征,估計(jì)和深度結(jié)合起來,這是貝葉斯網(wǎng)絡(luò)火起來最重要的原因。很自然,大家好不容易抓住一個貝葉斯分布,而且可以去做。深度可以給你學(xué),何樂而不為,大家一定要找到一個結(jié)合點(diǎn)!

才能做這件事情。

生成對抗網(wǎng)大家覺得是突破,相對傳統(tǒng)的網(wǎng)絡(luò)來講。多了一個判別器。所以這個是不一樣,而且是跟概率結(jié)合起來,大家覺得一人搞了一種。我這么告訴你,有了卷積網(wǎng),有了對抗網(wǎng),你還要有新模型,千萬不要覺得誰好用,誰不好用,這就是深度網(wǎng)絡(luò)的全部。那是你本事不高,你有本事弄一個深度神經(jīng)網(wǎng)絡(luò)模型出來,聯(lián)想記憶,學(xué)習(xí),優(yōu)化還要到后面的推理,你把這些功能實(shí)現(xiàn)了,就像人一樣,你的功能就強(qiáng)大了。但是現(xiàn)在,為什么大家關(guān)注核心,是把感知和決策結(jié)合起來,通過概率,態(tài)勢,估計(jì)和學(xué)習(xí)是有用的。這應(yīng)該是非常有用的。

兩件事情,淺層模塊+堆棧理念就等于深度網(wǎng)絡(luò)。梯度不好的時(shí)候,結(jié)合一下,混合一下去做。都是不同的選擇,也有不同的學(xué)習(xí)方式,不管怎么樣,都是為了提高它的效率,這件事情大家去做,就不講那么多了。但是,講大數(shù)據(jù)。第二個是過擬合。哪一個方法不過擬合。調(diào)參,哪一個方法不調(diào)參,你說缺乏可解釋性,現(xiàn)有的機(jī)器學(xué)習(xí)方法,哪幾個可解釋,試試看。你不能說他不解釋,這個不弄,那個不說,多任務(wù)的時(shí)候,人人都做不了,大家都在同一個起跑線上,你要勇闖無人區(qū),要做領(lǐng)頭雁就做一個算法出來。

現(xiàn)在回想起來,我覺得還是有一些工作,小波SVM網(wǎng)絡(luò),用在小樣本上,包括ridgelet網(wǎng)絡(luò),深度contourlet網(wǎng)絡(luò)模型等,和利用免疫進(jìn)行優(yōu)化學(xué)習(xí),量子進(jìn)化學(xué)習(xí),多智能體協(xié)同進(jìn)化學(xué)習(xí)與多尺度稀疏理論學(xué)習(xí)框架等。量子的免疫的,我剛才說的是兩個學(xué)習(xí)進(jìn)化,我們結(jié)合起來去做,可并行,可以非線性的表征和編碼,這兩件事情結(jié)合起來,量子優(yōu)化也是這么去做。不是回到量子的器件,我們不做這事,但是思想是可以學(xué)的。免疫優(yōu)化學(xué),相對傳統(tǒng)的,我們多了免疫項(xiàng),多了引導(dǎo)項(xiàng),多了容錯經(jīng)驗(yàn)項(xiàng),那么你的學(xué)習(xí)優(yōu)化就不一樣,我們做了20萬TSP和函數(shù)優(yōu)化,做了千萬級的皇后分類,后來我們這些結(jié)果,都是最好的結(jié)果,后來人們也不跟我們比了。那么你做到了極限了,你試試看。我能做的九個目標(biāo)的優(yōu)化問題,那么你去算算,這個東西就難。

我們做了大數(shù)據(jù)深度學(xué)習(xí)系統(tǒng)。我跟大家說一個結(jié)果,12萬×16萬的圖像,0.5的分辨率,57個G,2766條船,將近300架飛機(jī),整幅圖像處理我們在128秒之內(nèi)全部檢測分類出來。

人是怎么做的呢?剛才講的人看、聽、說、觸覺,聲音連接圖像。所有的聲音的處理,輸入,獲取是人腦處理的基礎(chǔ)。那么從這個意義上來講,它的共性是什么。首先,它是稀疏性的,它是可學(xué)習(xí)的,是有選擇的,同時(shí)是方向的。這四個是我們感知的基礎(chǔ),這不是我說的,這是生物上證明的,從這個意義上講,大家光拿一個卷積網(wǎng),其實(shí)沒有回過頭來想它的生物基礎(chǔ)是什么。誰能回答這個問題?或者有多少體現(xiàn)了。

這個也是到現(xiàn)在有將近20年的歷程,生物上不斷證明這件事情,而且喜歡看牛人,看大咖,一直到現(xiàn)在,證明了大腦中是存在的,所有的這些結(jié)果都是有的。

我們的方法做到了嗎?我們的深度做到了嗎?,我們一代深度神經(jīng)網(wǎng)絡(luò),二代深度神經(jīng)網(wǎng)絡(luò),三代深度神經(jīng)網(wǎng)絡(luò)怎么體現(xiàn)人腦做這些事呢?從這個意義上來講,你怎么去做稀疏感知,稀疏表征和稀疏學(xué)習(xí)。我們成功研制了國內(nèi)第一個壓縮感知雷達(dá),就是把稀疏感知和稀疏學(xué)習(xí)這兩件事情結(jié)合起來。所以說你要觀得見,要觀得清,辨得明,而且還要理解得了。從這個意義上來講,不僅僅是場景的感知,而且是目標(biāo)信息的感和知。昨天兩位院士講的成像的,知才是理解的過程。我剛才講的模型,多小波也好,都做這件事情。

Wishart深度堆棧網(wǎng)絡(luò)是我們提出來的,將這種物理特性是和神經(jīng)網(wǎng)絡(luò)結(jié)合起來,實(shí)現(xiàn)的結(jié)構(gòu)網(wǎng)絡(luò),我們找到了 Wishart深度堆棧網(wǎng)絡(luò)。我們做的任務(wù)是極化SAR圖像分類。同樣我們做了Wishart的DBN網(wǎng)絡(luò),做到了物理獲取的機(jī)理,視覺的機(jī)理和腦處理的機(jī)理和結(jié)構(gòu)的結(jié)合,構(gòu)造了相應(yīng)的深度神經(jīng)網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)一定是將物理的、生物的、數(shù)學(xué)的原理結(jié)合起來。當(dāng)然你要更有效,還要在平臺上去實(shí)現(xiàn)這件事情。

劉芳教授已經(jīng)做了很多工作,畢業(yè)了很多學(xué)生。做了哪件事情?語義深度網(wǎng)絡(luò)。我們現(xiàn)在都在語法上想對策,考慮了數(shù)據(jù)之間的關(guān)聯(lián)特性,這是理解數(shù)據(jù)的基礎(chǔ),是推理決策的基礎(chǔ)。也是深度學(xué)習(xí)必由之路。尤其是在星載的電磁波雷達(dá)的攝像機(jī),裝在衛(wèi)星上去做。這件事恰好是把物理的特性和生物的結(jié)合起來,我們結(jié)合了人是怎么理解的,人是通過語義通過過程,通過數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,而不僅僅是看數(shù)據(jù)多和少,要看數(shù)據(jù)之間的關(guān)聯(lián)特性。我們做到了在線表征,屈嶸老師做的超啟發(fā)式學(xué)習(xí)優(yōu)化,她的工作能夠用在醫(yī)院,車站,工廠。深度神經(jīng)網(wǎng)絡(luò)還沒有做這件事情,超啟發(fā)式的學(xué)習(xí)算法和深度神經(jīng)網(wǎng)絡(luò)在哪里?應(yīng)該是打開現(xiàn)在大數(shù)據(jù)小樣本,人工智能大數(shù)據(jù)瓶頸問題的一把鑰匙,期待大家去努力,有問題向屈教授請教。

這件事情上做到了,表征這件事情做得很好。表征完了,找到了好的基函數(shù)。所以表征、濾波,函數(shù)和深度學(xué)習(xí)結(jié)合起來,就給出了深度的,張量的濾波,我們團(tuán)隊(duì)也在做深度,誰只拿卷積用用,這個稿子論文畢業(yè)都不行,出都出不了門,出了北門就是出了國門。學(xué)術(shù)只有一個標(biāo)準(zhǔn),那就是國際標(biāo)準(zhǔn),不存在哈佛和MIT的標(biāo)準(zhǔn)之分。從這個意義上來看,管他大咖,小咖,解決問題就是咖。從某種意義上來講,誤差小,結(jié)構(gòu)要設(shè)計(jì)得好,能夠?qū)崿F(xiàn)得了,而且還能算得快。這件事情上是我們做深度的基礎(chǔ)。

你不是要做嘛,那個算法是要上星上彈,在導(dǎo)彈上,衛(wèi)星上裝的,你載荷要小,怎么辦?就要學(xué)得快,在線學(xué)習(xí)就得增量學(xué)習(xí)。怎么去做?不僅是增量的,而且還能自表征的,把那些經(jīng)驗(yàn)不斷找回來。然后半監(jiān)督的去學(xué)習(xí)。我們承擔(dān)了國家自然基金的重大專項(xiàng),完成了星載的在線處理就是做的這件事情。

另外一個,是眼睛看的,腦子想的,還有眼睛怎么看的,腦子怎么想,那就是,顯著看的,注意看的,選擇注意的特征,看這個信息的時(shí)候,選擇看的,注意看的,稀疏看的,然后腦子再去學(xué)它,跟生物結(jié)合起來。不管是雷達(dá)上還是光學(xué)相機(jī)上。我們用了變化檢測,顯著檢測,前面講的所有的模型你去做。有一個核心點(diǎn),你一定能說出來,你的想法在哪里?你的目標(biāo)在哪里?你是解決什么樣的問題的,你是怎么樣去提高的,你的生物意義在哪里,物理意義在哪里,結(jié)構(gòu)上做了哪些變化,這個是怎么匹配的。多示例去做,特點(diǎn)在什么上面呢?不同的傳感器獲得像不一樣,光學(xué)的,你的任務(wù)是多任務(wù)學(xué)習(xí),你怎么去學(xué)的。

我們做的整個的方法,當(dāng)時(shí)就是比別人的好,所以這個冠軍就是我們。這個方法,應(yīng)該說物理生物、再將深度的思想結(jié)合起來,是我們做工作的基本出發(fā)點(diǎn)。然后匹配稀疏的,大數(shù)據(jù)的,小樣本的問題。而且能夠滿足在線的,在軌的大數(shù)據(jù)的需要。

將學(xué)習(xí)和優(yōu)化結(jié)合起來,多小波和多尺度的網(wǎng)絡(luò)模型是我們自己提的。多小波的大概是30年前就提了這樣的事情。協(xié)同進(jìn)化優(yōu)化學(xué)習(xí),這是第一個國獎,解決了優(yōu)化和學(xué)習(xí)的一些基礎(chǔ)性的問題。第二個找到了這些圖像,需要表征,找到了這些特征,而且把中間的機(jī)理分析了,給出了重構(gòu)的模型。第三個國獎就是找到了怎么編碼,怎么稀疏。而且優(yōu)化了模型,求解了,一代二代三代做了。那好,這就是這三個國獎。近五年拿的,都在人工智能領(lǐng)域。所以圍繞的都是這樣的問題去做的。

后來我們還是回過頭來,這些東西國外才不給你。這個時(shí)候從眼睛,比如說大腦,第一件事情候院長我們做了。全世界第一個把眼睛裝到大腦上,類腦別人沒有做。而且看和理解同時(shí)做,我們?nèi)孔兂设F塊,變成了機(jī)箱。

第二個,剛才說的編碼,這是探月的相機(jī)。只用很小的像素就可以成像,而且不失真。表征學(xué)習(xí)和應(yīng)用,做這件事情。后來就是人像到畫像,畫像到人像,然后再做識別。

警察很厲害,山東的,把這個家伙畫出來了。全黑的,畫出來了。我們把這個人找出來,章穎瑩的冤屈得到了伸張,至少把這個壞家伙找到了。所以我們也是參與其中,應(yīng)該說為祖國人民也做了一點(diǎn)事情。剛才我說的東西就不說了。應(yīng)該說XX艘航母回港的時(shí)候,我們同時(shí)把它全部的像拿到了,視頻也做了,把我們最新的算法,裝在了我們自己的FPGA上,只有這樣才能用。

我們團(tuán)隊(duì),有三個長江學(xué)者創(chuàng)新團(tuán)隊(duì),三個國家平臺,六個省部級平臺,有111國家創(chuàng)新引智基地,我們有一支隊(duì)伍在做這個事情。聯(lián)合實(shí)驗(yàn)室有十幾個。本科專業(yè),05年開招,現(xiàn)在14屆,今年招了249名,再加上58名轉(zhuǎn)專業(yè)的同學(xué),現(xiàn)在是四個人才能選一個過來,研究生招了240多人。這么多年在人工智能領(lǐng)域做工作,這個專業(yè)叫智能科學(xué)與技術(shù),是國家級特色專業(yè),我們本科生培養(yǎng)了2千多人,研究生培養(yǎng)了2千多。拿獎拿到手軟。拿不到冠軍都不愿意說。今年拿了兩個國際的冠軍。一個就是ECCV的無人機(jī)的競賽。

給大家看一下。ECCV的無人機(jī)的競賽的數(shù)據(jù)。全部數(shù)據(jù)主辦方給的,他們飛的。這個數(shù)據(jù)看那個羊在哪里?所有的羊都是一樣的。這個是所有的車,遮擋的情況下,無處可逃。這算法全是拿主辦方的數(shù)據(jù),在他們的機(jī)子上運(yùn)行的。這是多目標(biāo)的,你有多少目標(biāo),多少數(shù)據(jù),都可以檢測跟蹤。我們的無人機(jī),給大家看我們飛的視頻。這個是西安南二環(huán)實(shí)況,檢測、跟蹤、分類全部是實(shí)時(shí)的,還能把幾何參數(shù)找出來。包括人,包括三輪車,所有的分類檢測跟蹤,有多少給多少,遮擋也能搗騰出來。這是我們學(xué)生做的,他們現(xiàn)在做得很起勁的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:焦李成教授談深度神經(jīng)網(wǎng)絡(luò)發(fā)展歷程

文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    FPGA在深度神經(jīng)網(wǎng)絡(luò)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領(lǐng)域取得了顯著成果。然而,傳統(tǒng)的深度
    的頭像 發(fā)表于 07-24 10:42 ?460次閱讀

    深度神經(jīng)網(wǎng)絡(luò)在雷達(dá)系統(tǒng)中的應(yīng)用

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)在雷達(dá)系統(tǒng)中的應(yīng)用近年來取得了顯著進(jìn)展,為雷達(dá)信號處理、目標(biāo)檢測、跟蹤以及識別等領(lǐng)域帶來了革命性的變化。以下將詳細(xì)探討深度神經(jīng)網(wǎng)
    的頭像 發(fā)表于 07-15 11:09 ?467次閱讀

    殘差網(wǎng)絡(luò)深度神經(jīng)網(wǎng)絡(luò)

    殘差網(wǎng)絡(luò)(Residual Network,通常簡稱為ResNet) 是深度神經(jīng)網(wǎng)絡(luò)的一種 ,其獨(dú)特的結(jié)構(gòu)設(shè)計(jì)在解決深層網(wǎng)絡(luò)訓(xùn)練中的梯度消失和梯度爆炸問題上取得了顯著的突破,并因此成為
    的頭像 發(fā)表于 07-11 18:13 ?836次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用場景及優(yōu)缺點(diǎn)

    1.1 卷積神經(jīng)網(wǎng)絡(luò)的定義 卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)模型,它通過模擬人類視覺系統(tǒng)的工作方式,對輸入數(shù)據(jù)進(jìn)行特征提取和分類。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,CNNs具有更好的特征學(xué)習(xí)能力和泛化
    的頭像 發(fā)表于 07-11 14:45 ?388次閱讀

    簡單認(rèn)識深度神經(jīng)網(wǎng)絡(luò)

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)作為機(jī)器學(xué)習(xí)領(lǐng)域中的一種重要技術(shù),特別是在深度學(xué)習(xí)領(lǐng)域,已經(jīng)取得了顯著的成就。它們通過模擬人類大腦的處理方式,利用多層神經(jīng)
    的頭像 發(fā)表于 07-10 18:23 ?817次閱讀

    深度神經(jīng)網(wǎng)絡(luò)概述及其應(yīng)用

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)作為機(jī)器學(xué)習(xí)的一種復(fù)雜形式,是廣義人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)的重要分支。它們
    的頭像 發(fā)表于 07-04 16:08 ?508次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

    循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域中兩種非常重要的神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-04 14:24 ?792次閱讀

    深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別

    在探討深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)與基本神經(jīng)網(wǎng)絡(luò)(通常指傳統(tǒng)神經(jīng)網(wǎng)絡(luò)或前向神經(jīng)網(wǎng)絡(luò))的區(qū)別時(shí),我們需
    的頭像 發(fā)表于 07-04 13:20 ?487次閱讀

    深度神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)方法

    結(jié)構(gòu)的構(gòu)建,還包括激活函數(shù)的選擇、優(yōu)化算法的應(yīng)用、正則化技術(shù)的引入等多個方面。本文將從網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)、關(guān)鍵組件選擇、優(yōu)化與正則化策略、以及未來發(fā)展趨勢四個方面詳細(xì)探討深度神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)方
    的頭像 發(fā)表于 07-04 13:13 ?329次閱讀

    bp神經(jīng)網(wǎng)絡(luò)深度神經(jīng)網(wǎng)絡(luò)

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)是一種常見的前饋神經(jīng)網(wǎng)絡(luò),它使用反向傳播算法來訓(xùn)練網(wǎng)絡(luò)。雖然BP神經(jīng)網(wǎng)絡(luò)在某些方面與
    的頭像 發(fā)表于 07-03 10:14 ?492次閱讀

    深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)作為其中的重要分支,已經(jīng)在多個領(lǐng)域取得了顯著的應(yīng)用成果。從圖像識別、語音識別
    的頭像 發(fā)表于 07-02 18:19 ?667次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    化能力。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展神經(jīng)網(wǎng)絡(luò)已經(jīng)成為人工智能領(lǐng)域的重要技術(shù)之一。卷積神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)
    的頭像 發(fā)表于 07-02 14:24 ?1719次閱讀

    深度神經(jīng)網(wǎng)絡(luò)模型有哪些

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNNs)是一類具有多個隱藏層的神經(jīng)網(wǎng)絡(luò),它們在許多領(lǐng)域取得了顯著的成功,如計(jì)算機(jī)視覺、自然語言處理、語音識別等。以下是一些常見的深度
    的頭像 發(fā)表于 07-02 10:00 ?871次閱讀

    神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

    神經(jīng)網(wǎng)絡(luò)架構(gòu)是機(jī)器學(xué)習(xí)領(lǐng)域中的核心組成部分,它們模仿了生物神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式,通過復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)實(shí)現(xiàn)信息的處理、存儲和傳遞。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)
    的頭像 發(fā)表于 07-01 14:16 ?484次閱讀

    詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    在如今的網(wǎng)絡(luò)時(shí)代,錯綜復(fù)雜的大數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境,讓傳統(tǒng)信息處理理論、人工智能與人工神經(jīng)網(wǎng)絡(luò)都面臨巨大的挑戰(zhàn)。近些年,深度學(xué)習(xí)逐漸走進(jìn)人們的視線,通過
    的頭像 發(fā)表于 01-11 10:51 ?1753次閱讀
    詳解<b class='flag-5'>深度</b>學(xué)習(xí)、<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>與卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的應(yīng)用