0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI的定位和導(dǎo)航類似于大腦的位置細(xì)胞和網(wǎng)格細(xì)胞

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-05-13 10:43 ? 次閱讀

近日,DeepMind 在 Nature 上發(fā)表的一篇論文引起 AI 領(lǐng)域和神經(jīng)科學(xué)領(lǐng)域的極大震撼:AI 展現(xiàn)出與人腦 “網(wǎng)格細(xì)胞” 高度一致的空間導(dǎo)航能力。甚至有些學(xué)者認(rèn)為,憑著這篇論文,DeepMind 的作者有可能問(wèn)鼎諾貝爾獎(jiǎng)。本文作者鄧侃博士對(duì)這篇突破性的論文進(jìn)行了解讀。

Google 麾下的 DeepMind 公司,不僅會(huì)下圍棋,而且寫的論文也頂呱呱。

2018/5/10,今天的微信朋友圈,被DeepMind 一篇論文刷屏了。論文發(fā)表在最近一期 Nature 雜志上,題目是Vector-based navigation using grid-like representations in artificial agents [1]。

有些學(xué)者認(rèn)為,憑著這篇論文,DeepMind 的作者有可能問(wèn)鼎諾貝爾獎(jiǎng)[2]。

重要意義:AI的定位和導(dǎo)航類似于大腦的位置細(xì)胞和網(wǎng)格細(xì)胞

其實(shí)這篇論文是DeepMind 人工智能團(tuán)隊(duì),與 University College of London(UCL) 的生物學(xué)家,合作的產(chǎn)物。

對(duì)空間的定位和導(dǎo)航能力,是生物的本能。早在 1971 年,UCL 的生理學(xué)教授 John O'Keefe 在大腦海馬體中,發(fā)現(xiàn)了位置細(xì)胞(Place Cell)。隨后 O'Keefe 的學(xué)生,Moser 夫婦于 2005 年發(fā)現(xiàn),在大腦內(nèi)嗅皮層,存在一種更為神奇的神經(jīng)元,網(wǎng)格細(xì)胞(Grid Cell)。在運(yùn)動(dòng)過(guò)程中,生物的網(wǎng)格細(xì)胞,把空間分割為蜂窩那樣的六邊形,并且把運(yùn)動(dòng)軌跡記錄在蜂窩狀的網(wǎng)格上。

2014 年的諾貝爾生理學(xué)/醫(yī)學(xué)獎(jiǎng),頒發(fā)給了John O'Keefe 和Moser 夫婦。

人工智能深度學(xué)習(xí)模型,經(jīng)常被詬病的一大軟肋,是缺乏生理學(xué)理論基礎(chǔ)。深度學(xué)習(xí)模型中的隱節(jié)點(diǎn)的物理意義,也無(wú)法解釋。

DeepMind 和 UCL 合著的 Nature 論文,發(fā)現(xiàn)深度學(xué)習(xí)模型中隱節(jié)點(diǎn),與腦內(nèi)的位置細(xì)胞和網(wǎng)格細(xì)胞,這兩者的激活機(jī)制和數(shù)值分布,非常相似,幾乎呈一一對(duì)應(yīng)的關(guān)系。

Extended Data Fig 3.d:第一行,深度學(xué)習(xí)模型的隱節(jié)點(diǎn)的激活機(jī)制和數(shù)值分布。第二行,Moser 夫婦發(fā)現(xiàn)的網(wǎng)格細(xì)胞的蜂窩狀數(shù)值分布。深度學(xué)習(xí)隱節(jié)點(diǎn)與網(wǎng)格細(xì)胞的數(shù)值分布,極為相似。第三行,數(shù)值分布所揭示的空間定位及運(yùn)動(dòng)方向。

這篇論文,之所以引起學(xué)界轟動(dòng),原因在于證明了,把深度學(xué)習(xí)模型用于空間的定位和導(dǎo)航,其隱節(jié)點(diǎn)的物理意義,類似于大腦的位置細(xì)胞和網(wǎng)格細(xì)胞。進(jìn)一步猜想,深度學(xué)習(xí)模型的定位和導(dǎo)航的計(jì)算過(guò)程,很可能與大腦的定位和導(dǎo)航的生理機(jī)制,也極為相似。

為什么DeepMind 熱衷于玩游戲?

面向空間定位和導(dǎo)航的深度學(xué)習(xí)模型,有哪些應(yīng)用場(chǎng)景呢?DeepMind 把這個(gè)技術(shù)用于玩電子游戲,類似于 “反恐精英”(Counter Strike)那樣的走迷宮射殺***的游戲。

DeepMind 下完圍棋以后,玩初級(jí)電子游戲,現(xiàn)在升級(jí)了,改玩高級(jí)游戲了。為什么DeepMind 那么熱衷于游戲呢?

游戲是仿真系統(tǒng),一切盡在掌控之中,想要什么數(shù)據(jù),就能獲取什么數(shù)據(jù)。所以,每條數(shù)據(jù),都很全面,不會(huì)有數(shù)據(jù)丟失。

同時(shí),只要多雇一些玩家,多花一點(diǎn)時(shí)間,要多少訓(xùn)練數(shù)據(jù),就有多少訓(xùn)練數(shù)據(jù)。

用游戲來(lái)驗(yàn)證深度學(xué)習(xí)模型,非常方便。這是 DeepMind 熱衷于玩游戲的原因。同時(shí),因?yàn)槟軌蚩焖俚孬@取數(shù)據(jù),DeepMind 對(duì)于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)研究,領(lǐng)先世界。

Figure 3. DeepMind 把基于深度學(xué)習(xí)的空間定位和導(dǎo)航技術(shù),應(yīng)用于反恐精英(Counter Strike)游戲。

問(wèn)題是,把適用于游戲的深度學(xué)習(xí)模型,移用到真實(shí)世界,解決實(shí)際問(wèn)題,是否仍然有效?

同是 Google 麾下兄弟,Google Brain 更注重解決實(shí)際問(wèn)題,兄弟倆各有千秋。Google Brain 開(kāi)發(fā)的 Tensorflow成為工程利器,而 DeepMind 的論文,提供新方法,引領(lǐng)研究前沿。

深度學(xué)習(xí)仿真位置和網(wǎng)格細(xì)胞的論文,技術(shù)上有什么創(chuàng)新?

短的答案,沒(méi)有獨(dú)特的創(chuàng)新。

長(zhǎng)的答案,得先講講馬爾科夫和強(qiáng)化學(xué)習(xí)。

強(qiáng)化學(xué)習(xí)(Reinforcement Learning)是機(jī)器學(xué)習(xí)的一個(gè)重要分支,它試圖解決決策優(yōu)化的問(wèn)題。所謂決策優(yōu)化,是指面對(duì)特定狀態(tài)(State,S),采取什么行動(dòng)方案(Action,A),才能使收益最大(Reward,R)。很多問(wèn)題都與決策優(yōu)化有關(guān),從下棋,到投資,到課程安排,到駕車,到走迷宮等等。

AlphaGo 的核心算法,就是強(qiáng)化學(xué)習(xí)。AlphaGo不僅穩(wěn)超勝券地戰(zhàn)勝了當(dāng)今世界所有人類高手,而且甚至不需要學(xué)習(xí)人類棋手的棋譜,完全靠自己摸索,在短短幾天內(nèi),發(fā)現(xiàn)并超越了一千多年來(lái)人類積累的全部圍棋戰(zhàn)略戰(zhàn)術(shù)。

最簡(jiǎn)單的強(qiáng)化學(xué)習(xí)的數(shù)學(xué)模型,是馬爾科夫決策過(guò)程(Markov Decision Process,MDP)。之所以說(shuō) MDP 是一個(gè)簡(jiǎn)單的模型,是因?yàn)樗鼘?duì)問(wèn)題做了很多限制。

1. 面對(duì)的狀態(tài) s_{t},數(shù)量 t = 1... T,T 是有限的。

2. 采取的行動(dòng)方案 a_{t},數(shù)量t = 1... T,T也是有限的。

3.對(duì)應(yīng)于特定狀態(tài) s_{t},當(dāng)下的收益 r_{t} 是明確的。

4. 在某一個(gè)時(shí)刻 t,采取了行動(dòng)方案 a_{t},狀態(tài)從當(dāng)前的 s_{t} 轉(zhuǎn)換成下一個(gè)狀態(tài) s_{t+1}。下一個(gè)狀態(tài)s_{t+1}有多種可能,從當(dāng)前狀態(tài) s_{t}轉(zhuǎn)換到下一個(gè)狀態(tài)中的某一種狀態(tài)的概率,稱為轉(zhuǎn)換概率。但是轉(zhuǎn)換概率,只依賴于當(dāng)前狀態(tài) s_{t},而與先前的狀態(tài),s_{t-1}, s_{t-2} ... 無(wú)關(guān)。

解決馬爾科夫決策過(guò)程問(wèn)題的常用的算法,是動(dòng)態(tài)規(guī)劃(Dynamic Programming)。

對(duì)馬爾科夫決策過(guò)程的各項(xiàng)限制,不斷放松,研究相應(yīng)的算法,是強(qiáng)化學(xué)習(xí)的目標(biāo)。

例如對(duì)狀態(tài) s_{t}放松限制,

1. 假如狀態(tài) s_{t} 的數(shù)量t = 1... T,T雖然有限,但是數(shù)量巨大,或者有數(shù)量無(wú)限,如何改進(jìn)算法?

2.假如狀態(tài) s_{t} 不能完全確定,只能被部分觀察到,剩余部分被遮擋或缺失,如何改進(jìn)算法?

3. 假如轉(zhuǎn)換概率,不僅依賴于當(dāng)前狀態(tài),而且依賴于先前的運(yùn)動(dòng)軌跡,如何改進(jìn)算法?

4. 假如遇到先前沒(méi)有遇見(jiàn)過(guò)的新?tīng)顟B(tài)s_{t},有沒(méi)有可能在以往遇見(jiàn)過(guò)的狀態(tài)中,找到相似狀態(tài),從而估算轉(zhuǎn)換概率,估算收益?

Extended Data Fig 5. 用GridLSTM 來(lái)總結(jié)以往的運(yùn)動(dòng)軌跡,并加上神經(jīng)網(wǎng)絡(luò) g 來(lái)判別當(dāng)前的空間定位和運(yùn)動(dòng)方向。然后基于對(duì)當(dāng)前的空間定位和導(dǎo)航的判斷,用另一個(gè) LSTM 來(lái)估算狀態(tài)轉(zhuǎn)換概率,從而決定導(dǎo)航策略。

這篇論文用深度學(xué)習(xí)模型,來(lái)仿真位置和網(wǎng)格細(xì)胞。具體來(lái)說(shuō),

1.用 CNN 來(lái)處理圖像,找到周邊環(huán)境中的標(biāo)志物,用于識(shí)別當(dāng)前的空間位置。

2. 把圖像處理的結(jié)果,與以往的運(yùn)動(dòng)軌跡相結(jié)合,用GridLSTM 來(lái)估算當(dāng)前的狀態(tài)。

3. 把GridLSTM 估算出的當(dāng)前狀態(tài),經(jīng)過(guò)一個(gè)神經(jīng)網(wǎng)絡(luò) g 的再加工,得到類似于位置細(xì)胞和網(wǎng)格細(xì)胞的隱節(jié)點(diǎn)。

4. 把當(dāng)前的位置和運(yùn)動(dòng)方向,以及目標(biāo)的位置,作為第二個(gè) LSTM 模型的輸入,確定導(dǎo)航?jīng)Q策。

上述所有模塊,都是現(xiàn)成技術(shù)的集成,并無(wú)顯著創(chuàng)新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 導(dǎo)航
    +關(guān)注

    關(guān)注

    7

    文章

    515

    瀏覽量

    42297
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46368

    瀏覽量

    236554
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5439

    瀏覽量

    120797

原文標(biāo)題:專家解讀DeepMind最新論文:深度學(xué)習(xí)模型復(fù)現(xiàn)大腦網(wǎng)格細(xì)胞

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人類首創(chuàng)能生成神經(jīng)細(xì)胞的“迷你大腦”,更精確模擬神經(jīng)網(wǎng)絡(luò)!

    `近日,凱斯西儲(chǔ)大學(xué)醫(yī)學(xué)院、紐約干細(xì)胞基金會(huì)(NYSCF)研究所和喬治華盛頓大學(xué)的研究人員聯(lián)合提出了一種新方法,通過(guò)人類胚胎干細(xì)胞培育生成3D版的“迷你大腦”。這些“迷你大腦”名為“
    發(fā)表于 08-21 09:26

    人工智能可助辨識(shí)細(xì)胞結(jié)構(gòu)

    美國(guó)艾倫細(xì)胞科學(xué)研究所的科學(xué)家使用機(jī)器學(xué)習(xí)技術(shù)訓(xùn)練計(jì)算機(jī),使其可在不使用熒光標(biāo)記的情況下較為準(zhǔn)確地辨認(rèn)出細(xì)胞結(jié)構(gòu)。傳統(tǒng)的熒光顯微法使用發(fā)光分子標(biāo)記來(lái)確定細(xì)胞結(jié)構(gòu),但價(jià)格昂貴且每次只能觀察一部分結(jié)構(gòu)
    發(fā)表于 10-15 05:21

    細(xì)胞的同時(shí)AFM熒光成像應(yīng)用簡(jiǎn)報(bào)

    細(xì)胞的同時(shí)AFM /熒光成像 - 應(yīng)用簡(jiǎn)報(bào)
    發(fā)表于 10-23 10:39

    Eversipn STT-MRAM的MJT細(xì)胞介紹

    Eversipn STT-MRAM的MJT細(xì)胞
    發(fā)表于 02-24 07:28

    細(xì)胞融合與單克隆抗體

    細(xì)胞融合(cell fusion),又稱體細(xì)胞雜交(somatic hybridiazation),是指兩個(gè)或更多個(gè)相同或不同細(xì)胞通過(guò)膜 融合形成單個(gè)細(xì)胞的過(guò)程。Muller
    發(fā)表于 02-17 10:02 ?0次下載

    總線細(xì)胞陣列中空閑細(xì)胞冗余數(shù)量研究

    總線細(xì)胞陣列中空閑細(xì)胞冗余數(shù)量研究_王濤
    發(fā)表于 01-07 21:39 ?0次下載

    細(xì)胞的產(chǎn)生與美國(guó)科學(xué)家成功制造出具有造血干細(xì)胞功能的細(xì)胞

    英國(guó)《自然》雜志 16 日發(fā)表了兩項(xiàng)干細(xì)胞研究重要進(jìn)展,美國(guó)科學(xué)家成功將人體多能干細(xì)胞和小鼠內(nèi)皮細(xì)胞轉(zhuǎn)化為具有造血干細(xì)胞功能的細(xì)胞。最新成果
    發(fā)表于 09-22 15:27 ?8次下載

    首次創(chuàng)造出能生成神經(jīng)細(xì)胞的3D版“迷你大腦

    由胚胎干細(xì)胞發(fā)育而來(lái)的“迷你大腦”,能夠模擬與實(shí)際大腦相仿的細(xì)胞和神經(jīng)間交互的過(guò)程,讓研究人員更準(zhǔn)確地觀察到與脫髓鞘相關(guān)疾病的機(jī)理和發(fā)病過(guò)程,并探尋與這些疾病的新療法,加速對(duì)相關(guān)疾病的
    的頭像 發(fā)表于 08-01 09:10 ?3033次閱讀

    T 細(xì)胞打入腫瘤細(xì)胞要先對(duì)好“暗號(hào)”

    具有腫瘤清除作用的免疫 T 細(xì)胞需要與腫瘤細(xì)胞對(duì)好“暗號(hào)”后,才能打入腫瘤組織內(nèi)部
    的頭像 發(fā)表于 06-19 09:20 ?3723次閱讀

    無(wú)人機(jī)集群類腦導(dǎo)航系統(tǒng)的應(yīng)用特點(diǎn)及發(fā)展現(xiàn)狀研究

    隨著網(wǎng)格細(xì)胞、位置細(xì)胞及頭朝向細(xì)胞等類腦認(rèn)知導(dǎo)航細(xì)胞
    發(fā)表于 07-31 11:54 ?2359次閱讀

    “解碼”單細(xì)胞測(cè)序的故事

    有別傳統(tǒng)的基因芯片,從超過(guò)混合數(shù)萬(wàn)個(gè)細(xì)胞中提取的DNA或者RNA進(jìn)行測(cè)序,得出平均值。單細(xì)胞測(cè)序可以在單個(gè)細(xì)胞層面解析基因組及其表達(dá)調(diào)控特征,能更全面掌握
    的頭像 發(fā)表于 03-17 11:02 ?2007次閱讀

    基于CNN和LSTM的蛋白質(zhì)亞細(xì)胞定位研究對(duì)比

    基于CNN和LSTM的蛋白質(zhì)亞細(xì)胞定位研究對(duì)比
    發(fā)表于 06-11 14:16 ?15次下載

    基于人類乳腺細(xì)胞圖譜中各細(xì)胞亞型之間的位置關(guān)系和空間聯(lián)系

    ? 人類細(xì)胞圖譜計(jì)劃(Human Cell Atlas,HCA)旨在描述人體中每個(gè)細(xì)胞(約37萬(wàn)億個(gè))的詳細(xì)特征,呈現(xiàn)不同類型細(xì)胞在人體組織的三維結(jié)構(gòu),勾勒他們?cè)谌梭w系統(tǒng)內(nèi)的聯(lián)系,揭示圖譜變化與健康
    的頭像 發(fā)表于 07-23 15:02 ?608次閱讀
    基于人類乳腺<b class='flag-5'>細(xì)胞</b>圖譜中各<b class='flag-5'>細(xì)胞</b>亞型之間的<b class='flag-5'>位置</b>關(guān)系和空間聯(lián)系

    細(xì)胞細(xì)胞注釋詳解之singleR細(xì)胞注釋

    除了對(duì)每個(gè)細(xì)胞的所屬細(xì)胞類型進(jìn)行評(píng)分外,singleR還會(huì)對(duì)seuret聚類結(jié)果中每個(gè)cluster中各細(xì)胞類型比例進(jìn)行分析,評(píng)估每個(gè)cluster所屬的細(xì)胞類型。結(jié)果由
    的頭像 發(fā)表于 09-21 17:34 ?2111次閱讀
    單<b class='flag-5'>細(xì)胞</b><b class='flag-5'>細(xì)胞</b>注釋詳解之singleR<b class='flag-5'>細(xì)胞</b>注釋

    細(xì)胞的“聚光燈”——前沿活細(xì)胞成像的案例分享

    細(xì)胞是一切生命的基本單位,構(gòu)成了各式各樣的生命體。因此研究細(xì)胞的結(jié)構(gòu)以及內(nèi)部生命活動(dòng)過(guò)程可以幫助我們更深入地探究生命的奧秘,了解生命體是如何構(gòu)建和運(yùn)作的。傳統(tǒng)的細(xì)胞顯微術(shù)只能通過(guò)觀察固定的細(xì)胞
    的頭像 發(fā)表于 10-24 08:04 ?29次閱讀
    活<b class='flag-5'>細(xì)胞</b>的“聚光燈”——前沿活<b class='flag-5'>細(xì)胞</b>成像的案例分享