0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

新的DNN目標識別模型: 同時關注“像什么”和“是什么”

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-31 09:49 ? 次閱讀

一般認為,大腦對可視目標的識別過程分為兩部分:視覺屬性和語義屬性,即目標“像什么“和”是什么“。過去人們對這兩部分一般是分開研究的,現(xiàn)在,劍橋大學的研究人員利用計算機視覺的標準深度神經(jīng)網(wǎng)絡AlexNet,可以將二者結(jié)合起來研究,并探尋它們之間的信息交互和映射關系究竟是怎樣的。

劍橋大學的神經(jīng)科學研究人員將計算機視覺與語義相結(jié)合,開發(fā)出一種新模型,可以更清晰地理解大腦對視覺目標的處理方式。

人類識別目標的能力分為兩個主要過程,對目標的快速視覺分析,以及對整個生命過程中獲得的語義知識的激活。大多數(shù)過去的研究一般是對這兩個過程進行分別研究。因此,這兩個過程之間的相互作用目前仍然很不清楚。

新的DNN目標識別模型: 同時關注“像什么”和“是什么”

劍橋大學的研究人員團隊使用一種新方法研究了大腦對目標的識別過程,該方法結(jié)合了深度神經(jīng)網(wǎng)絡與吸引子網(wǎng)絡語義模型。與之前的大多數(shù)研究相比,這一識別技術既考慮了視覺信息,也考慮了關于被識別目標的概念知識。

劍橋大學的研究人員表示:“我們之前曾對健康人和腦損傷患者進行了大量研究,以更好地了解大腦中對識別目標的處理方式。這項工作的主要貢獻之一是,它表明了大腦在理解‘目標是什么’這個問題時,涉及到視覺輸入隨著時間的推移,迅速轉(zhuǎn)變?yōu)橛幸饬x的表現(xiàn)形式,這種轉(zhuǎn)變過程是沿著腹側(cè)顳葉完成的?!?/p>

研究人員堅信,對語義記憶的訪問是理解“目標是什么”的關鍵,因此僅關注與視覺相關的屬性的理論并不能完全捕捉到這個復雜的過程。

該集成模型的體系結(jié)構(gòu),可以看到,會有越來越復雜的視覺信息映射到語義信息上。

來源:Lorraine Tyler等。

“就是這個問題催生出了我們目前的研究,我們希望能夠完全理解低級視覺輸入是如何映射到對象意義的語義表示上的?!毖芯咳藛T解釋說。為此,他們使用了一個專門用于計算機視覺的標準深度神經(jīng)網(wǎng)絡,稱為AlexNet。

他們解釋說:“這個模型以及其他類似模型可以非常精確地識別圖像中的對象,但模型中不包含任何關于對象語義屬性的明確知識。例如,香蕉和獼猴桃的外觀(不同的顏色,形狀,質(zhì)地等)有很大不同,但是,我們能夠正確地理解它們都是水果。計算機視覺的模型可以區(qū)分香蕉和獼猴桃,但這些模型并不是對更抽象的知識進行編碼,即:它們都是水果?!?/p>

研究人員認識到神經(jīng)網(wǎng)絡在計算機視覺應用方面的局限性,將AlexNet視覺算法與神經(jīng)網(wǎng)絡相結(jié)合,將概念性的意義(包括語義知識)納入到對方程的分析中。

“像什么”和“是什么”的關系如何,信息如何交互和映射?

研究人員表示:“在這個組合模型中,會將視覺處理映射至語義處理,并激活我們關于概念的語義知識,”這個新技術已經(jīng)在16名志愿者的神經(jīng)影像數(shù)據(jù)上進行了測試,志愿者被要求在接受功能性核磁共振(fMRI)掃描的同時說出測試圖片中目標的名字。與傳統(tǒng)的深度神經(jīng)網(wǎng)絡(DNN)視覺模型相比,新方法能夠識別與視覺和語義處理相關的不同腦區(qū)。

圖為視覺深度神經(jīng)網(wǎng)絡(紫色)和語義吸引網(wǎng)絡(紅色-黃色)的不同層如何映射到大腦的不同區(qū)域。

來源:Lorraine Tyler等。

“這項研究最關鍵的發(fā)現(xiàn)是,通過考慮物體的視覺和語義屬性,可以更好地模擬物體識別過程中的大腦活動,這可以通過計算建模方法捕獲,”研究人員解釋說。

研究人員設計的方法對大腦中語義激活的階段進行了預測,預測結(jié)果與先前對目標的處理結(jié)果是一致的,其中粒度更粗的語義處理被更精細的處理所取代。研究人員還發(fā)現(xiàn),該模型在不同階段預測了大腦不同區(qū)域的對象處理方式的激活。

“最終,關于如何有意義地處理視覺目標的更優(yōu)秀的模型可能具有重要的臨床意義。例如,語義性癡呆癥的患者就失去了對象概念意義的知識,這項研究的發(fā)現(xiàn)對于該病的治療是很有幫助的?!毖芯咳藛T說。

劍橋大學的這項研究是對神經(jīng)科學領域的重要貢獻,因為它展示了大腦的不同區(qū)域是如何推進對目標的視覺處理和語義處理的。該研究最近發(fā)表在《Scientific Reports》上。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:劍橋構(gòu)建視覺“語義大腦”:兼顧視覺信息和語義表示

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    開發(fā)者手機 AI - 目標識別 demo

    %。 Init、DeInit 為Native的初始化和去初始化實現(xiàn),主要對模型進行創(chuàng)建、編譯以及銷毀。 Process為異步NAPI接口,主要完成目標識別的功能。實現(xiàn)包括前處理、推理和后處理3個部分。前處理主要
    發(fā)表于 04-11 16:14

    RCS目標識別

    各位好!我是一名學生,先階段在準備競賽,需要RCS目標識別技術,實現(xiàn)海上油污檢測。請問有沒有地方采購現(xiàn)成產(chǎn)品,或是自己制作是如何制作,謝謝!或是有其他什么方法可以實現(xiàn)海上油污檢測?
    發(fā)表于 01-27 15:50

    目標識別之YOLO學習筆記

    目標識別 YOLO 學習筆記(一)
    發(fā)表于 05-12 15:05

    基于樣本正交子空間的SAR目標識別方法

    利用合成孔徑雷達(Synthetic Aperture Radar, SAR)獲取的目標進行識別時,基于子空間的自動目標識別(Automatic Target Recognition
    發(fā)表于 02-10 14:00 ?19次下載

    運動目標識別與跟蹤系統(tǒng)的研究

    提出了一種運動目標識別與跟蹤系統(tǒng)的方案,給出了系統(tǒng)的原理圖和結(jié)構(gòu)框圖。重點論述了圖像處理的過程和算法,包括顏色模型的選擇,圖像的預處理,圖像分割,目標識別
    發(fā)表于 07-20 16:14 ?29次下載

    基于顏色和區(qū)域的運動目標識別

    針對全自主足球機器人目標識別受光強變化的影響, 實時性、準確性和魯棒性存在的不足, 提出了一種基于動態(tài)窗口HSI 色彩空間模型的閾值向量位與及區(qū)域合并算法, 并通過動態(tài)窗口減小
    發(fā)表于 06-28 15:36 ?34次下載
    基于顏色和區(qū)域的運動<b class='flag-5'>目標識別</b>

    基于MVDR參數(shù)譜在艦船目標識別中的應用

    基于MVDR參數(shù)譜在艦船目標識別中的應用_魏鑫
    發(fā)表于 01-07 21:28 ?0次下載

    紅外動目標識別跟蹤系統(tǒng)的實現(xiàn)方案

    紅外動目標識別跟蹤系統(tǒng)的實現(xiàn)方案
    發(fā)表于 01-12 22:13 ?24次下載

    基于OpenCv運動目標識別技術的研究孟介成

    基于OpenCv運動目標識別技術的研究_孟介成
    發(fā)表于 03-17 08:00 ?5次下載

    電磁場在目標識別中的應用

    電磁場在目標識別中的應用
    發(fā)表于 09-15 10:01 ?22次下載
    電磁場在<b class='flag-5'>目標識別</b>中的應用

    基于SIFT視覺詞匯的目標識別算法

    算法的目標識別算法。結(jié)合在無遮擋與被局部遮擋的交通工具全方位姿態(tài)模型庫上進行的目標識別試驗,得出結(jié)果:算法對無遮擋目標的平均識別率能到達83
    發(fā)表于 11-14 11:04 ?5次下載
    基于SIFT視覺詞匯的<b class='flag-5'>目標識別</b>算法

    基于改進KD樹與RANSC算法的目標識別算法

    為了能夠更好地滿足日益擴大的目標識別需求,提出了一種基于改進KD樹與RANSC算法的目標識別算法。通過對比改進前后KD樹匹配算法匹配SIFT特征點的執(zhí)行效果,很明顯的看出改進KD樹算法的匹配效果更佳
    發(fā)表于 11-16 17:45 ?17次下載

    基于擴展字典稀疏表示分類的遙感目標識別

    的SIFT特征構(gòu)成特征字典,并將原始的訓練字典改為訓練特征擴展字典進行稀疏表示,從而使字典更加具有判別能力,提高識別率。同時,分析了SIFT特征經(jīng)隨機投影后對識別率的影響。實驗表明,該方法對遙感圖像
    發(fā)表于 11-17 17:18 ?9次下載
    基于擴展字典稀疏表示分類的遙感<b class='flag-5'>目標識別</b>

    人類和 DNN目標識別穩(wěn)健性比較

    深度神經(jīng)網(wǎng)絡在很多任務上都已取得了媲美乃至超越人類的表現(xiàn),但其泛化能力仍遠不及人類。德國蒂賓根大學等多所機構(gòu)近期的一篇論文對人類和 DNN目標識別穩(wěn)健性進行了行為比較,并得到了一些有趣的見解
    發(fā)表于 10-19 00:48 ?542次閱讀

    基于聚類分析的復雜環(huán)境中人臉目標識別技術

    在現(xiàn)代社會,人臉目標識別技術在各大領域應用得越來越廣泛;同時,社會治安環(huán)境和國際安全問題也愈發(fā)嚴峻,人臉目標識別面臨著越來越嚴峻的挑戰(zhàn)。在復雜環(huán)境下,檢測目標和背景場景都是復雜且動態(tài)變
    發(fā)表于 05-18 14:48 ?10次下載