0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

實驗證明:AI機器感知能力相近甚至超越人類感知能力

如意 ? 來源:科技行者 ? 作者:科技行者 ? 2020-08-28 10:23 ? 次閱讀

人類級別的表現(xiàn)、人類級別的精度……在開發(fā)AI系統(tǒng)的企業(yè)中,我們經(jīng)常會聽到這類表述,其指向范圍則涵蓋人臉識別、物體檢測,乃至問題解答等各個方面。隨著機器學(xué)習(xí)深度學(xué)習(xí)的不斷進步,近年來越來越多卓越的產(chǎn)品也開始將AI算法作為自身的實現(xiàn)基礎(chǔ)。

但是,這種比較往往只考慮到在有限數(shù)據(jù)集上對深度學(xué)習(xí)算法進行的測試結(jié)果。一旦貿(mào)然將關(guān)鍵性任務(wù)交付給AI模型,這種草率的考核標(biāo)準(zhǔn)往往會導(dǎo)致AI系統(tǒng)的錯誤期望,甚至可能產(chǎn)生危險的后果。

最近一項來自德國各組織及高校的研究,強調(diào)了對深度技術(shù)在視覺數(shù)據(jù)處理領(lǐng)域進行性能評估時所面臨的實際挑戰(zhàn)。研究人員們在這篇題為《人與機器的感知比較:眾所周知的難題》的論文中,著重指出了當(dāng)前深度神經(jīng)網(wǎng)絡(luò)與人類視覺系統(tǒng)的識別能力比較方法存在的幾個重要問題。

在這項研究中,科學(xué)家們進行了一系列實驗,包括深入挖掘深度學(xué)習(xí)結(jié)果的深層內(nèi)容,并將其與人類視覺系統(tǒng)的功能做出比較。他們的發(fā)現(xiàn)提醒我們,即使AI看似擁有與人類相近甚至已經(jīng)超越人類的視覺識別能力,我們?nèi)匀恍枰灾?jǐn)慎的態(tài)度看待這方面結(jié)果。

人類與計算機視覺的復(fù)雜性

對于人類感知能力的基本原理,特別是重現(xiàn)這種感知效果的無休止探索當(dāng)中,以深度學(xué)習(xí)為基礎(chǔ)的計算機視覺技術(shù)帶來了最令人稱道的表現(xiàn)。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是計算機視覺深度學(xué)習(xí)算法中所常用的架構(gòu),能夠完成種種傳統(tǒng)軟件根本無法實現(xiàn)的高難度任務(wù)。

然而,將神經(jīng)網(wǎng)絡(luò)與人類感知進行比較,仍是一項巨大的挑戰(zhàn)。一方面是因為我們對人類的視覺系統(tǒng)乃至整個人類大腦還不夠了解,另一方面則是因為深度學(xué)習(xí)系統(tǒng)本身的復(fù)雜運作機制同樣令人難以捉摸。事實上,深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜度之高,往往令創(chuàng)造者也對其感到困惑。

近年來,大量研究試圖評估神經(jīng)網(wǎng)絡(luò)的內(nèi)部工作原理,及其在處理現(xiàn)實情況中表現(xiàn)出的健壯性。德國研究人員們在論文中寫道,“盡管進行了大量研究,但對人類感知與機器感知能力進行比較,仍然極度困難。”

在此次研究中,科學(xué)家們主要關(guān)注三個核心領(lǐng)域,借此評估人類與深度神經(jīng)網(wǎng)絡(luò)究竟如何處理視覺數(shù)據(jù)。

神經(jīng)網(wǎng)絡(luò)如何感知輪廓?

第一項測試為輪廓檢測。在此項實驗中,人類與AI參與者需要說出所面對的圖像中是否包含閉合輪廓。其目標(biāo)在于了解深度學(xué)習(xí)算法是否掌握了閉合與開放形狀的概念,以及其能夠在各類條件下都順利檢測出符合概念定義的目標(biāo)。

實驗證明:AI機器感知能力相近甚至超越人類感知能力

▲你能判斷出,以上哪幅圖像中包含閉合圖形嗎?

研究人員們寫道,“對于人類來說,圖中所示為一個閉合輪廓,其周邊則分布著大量開放輪廓。相比之下,DNN則可能很難檢測到閉合輪廓,因為神經(jīng)網(wǎng)絡(luò)可能會把閉合輪廓與其他圖形視為統(tǒng)一的整體?!?/p>

在實驗當(dāng)中,科學(xué)家們使用了ResNet-50,即由微軟公司AI研究人員們開發(fā)的一套流行卷積神經(jīng)網(wǎng)絡(luò)。他們使用遷移學(xué)習(xí)技術(shù),使用14000個閉合與開放輪廓圖像對該AI模型進行了微調(diào)。

接下來,他們又通過其他類似的訓(xùn)練數(shù)據(jù)(使用不同指向的圖形)進行AI測試。初步發(fā)現(xiàn)表明,經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)似乎掌握了閉合輪廓的基本概念。即使訓(xùn)練數(shù)據(jù)集中僅包含直線圖形,模型也能夠在處理曲線圖形時帶來良好表現(xiàn)。

科學(xué)家們寫道,“這些結(jié)果表明,我們的模型確實掌握了開放輪廓與閉合輪廓的概念,而且其判斷過程與人類非常相似。”

但進一步調(diào)查顯示,某些不會影響到人類判斷的因素卻有可能降低AI模型的判斷準(zhǔn)確率。例如,調(diào)整線條的顏色與寬度會導(dǎo)致深度學(xué)習(xí)模型的準(zhǔn)確率驟然下降。而當(dāng)形狀的尺寸超過特定大小時,模型似乎也難以正確對形狀作出判斷。

此外,神經(jīng)網(wǎng)絡(luò)對于對抗性干擾也顯得非常敏感。所謂對抗性干擾,屬于一類精心設(shè)計的變化。人眼雖然無法察覺這些變化,但卻會給機器學(xué)習(xí)系統(tǒng)的行為帶來巨大影響。

為了進一步研究AI的決策過程,科學(xué)家們使用了特征袋(Bag-of-Feature)網(wǎng)絡(luò),這項技術(shù)旨在對深度學(xué)習(xí)模型決策中所使用的數(shù)據(jù)位進行定位。分析結(jié)果證明,“神經(jīng)網(wǎng)絡(luò)在進行分類標(biāo)記時,確實會使用某些局部特征,例如具有端點與短邊,作為強依據(jù)?!?/p>

機器學(xué)習(xí)能夠?qū)D像做出推理嗎?

第二項實驗旨在測試深度學(xué)習(xí)算法在抽象視覺推理中的表現(xiàn)。用于實驗的數(shù)據(jù)基于合成視覺推理測試(SVRT),AI需要在其中回答一系列關(guān)于圖像中不同形狀間關(guān)系的問題。測試問題分為找不同(例如,圖像中的兩個形狀是否相同?)以及空間判斷(例如,較小的形狀是否位于較大形狀的中心?)等。人類觀察者能夠輕松解決這些問題。

實驗證明:AI機器感知能力相近甚至超越人類感知能力

▲SVRT挑戰(zhàn),要求AI模型解決找不同與空間判斷類型的任務(wù)。在實驗當(dāng)中,研究人員們使用RESNet-50測試了其在不同大小的訓(xùn)練數(shù)據(jù)集中的表現(xiàn)。結(jié)果表明,通過28000個樣本進行微調(diào)訓(xùn)練之后的模型,在找不同與空間判斷任務(wù)上均表現(xiàn)良好。(之前的實驗,使用的是一套小型神經(jīng)網(wǎng)絡(luò)并配合100萬張樣本圖像)隨著研究人員減少訓(xùn)練示例的數(shù)量,AI的性能也開始下滑,而且在找不同任務(wù)中的下滑速度更快。

研究人員們寫道,“相較于空間判斷類任務(wù),找不同任務(wù)對于訓(xùn)練樣本的需求量更大。當(dāng)然,這并不能作為前饋神經(jīng)網(wǎng)絡(luò)與人類視覺系統(tǒng)之間存在系統(tǒng)性差異的證據(jù)?!?/p>

研究人員們指出,人類視覺系統(tǒng)天然就在接受大量抽象視覺推理任務(wù)的訓(xùn)練。因此,直接比較對于只能在低數(shù)據(jù)樣本量下進行學(xué)習(xí)的深度學(xué)習(xí)模型并不公平。所以,不能貿(mào)然給出人類與AI內(nèi)部信息處理方式之間存在差異的結(jié)論。

研究人員們寫道,“如果真的從零開始進行訓(xùn)練,人類視覺系統(tǒng)在這兩項識別任務(wù)中,沒準(zhǔn)會與表現(xiàn)出ResNet-50類似的情況?!?/p>

衡量深度學(xué)習(xí)的間隙判別

間隙送別可以算是視覺系統(tǒng)當(dāng)中最有趣的測試之一。以下圖為例,大家能不能猜出完整的圖像呈現(xiàn)的是什么?

毫無疑問,這是一只貓。從左上方的局部圖來看,大家應(yīng)該能夠輕松預(yù)測出圖像的內(nèi)容。換言之,我們?nèi)祟愋枰吹揭欢〝?shù)量的整體形狀與圖案,才能識別出圖像中的物體。而局部放大得越夸張,失去的特征也就越多,導(dǎo)致我們越難以區(qū)分圖像中的內(nèi)容。

深度學(xué)習(xí)系統(tǒng)的判斷也以特征為基礎(chǔ),但具體方式卻更加巧妙。神經(jīng)網(wǎng)絡(luò)有時候能夠發(fā)現(xiàn)肉眼無法察覺的微小特征,而且即使把局部放得很大,這些特征仍然能夠得到正確檢測。

在最終實驗當(dāng)中,研究人員們試圖通過逐漸放大圖像,直到AI模型的精度開始顯著下降,借此衡量深度神經(jīng)網(wǎng)絡(luò)的間隙判別。

這項實驗表明,人類的圖像間隙判別與深度神經(jīng)網(wǎng)絡(luò)之間存在很大差異。但研究人員們在其論文中指出,以往關(guān)于神經(jīng)網(wǎng)絡(luò)間隙判別的大多數(shù)測試,主要基于人類選擇的局部圖。這些局部的選擇,往往有利于人類視覺系統(tǒng)。

在使用“機器選擇”的局部圖對深度學(xué)習(xí)模型進行測試時,研究人員們發(fā)現(xiàn)人類與AI的間隙判別表現(xiàn)基本一致。

實驗證明:AI機器感知能力相近甚至超越人類感知能力

▲間隙判別測試能夠評估局部圖對于AI判斷準(zhǔn)確率的具體影響。

研究人員們寫道,“這些結(jié)果顯示,只有在完全相同的基礎(chǔ)之上進行人機比較測試,才能避免人為設(shè)計給結(jié)果造成的偏差。人與機器之間的所有條件、命令與程序都應(yīng)盡可能接近,借此保證觀察到的所有差異都源自決策策略——而非測試程序中的差異?!?/p>

縮小AI與人類智能之間的鴻溝

隨著AI系統(tǒng)復(fù)雜程度的不斷提升,我們也需要開發(fā)出越來越復(fù)雜的方法以進行AI測試。這一領(lǐng)域之前的研究表明,大部分用于衡量計算機視覺系統(tǒng)準(zhǔn)確率的流行基準(zhǔn)測試中存在一定誤導(dǎo)性。德國研究人員們的工作,旨在更好地衡量人工智能表現(xiàn),并準(zhǔn)確量化AI與人類智能之間的真實差異。他們得出的結(jié)論,也將為未來的AI研究提供方向。

研究人員們總結(jié)道,“人與機器之間的比較性研究,往往受到人類自發(fā)解釋思維這一強烈偏見的影響。只有選擇適當(dāng)?shù)姆治龉ぞ卟⑦M行廣泛的交叉核查(例如網(wǎng)絡(luò)架構(gòu)的變化、實驗程序的統(tǒng)一、概括性測試、對抗性示例以及受約束的網(wǎng)絡(luò)測試等),我們才能對結(jié)果做出合理解釋,并正視這種自發(fā)性偏見的存在??偠灾趯θ祟惻c機器的感知能力進行比較時,必須注意不要向其中人為強加任何系統(tǒng)性的偏見?!?br /> 責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4726

    瀏覽量

    100315
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29383

    瀏覽量

    267678
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8323

    瀏覽量

    132166
收藏 人收藏

    評論

    相關(guān)推薦

    感知能力新型夾持器控制器設(shè)計

    敘述了機器人夾持器中的力覺、觸覺、位置檢測裝置以及多感知能力新型夾持器控制器硬件和軟件的設(shè)計原理和實現(xiàn)方法。關(guān)鍵詞:機器人;夾持器;傳感器;PIDAbstract :A robot gripper
    發(fā)表于 06-30 09:18 ?11次下載

    發(fā)展具有情境感知能力的PDA

    不具有情境感知能力的PDA(個人數(shù)字助理),也許能夠借助無線網(wǎng)絡(luò)的服務(wù)與應(yīng)用程序,達到在任何時間、任何地點,提供任何使用者需要的任何信息,但是我們更著重在合適的時間,
    發(fā)表于 07-15 09:27 ?19次下載

    人工智能的感知能力、理解能力和學(xué)習(xí)能力以及交互能力的分析

    1 感知能力 目前人工智能的感知主要通過物聯(lián)網(wǎng)來實現(xiàn),它提供了 計算機感知和控制物理世界的接口與手段,能夠采集數(shù)據(jù)、 記憶,分析、傳送數(shù)據(jù),進行交互、控制等。比如攝像頭和相 機記錄了關(guān)于世界的大量
    發(fā)表于 09-13 20:37 ?5次下載

    手機離人太近,真的會讓你的感知能力下降嗎?

    如果手機離人太近,人的感知能力會明顯削弱,即使手機關(guān)閉也一樣。德州大學(xué)麥克庫姆商學(xué)院在一份報告中得出這樣的結(jié)論。
    的頭像 發(fā)表于 09-26 17:02 ?7074次閱讀

    仿人機器手出現(xiàn)?仿人機器手通用性強和感知能力豐富

    據(jù)悉,英國Shadow Robot公司研制出先進的Shadow仿人機器手,該機器手具有通用性強、感知能力豐富、能夠?qū)崿F(xiàn)滿足位置和力的閉環(huán)控制,精確、穩(wěn)固抓取等優(yōu)點,可廣泛應(yīng)用在空間探索、危險環(huán)境作業(yè)、醫(yī)學(xué)工程、工業(yè)生產(chǎn)以及服務(wù)
    的頭像 發(fā)表于 10-05 16:26 ?2691次閱讀

    感應(yīng)手套怎樣使機器人的手獲得這樣的感知能力

    Zhenan Bao 表示:“有朝一日,該技術(shù)能夠讓機器人獲得人類皮膚一樣的感知能力。比如機械手可以觸摸覆盆子,但不會對其造成破壞。當(dāng)然,距離實現(xiàn)這一目標(biāo),還有很長一段路要走”。
    的頭像 發(fā)表于 11-26 11:05 ?3906次閱讀

    Occipital的Structure Core為AR/VR頭顯帶來了深度感知能力

    Occipital的深度感知模塊Structure Sensor為iPhone和iPad提供了 HoloLens 般的深度感知能力?,F(xiàn)在,這家公司的最新產(chǎn)品有望為安卓設(shè)備,AR/VR頭顯,及其他設(shè)備帶來同樣的功能。
    發(fā)表于 11-30 14:15 ?1373次閱讀

    關(guān)于MATLAB的藝術(shù)鑒賞的能力的分析和介紹

    人類與生俱來就有對藝術(shù)進行分類的感知能力,并且擅長識別不同畫作之間的共同點,但缺乏時間和耐心應(yīng)用這些技能對數(shù)以千計甚至數(shù)以百萬計的繪畫作品進行分類。處理這種規(guī)模龐大的任務(wù)是計算機所擅長的。通過開發(fā)與
    的頭像 發(fā)表于 09-12 17:08 ?1317次閱讀

    掃地機器人的感知能力,正在進化……

    如題,掃地機器人的感知能力一直在提升,例如早期的掃地機器人主要以遵循隨機運動的原則行進,當(dāng)碰到障礙物時就隨機轉(zhuǎn)向,直到碰到下一個障礙物,如此循環(huán)往復(fù)。
    發(fā)表于 09-03 13:59 ?1366次閱讀

    深入探索人工智能機器人的“感知能力”和機器視覺

    我們知道,人工智能的目標(biāo)之一就是讓計算機模擬人類的視覺、聽覺、觸覺等感知能力,嘗試去看、聽、讀,理解圖像、文字、語音等,在此基礎(chǔ)上,再讓人工智能具有思維能力、行動能力,最終成為跟
    的頭像 發(fā)表于 09-14 15:33 ?8239次閱讀

    雙弱感知能力機器人在線協(xié)作搜索街道算法

    在未知環(huán)境中搜索一個目標(biāo),是機器人的基本任務(wù)場景之一,在現(xiàn)實中有著廣泛的應(yīng)用。相關(guān)問題在計算幾何學(xué)科和機器人學(xué)科的研究中得到了廣泛的關(guān)注。研究了一個雙弱感知能力機器人在線協(xié)作搜索街道的
    發(fā)表于 04-12 09:45 ?9次下載
    雙弱<b class='flag-5'>感知能力</b><b class='flag-5'>機器</b>人在線協(xié)作搜索街道算法

    2021 OPPO開發(fā)者大會 智能終端通過強大的感知能力

    2021 OPPO開發(fā)者大會上 智能終端通過強大的感知能力,為客戶提供更好的體驗。
    的頭像 發(fā)表于 10-27 14:08 ?1274次閱讀
    2021 OPPO開發(fā)者大會 智能終端通過強大的<b class='flag-5'>感知能力</b>

    2021 OPPO開發(fā)者大會 融合感知能力端側(cè)數(shù)據(jù)處理

    2021 OPPO開發(fā)者大會 上,融合感知能力端側(cè)數(shù)據(jù)處理
    的頭像 發(fā)表于 10-27 14:12 ?1444次閱讀
    2021 OPPO開發(fā)者大會 融合<b class='flag-5'>感知能力</b>端側(cè)數(shù)據(jù)處理

    利用進化的傳感器和AI,擴大感知能力

    對于所有生物來說,對于外界情況的感知能力都是其賴以生存不可缺少的能力。人類通過視覺、聽覺、味覺、嗅覺和觸覺的五感來收集信息,并發(fā)揮高度的智慧來認知和理解周邊狀況,進行高度的行動和判斷??傮w來看,
    的頭像 發(fā)表于 06-28 17:06 ?679次閱讀
    利用進化的傳感器和<b class='flag-5'>AI</b>,擴大<b class='flag-5'>感知能力</b>

    梯云物聯(lián)|AI提高物聯(lián)網(wǎng)感知能力:讓電梯更智能、安全!

    在當(dāng)今日新月異的科技浪潮中,人工智能(AI)與物聯(lián)網(wǎng)(IoT)的深度融合正在為各行各業(yè)帶來革命性的變化。特別是在電梯行業(yè)中,AI技術(shù)的引入不僅極大地提升了物聯(lián)網(wǎng)的感知能力,更讓電梯變得更加智能和安全。
    的頭像 發(fā)表于 06-03 11:49 ?431次閱讀
    梯云物聯(lián)|<b class='flag-5'>AI</b>提高物聯(lián)網(wǎng)<b class='flag-5'>感知能力</b>:讓電梯更智能、安全!