0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)“瓶頸”已至 計(jì)算機(jī)視覺(jué)如何突破困局?

張康康 ? 2019-07-29 18:21 ? 次閱讀


近期,計(jì)算機(jī)視覺(jué)奠基者之一,霍金的弟子,約翰霍普金斯大學(xué)教授Alan Yuille提出“深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域的瓶頸已至?!?/p>

人工智能的發(fā)展過(guò)程看,深度學(xué)習(xí)是繼專家系統(tǒng)之后人工智能應(yīng)用的又一重要研究領(lǐng)域,也是人工智能和神經(jīng)計(jì)算的核心研究課題之一。Alan Yuille認(rèn)為,現(xiàn)在做AI不提神經(jīng)網(wǎng)絡(luò),成果都很難發(fā)表了,這不是一個(gè)好勢(shì)頭。如果人們只追求神經(jīng)網(wǎng)絡(luò)的潮流,拋棄所有老方法,也不去想如何應(yīng)對(duì)深度網(wǎng)絡(luò)的局限性,那么這個(gè)領(lǐng)域可能很難有更好的發(fā)展。

深度學(xué)習(xí)確實(shí)是一個(gè)讓人向往的技術(shù),這無(wú)可辯駁。其實(shí),神經(jīng)網(wǎng)絡(luò)這個(gè)概念自上個(gè)世紀(jì)60年代就已經(jīng)出現(xiàn)了,只是因?yàn)樽罱诖髷?shù)據(jù)、計(jì)算機(jī)性能上面出現(xiàn)的飛躍,使得它真正變得有用起來(lái),由此也衍生出來(lái)一門叫做“深度學(xué)習(xí)”的專業(yè),當(dāng)前國(guó)內(nèi)涉及計(jì)算機(jī)視覺(jué)領(lǐng)域中,越來(lái)越多的人工智能公司或者研究機(jī)構(gòu)投身到“深度學(xué)習(xí)”的浪潮中了,國(guó)內(nèi)誕生了如曠視科技、商湯科技、極鏈科技Video++、依圖科技等優(yōu)秀的初創(chuàng)AI企業(yè)。旨在將復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)應(yīng)用在數(shù)據(jù)建模上,最終帶來(lái)前所未有的準(zhǔn)確性。

現(xiàn)在的技術(shù)開(kāi)發(fā)成果也確實(shí)讓人印象深刻。計(jì)算機(jī)現(xiàn)在可以辨識(shí)圖片和視頻里的東西都是什么,可以將語(yǔ)音轉(zhuǎn)化成為文字,其效率已經(jīng)超過(guò)了人力范疇。Google也將GoogleTranslate服務(wù)中添加了神經(jīng)網(wǎng)絡(luò),現(xiàn)在的機(jī)器學(xué)習(xí)在翻譯水平上已經(jīng)逐步逼近人工翻譯?,F(xiàn)實(shí)中的一些應(yīng)用也讓人大開(kāi)眼界,就比如說(shuō)計(jì)算機(jī)可以預(yù)測(cè)農(nóng)田作物產(chǎn)量,其準(zhǔn)確性比美國(guó)農(nóng)業(yè)部還高。機(jī)器還能更加精準(zhǔn)的診斷癌癥,其準(zhǔn)確度也比從醫(yī)多年的老醫(yī)師還要高。

美國(guó)國(guó)防部高級(jí)研究計(jì)劃局的一名負(fù)責(zé)人John Lauchbury形容如今人工智能領(lǐng)域內(nèi)存在著三股浪潮:

第一股浪潮:知識(shí)庫(kù),或是類似于IBM所開(kāi)發(fā)的“深藍(lán)”和Waston專家系統(tǒng)。

第二股浪潮:數(shù)據(jù)學(xué)習(xí),包括了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。

第三股浪潮:情境適應(yīng),其中涉及通過(guò)利用少量數(shù)據(jù),在現(xiàn)實(shí)生活中構(gòu)建出一個(gè)可靠的,解釋型的模型。

從這三股浪潮中,可以發(fā)現(xiàn)目前深度學(xué)習(xí)算法的研究工作進(jìn)展不錯(cuò)。

但深度學(xué)習(xí)的成果是建立在極其苛刻的前提條件之上。

不管是“監(jiān)督學(xué)習(xí)”,亦或者是“強(qiáng)化學(xué)習(xí)”,它們都需要大量的數(shù)據(jù)進(jìn)行支撐,而且在提前計(jì)劃上面表現(xiàn)的非常差,只能做某些最簡(jiǎn)單直接的模式辨認(rèn)工作。

相比之下,人就能夠從極少數(shù)的例子上學(xué)到有價(jià)值的信息,并且善于在時(shí)間跨度很長(zhǎng)的計(jì)劃,在針對(duì)某個(gè)情境上有能力自己建造一個(gè)抽象模型,并利用這樣的模型來(lái)做站在最高處的歸納總結(jié)。

自動(dòng)駕駛汽車為例,如果你是采用的“監(jiān)督學(xué)習(xí)路徑”,那么你需要從汽車駕駛的情境中提取海量的數(shù)據(jù),而且還要以明確標(biāo)示出來(lái)的“動(dòng)作標(biāo)簽”進(jìn)行分類挑揀,比如“停止”“行駛”等。再接下來(lái),你還需要訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),使得它能夠從眼下的情景和所與之相對(duì)應(yīng)的行動(dòng)之間構(gòu)建因果聯(lián)系。

如果你是采用的“強(qiáng)化學(xué)習(xí)路徑”,那么你應(yīng)該給算法一個(gè)目標(biāo),讓它能夠獨(dú)立地判斷當(dāng)下最優(yōu)解是什么,電腦在不同的情境之下,為了實(shí)現(xiàn)避免撞車的這個(gè)動(dòng)作,它估計(jì)要宕機(jī)上幾千次。雖然現(xiàn)在已經(jīng)有了比較大的進(jìn)展,一些神經(jīng)網(wǎng)絡(luò)可以從數(shù)據(jù)層面,在相當(dāng)大的樣本數(shù)量上給出一個(gè)驚人的成果,但是它們?nèi)绻麊为?dú)拿出一個(gè)出來(lái),還是不可靠的,所犯的錯(cuò)誤也是人一輩子都不可能犯的。

數(shù)據(jù)質(zhì)量的不穩(wěn)定性帶來(lái)的是不可靠、不準(zhǔn)確,以及不公平。同樣,輸出的結(jié)果,還得取決于輸入的數(shù)據(jù)質(zhì)量如何。神經(jīng)網(wǎng)絡(luò)中如果輸入的數(shù)據(jù)是不準(zhǔn)確的,不完整的,那么結(jié)果也會(huì)錯(cuò)的離譜,有些時(shí)候會(huì)造成巨大的損失。不要小看這樣的風(fēng)險(xiǎn),錯(cuò)誤的輸出可能會(huì)造成極大的危害,以GAN為例,有一些不軌之徒可以以一種人類肉眼無(wú)法識(shí)別的方式篡改圖片,讓機(jī)器錯(cuò)誤的辨識(shí)圖片。篡改的圖片和最初的圖片在我們看來(lái)可能是一致的,但是無(wú)人駕駛汽車中,汽車就會(huì)受到威脅。

深度學(xué)習(xí)依然存在瓶頸,但目前它要發(fā)揮的作用所需要的前置條件太過(guò)苛刻,輸入數(shù)據(jù)對(duì)其最終的結(jié)果有著決定性的影響。如果要真正達(dá)到理想中的人工智能,這些瓶頸還有待于人們的進(jìn)一步突破。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)有什么區(qū)別

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。 一、定義 機(jī)器視覺(jué) 機(jī)器視覺(jué),又稱為計(jì)算機(jī)
    的頭像 發(fā)表于 07-16 10:23 ?386次閱讀

    計(jì)算機(jī)視覺(jué)的五大技術(shù)

    計(jì)算機(jī)視覺(jué)作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個(gè)方面,為人工智能的發(fā)展開(kāi)拓了廣闊的道路。以下是對(duì)計(jì)算機(jī)
    的頭像 發(fā)表于 07-10 18:26 ?1065次閱讀

    計(jì)算機(jī)視覺(jué)的工作原理和應(yīng)用

    計(jì)算機(jī)視覺(jué)(Computer Vision,簡(jiǎn)稱CV)是一門跨學(xué)科的研究領(lǐng)域,它利用計(jì)算機(jī)和數(shù)學(xué)算法來(lái)模擬人類視覺(jué)系統(tǒng)對(duì)圖像和視頻進(jìn)行識(shí)別、理解、分析和處理。其核心目標(biāo)在于使
    的頭像 發(fā)表于 07-10 18:24 ?1357次閱讀

    計(jì)算機(jī)視覺(jué)與人工智能的關(guān)系是什么

    引言 計(jì)算機(jī)視覺(jué)是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺(jué)信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的知識(shí)。人工智能則是研究如
    的頭像 發(fā)表于 07-09 09:25 ?431次閱讀

    計(jì)算機(jī)視覺(jué)與智能感知是干嘛的

    引言 計(jì)算機(jī)視覺(jué)(Computer Vision)是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺(jué)信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-09 09:23 ?570次閱讀

    計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)區(qū)別在哪

    計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計(jì)算機(jī)視覺(jué) 計(jì)算機(jī)
    的頭像 發(fā)表于 07-09 09:22 ?350次閱讀

    計(jì)算機(jī)視覺(jué)屬于人工智能嗎

    屬于,計(jì)算機(jī)視覺(jué)是人工智能領(lǐng)域的一個(gè)重要分支。 引言 計(jì)算機(jī)視覺(jué)是一門研究如何使計(jì)算機(jī)具有視覺(jué)
    的頭像 發(fā)表于 07-09 09:11 ?926次閱讀

    深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其中的核心技術(shù)之一,已經(jīng)在計(jì)算機(jī)視覺(jué)領(lǐng)域取得了顯著的成果。計(jì)算機(jī)
    的頭像 發(fā)表于 07-01 11:38 ?550次閱讀

    計(jì)算機(jī)視覺(jué)的主要研究方向

    計(jì)算機(jī)視覺(jué)(Computer Vision, CV)作為人工智能領(lǐng)域的一個(gè)重要分支,致力于使計(jì)算機(jī)能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度
    的頭像 發(fā)表于 06-06 17:17 ?668次閱讀

    計(jì)算機(jī)視覺(jué)的十大算法

    隨著科技的不斷發(fā)展,計(jì)算機(jī)視覺(jué)領(lǐng)域也取得了長(zhǎng)足的進(jìn)步。本文將介紹計(jì)算機(jī)視覺(jué)領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場(chǎng)景和優(yōu)缺點(diǎn)。這些算法在圖像處理、目標(biāo)檢測(cè)、人臉識(shí)別等領(lǐng)域有著廣泛的應(yīng)
    的頭像 發(fā)表于 02-19 13:26 ?1140次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的十大算法

    量子計(jì)算機(jī) 未來(lái)希望

    自己從事語(yǔ)音識(shí)別產(chǎn)品設(shè)計(jì)開(kāi)發(fā),而量子技術(shù)和量子計(jì)算機(jī)必將在自然語(yǔ)言處理方面實(shí)現(xiàn)重大突破,想通過(guò)此書(shū)學(xué)習(xí)量子計(jì)算技術(shù),儲(chǔ)備知識(shí),謝謝!
    發(fā)表于 02-01 12:51

    計(jì)算機(jī)視覺(jué)中的立體視覺(jué)深度感知Python示例實(shí)現(xiàn)

    在人工智能和圖像處理的迷人世界中,這些概念在使機(jī)器能夠像我們的眼睛一樣感知我們周圍的三維世界中起著關(guān)鍵作用。和我們一起探索立體視覺(jué)深度感知背后的技術(shù),揭示計(jì)算機(jī)如何從二維圖像中獲得深度
    的頭像 發(fā)表于 11-21 10:50 ?559次閱讀

    什么是計(jì)算機(jī)視覺(jué)?計(jì)算機(jī)視覺(jué)的三種方法

    計(jì)算機(jī)視覺(jué)是指通過(guò)為計(jì)算機(jī)賦予人類視覺(jué)這一技術(shù)目標(biāo),從而賦能裝配線檢查到駕駛輔助和機(jī)器人等應(yīng)用。計(jì)算機(jī)缺乏像人類一樣憑直覺(jué)產(chǎn)生
    的頭像 發(fā)表于 11-16 16:38 ?4317次閱讀
    什么是<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>?<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的三種方法

    最適合AI應(yīng)用的計(jì)算機(jī)視覺(jué)類型是什么?

    計(jì)算機(jī)視覺(jué)是指為計(jì)算機(jī)賦予人類視覺(jué)這一技術(shù)目標(biāo),從而賦能裝配線檢查到駕駛輔助和機(jī)器人等應(yīng)用。計(jì)算機(jī)缺乏像人類一樣憑直覺(jué)產(chǎn)生
    的頭像 發(fā)表于 11-15 16:38 ?391次閱讀
    最適合AI應(yīng)用的<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>類型是什么?

    用于計(jì)算機(jī)視覺(jué)的經(jīng)典機(jī)器學(xué)習(xí)應(yīng)用分析

    深度學(xué)習(xí)是指在大部分未處理或“原始”數(shù)據(jù)上運(yùn)行的非常大的神經(jīng)網(wǎng)絡(luò)模型。深度學(xué)習(xí)通過(guò)將特征提取操作拉入模型本身,對(duì)計(jì)算機(jī)
    發(fā)表于 11-07 10:11 ?380次閱讀
    用于<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的經(jīng)典機(jī)器<b class='flag-5'>學(xué)習(xí)</b>應(yīng)用分析