在過去幾十年中,深度學(xué)習(xí)作為人工智能領(lǐng)域的頭號(hào)種子選手,成為了激動(dòng)人心的科技創(chuàng)新。在諸如語音識(shí)別、癌癥檢測(cè)等對(duì)于傳統(tǒng)軟件模型難以解決的領(lǐng)域中,深度學(xué)習(xí)已經(jīng)初露鋒芒。
深度學(xué)習(xí)的原理經(jīng)常被用來與人類學(xué)習(xí)的過程相類比,專家們相信深度學(xué)習(xí)過程將會(huì)更快,更深入的延伸至更多的領(lǐng)域中。在某些情況下,人們會(huì)擔(dān)心深度學(xué)習(xí)會(huì)威脅人類在社會(huì)和經(jīng)濟(jì)生活中的關(guān)鍵地位,造成諸如失業(yè)甚至是人類被機(jī)器奴役的后果。
毫無疑問,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)對(duì)某些任務(wù)而言是十分有效的,然而它并不是可以解決所有問題、凌駕于所有科技之上的萬能鑰匙。事實(shí)上,相比于過度炒作夸大的概念,仍有許多的制約和挑戰(zhàn)使得該技術(shù)在某些方面仍不足以和人類,甚至無法達(dá)到人類孩童的能力。
讓我們回憶兒時(shí)的童年經(jīng)歷:第一次接觸超級(jí)瑪麗時(shí)只玩了幾個(gè)小時(shí)便初步形成了粗淺的關(guān)于平臺(tái)游戲(platform game)的概念。下次玩到類似的游戲(諸如prince of persia, sonic hedgehog, crash bandicoot 或是donkye kong country)時(shí),便可以將之前在超級(jí)瑪麗游戲中的實(shí)戰(zhàn)經(jīng)驗(yàn)應(yīng)用于它們。如果之后它們升級(jí)成了3d版本(正如90年代中期出現(xiàn)的),也可以毫不費(fèi)力的上手。同時(shí),也可以輕而易舉的將現(xiàn)實(shí)生活中的經(jīng)驗(yàn)應(yīng)用于游戲之中,遇到深坑時(shí)我馬上知道要操作馬里奧跳過它,遇到有刺的植物時(shí),我馬上知道要避開。
我們算不上優(yōu)秀的游戲玩家,但對(duì)于深度學(xué)習(xí)算法而言,完成上述過程卻充滿了挑戰(zhàn),即使是最聰明的游戲算法也要從零開始學(xué)起。
人類可以通過抽象、類比、演繹,對(duì)不同的概念進(jìn)行借鑒和學(xué)習(xí),達(dá)到舉一反三的效果。深度學(xué)習(xí)的算法卻無法做到如此,它需要大量精準(zhǔn)的訓(xùn)練來實(shí)現(xiàn)。
在最近的一篇題為“深度學(xué)習(xí)的客觀評(píng)價(jià)”一文中,前Uber人工智能領(lǐng)導(dǎo),紐約大學(xué)教授Gray Marcus講述了深度學(xué)習(xí)遇到的限制與挑戰(zhàn),他從深度學(xué)習(xí)的原理和基礎(chǔ)出發(fā)闡述了深度學(xué)習(xí)的局限性,但也對(duì)未來面對(duì)的挑戰(zhàn)表達(dá)了殷切的期許。
深度學(xué)習(xí)的原理
通過對(duì)人腦處理信息時(shí)所采用方法的抽象總結(jié)和模擬,提出了神經(jīng)網(wǎng)絡(luò)的概念。未經(jīng)處理的數(shù)據(jù)(圖像,聲音信息或者文字信息)被輸入至輸出層的“輸入單元”;輸入信息經(jīng)過一定的映射輸出至輸出層的“輸出節(jié)點(diǎn)”。映射的方法根據(jù)用戶定義,比如說,輸入的圖畫中有貓咪,輸入的聲音片段中有“hello”。深度學(xué)習(xí)是一種通過多層神經(jīng)網(wǎng)絡(luò)對(duì)信息進(jìn)行抽取和表示,并實(shí)現(xiàn)分類、檢測(cè)等復(fù)雜任務(wù)的算法架構(gòu)。深度神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)算法的核心組成部分,在輸入與輸出層之間包含有多層隱藏層,使得算法可以完成復(fù)雜的分類關(guān)系。
圖:深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
深度學(xué)習(xí)算法需要大量的數(shù)據(jù)做訓(xùn)練,比如說如果你想從圖片中準(zhǔn)確的識(shí)別出是否包含“貓咪”,那么你需要事先用成千上萬張圖片來訓(xùn)練它。訓(xùn)練的數(shù)據(jù)量越大,模型的準(zhǔn)確性越高。大公司之間正在不惜一切代價(jià)的爭奪數(shù)據(jù),甚至愿意免費(fèi)提供服務(wù)以換取數(shù)據(jù)。擁有越多的數(shù)據(jù),就擁有越高的算法準(zhǔn)確性和越有效的服務(wù),并將吸引更多的用戶,從而在競爭中形成良性循環(huán)。
深度學(xué)習(xí)需要大量的數(shù)據(jù)燃料
如果在一個(gè)擁有無限數(shù)據(jù)和計(jì)算資源的世界中,除了機(jī)器學(xué)習(xí)之外的其他技術(shù)便沒有存在的必要性。但顯而易見的是現(xiàn)實(shí)世界并非如此。機(jī)器學(xué)習(xí)算法永遠(yuǎn)不可能是全面的,必須要通過插補(bǔ)或推演來對(duì)它從未聽到過的聲音或看到過的圖像來給出可能的答案。
對(duì)于深度學(xué)習(xí)算法來說,缺乏“下定義”的過程,既:從特殊到一般的提煉過程,好的效果必須依托于成千上萬甚至更多的訓(xùn)練樣本之上。
那么如果不能進(jìn)行大量有效的訓(xùn)練,會(huì)發(fā)生什么?答案是:令人瞠目結(jié)舌的錯(cuò)誤!錯(cuò)誤的算法可能無法分清楚來福搶和直升飛機(jī),大猩猩和人類。
深度學(xué)習(xí)錯(cuò)誤識(shí)別的例子
對(duì)于數(shù)據(jù)的過度依賴也帶來了使用安全性上的問題。Marcus說過:“深度學(xué)習(xí)非常善于對(duì)特定領(lǐng)域的絕大多數(shù)現(xiàn)象作出判斷,另一方面它也會(huì)被愚弄?!?這便涉及到對(duì)抗樣本對(duì)于深度學(xué)習(xí)算法的攻擊。通過對(duì)交通標(biāo)志很小的涂改,深度學(xué)習(xí)算法就會(huì)誤判停止與限速的交通標(biāo)記,還有可能無法區(qū)分沙堆與肉色針織物。
深度學(xué)習(xí)并不深刻
深度學(xué)習(xí)善于建立輸入與輸出之間的映射關(guān)系,卻不善于總結(jié)發(fā)現(xiàn)其中的內(nèi)在物理聯(lián)系。事實(shí)上,“深度”這個(gè)概念,只是對(duì)于多層隱藏層的架構(gòu)而言,并非指該算法對(duì)事物本身的理解有多么深入。Marcus認(rèn)為:“通過此種算法建構(gòu)的系統(tǒng),并不能總結(jié)并抽象理解諸如正義,民主,干預(yù)之類的概念”。
返回到一開始文章中提到的游戲案例,通過大量的訓(xùn)練,深度學(xué)習(xí)算法可以打敗最好的人類超級(jí)瑪麗玩家,然而這并不代表人工智能對(duì)于游戲有著和人一樣的領(lǐng)悟能力,當(dāng)一個(gè)棒球砸向馬里奧時(shí),游戲玩家都知道通過跳起來躲避,而人工智能只懂得傻傻往前跑,直到被棒球砸中后背。通過反復(fù)的試錯(cuò)實(shí)驗(yàn),它能夠保證最后的勝率,但是稍微升級(jí)以下游戲或改變版本,人工智能卻必須從頭學(xué)起。
Marcus的文章中提到谷歌深度學(xué)習(xí)中的應(yīng)用案例:在mastering of atari game breakout中,在游戲進(jìn)行240分鐘后,贏得游戲勝利的最佳方法是在墻上打隧道。然而,它并不明白墻,或者隧道是什么。它只是通過反復(fù)的試錯(cuò)實(shí)驗(yàn)直到,這樣做可以在最短的時(shí)間內(nèi)獲得最高的分?jǐn)?shù)。
深度學(xué)習(xí)是算法黑箱
依據(jù)規(guī)則而寫的程序給出的執(zhí)行結(jié)果,可以被追述到最后一個(gè)if else。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的算法卻不能。這種不透明的性質(zhì)被定義為“黑箱”問題。深度學(xué)習(xí)算法在幾千個(gè)節(jié)點(diǎn)之間建立映射,并給出輸入與輸出之間的關(guān)系。即使是開發(fā)出此算法的親生工程師也常常會(huì)對(duì)結(jié)果困惑不解。當(dāng)深度學(xué)習(xí)應(yīng)用于容錯(cuò)率較高的系統(tǒng)時(shí),這個(gè)缺點(diǎn)看起來似乎無關(guān)緊要。但是想象一下,如果是應(yīng)用于法庭判決嫌疑人的命運(yùn),或者醫(yī)療中決定對(duì)患者的處理之類的領(lǐng)域之中,任何微小的錯(cuò)誤都會(huì)導(dǎo)致不可逆轉(zhuǎn)的致命結(jié)果。
Marcus認(rèn)為:”深度學(xué)習(xí)算法中的透明性問題至今無解,并且嚴(yán)重阻礙了它向金融交易、醫(yī)療診斷等人們看重并希望了解緣由的領(lǐng)域發(fā)展?!?/p>
基于對(duì)大量數(shù)據(jù)訓(xùn)練而得出的結(jié)果,使深度學(xué)習(xí)的方法常常表現(xiàn)出某些偏見,比如:男人比女人的收入更高,白人比黑人更具有外貌優(yōu)勢(shì)。這種錯(cuò)誤在程序的調(diào)試階段很難發(fā)現(xiàn),卻常常會(huì)由于其給出的結(jié)果,引起社會(huì)輿論的廣泛關(guān)注和討論。
深度學(xué)習(xí)注定會(huì)失敗嗎?
當(dāng)然不是!但是需要現(xiàn)實(shí)檢驗(yàn)。
Marcus認(rèn)為:“深度學(xué)習(xí)可以作為簡化復(fù)雜問題,基于較大的數(shù)據(jù)量,建立輸入與輸出之間映射關(guān)系的完美途徑“。通過合理選擇訓(xùn)的方法和足夠的訓(xùn)練樣本,深度學(xué)習(xí)可以作為一種高效的分類數(shù)據(jù)的手段。但是它并不擁有魔術(shù)般的力量,要認(rèn)識(shí)清楚它的應(yīng)用局限性和有效性。Marcus 還認(rèn)為,深度學(xué)習(xí)還需要和其他的技術(shù)結(jié)合發(fā)展,比如說普通基于規(guī)則的編程或者其他的人工智能技術(shù),比如強(qiáng)化學(xué)習(xí)。Starmind's Pascal Kaufmann 則認(rèn)為,通過神經(jīng)科學(xué),從而實(shí)現(xiàn)人工智能能夠像人類一樣學(xué)習(xí),也許也是行之有效的手段。
最后以Marcus的話來結(jié)束全文,并引出對(duì)深度學(xué)習(xí)何去何從的思考:“深度學(xué)習(xí)不會(huì)也不應(yīng)該消失,但是以五年為期來檢驗(yàn)深度學(xué)習(xí)的能與不能,并讓社會(huì)各界清醒地接受和認(rèn)識(shí)它的能力與局限性,無論對(duì)于技術(shù)本身還是社會(huì)的發(fā)展都具有重要的意義!”
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4730瀏覽量
100353 -
人工智能
+關(guān)注
關(guān)注
1789文章
46438瀏覽量
236681 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5449瀏覽量
120815
原文標(biāo)題:深度學(xué)習(xí)鋒芒背后的“能”與“不能”
文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論