0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

商湯科技徐立講述:AI到底是什么?

DPVg_AI_era ? 來源:未知 ? 作者:伍文輝 ? 2018-03-29 11:06 ? 次閱讀

主講老師和特邀講者:清華大學(xué)海峽研究院大數(shù)據(jù) AI 中心專家委員雷鳴,商湯科技聯(lián)合創(chuàng)始人、CEO徐立,清華大學(xué)自動(dòng)化系教授季向陽,軟銀賽富投資基金資深合伙人羊東

2018 年 3 月 29 日,北京舉辦的 2018 年中國 AI 開年盛典——新智元產(chǎn)業(yè) · 躍遷 AI 技術(shù)峰會(huì),邀微軟全球技術(shù)院士、微軟語音、自然語言和機(jī)器翻譯團(tuán)隊(duì)負(fù)責(zé)人黃學(xué)東博士和微軟全球杰出工程師張祺博士,解析語音和機(jī)器翻譯最新突破和人機(jī)交互未來趨勢(shì),闡釋微軟 “行業(yè) + AI” 在中國落地的戰(zhàn)略布局!想近距離交流互動(dòng)?

3月22日,清華大學(xué)《人工智能前沿與產(chǎn)業(yè)趨勢(shì)》系列課程第二講開課,本講聚焦當(dāng)前AI領(lǐng)域最火、落地應(yīng)用最成功的計(jì)算機(jī)視覺,由商湯科技CEO徐立主講。徐立博士結(jié)合計(jì)算機(jī)視覺和人臉識(shí)別的具體應(yīng)用,對(duì)AI的發(fā)展階段進(jìn)行了回顧,并對(duì)計(jì)算機(jī)視覺的技術(shù)突破和行業(yè)需求作了一番深入的探討。

這張圖大家可能在很多地方看過類似的,不過行業(yè)的發(fā)展并不是拿這樣一張簡(jiǎn)單的圖就能把它的起起伏伏講清楚。計(jì)算機(jī)視覺是人工智能的一個(gè)分支,但計(jì)算機(jī)視覺本身也有很多分支,每個(gè)分支的發(fā)展都是不一樣的。

從圖中我們可以很清楚地看到每一個(gè)高潮是在什么地方,第一個(gè)高潮出現(xiàn)在1957年,第一個(gè)神經(jīng)網(wǎng)絡(luò)的發(fā)明;到1986年,BP算法實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)的突破,人工智能進(jìn)入第二個(gè)高潮;再到現(xiàn)在,深度學(xué)習(xí)是高潮。

每個(gè)分支的高潮低谷又是不一樣的。計(jì)算機(jī)視覺在90年的時(shí)候處于低谷,那時(shí)候“模糊邏輯”大行其道。比如說有一個(gè)“電梯模糊”,你站在五樓按下電梯,電梯上到五樓卻沒有停,它繼續(xù)往上走。它的解釋是,它發(fā)現(xiàn)上面還有一個(gè)人在按電梯,它經(jīng)過計(jì)算發(fā)現(xiàn)先去載上面的乘客,再下來載你,這樣節(jié)能的效率更好。但是呢,這樣特別不人性化。所以呢,后來模糊邏輯就不行了,后來就不用了。

所以在每個(gè)時(shí)間點(diǎn)人工智能都有自己的發(fā)展方向,但總體上是螺旋形。

那么人工智能是什么呢?徐立博士給出的定義是,人工智能是一種超越人的生產(chǎn)力工具。這一波AI的革命性是由于突然之間,人們發(fā)現(xiàn)技術(shù)能夠在工業(yè)的某條紅線上產(chǎn)生突破,形成了非常強(qiáng)大的生產(chǎn)力工具。所以它其實(shí)是一個(gè)artificial labor的問題。

那么既然是生產(chǎn)力工具,讓我們來看一些數(shù)據(jù):

到2035年,人工智能有望推動(dòng)世界勞動(dòng)生產(chǎn)率提高40%以上。

這包括大部分沒有被人工智能影響的企業(yè)、國家和地區(qū)。所以那些頭部的企業(yè)基本上就是勞動(dòng)力被取代的模式,兩個(gè)人被一個(gè)人干掉。所以我認(rèn)為未來十年一個(gè)最大的問題是做人機(jī)融合,就是怎樣利用這些人。我們現(xiàn)在看到AI在某些產(chǎn)業(yè)已經(jīng)代替了人類的勞動(dòng)和工作,那么人類所需要做的是怎樣駕馭機(jī)器,怎樣實(shí)現(xiàn)更好的生產(chǎn)率。至于機(jī)器有沒有情感,在什么階段能把人全部取代,這不是我們這幫人研究的問題。

另一個(gè)數(shù)據(jù):

到2030年,人工智能將促使全球生產(chǎn)總值增長(zhǎng)14%,為世界經(jīng)濟(jì)貢獻(xiàn)15.7萬億美元的新增產(chǎn)值。

這相當(dāng)于現(xiàn)在中國和印度生產(chǎn)總值的總和,即是說,用十年的時(shí)間就能新造出一個(gè)中國和印度。那么這些新增產(chǎn)值從哪來的呢?還是來自于效率機(jī)器。所以未來在很多垂直行業(yè),AI將代替更多的人類。

人工智能發(fā)展的路徑:從技不如人到超越大眾、超越專家

徐立提出,AI作為一種生產(chǎn)力工具,可以分為三個(gè)階段:

第一階段:技不如人的階段。

10年前我也干這個(gè)行業(yè),2006年的時(shí)候我發(fā)表了第一篇人臉識(shí)別的論文。那時(shí)候我也做同樣的事情,但是為什么沒有發(fā)展的空間呢?十幾年前AI在安防領(lǐng)域、在電梯閘機(jī)等場(chǎng)景的應(yīng)用都很廣泛,但是沒有現(xiàn)在這樣熱起來,很關(guān)鍵的一點(diǎn)就是那時(shí)候人臉識(shí)別根本就沒有工業(yè)應(yīng)用的條件。當(dāng)時(shí)有一個(gè)閘機(jī)卡扣用人臉識(shí)別,用的海外的產(chǎn)品,準(zhǔn)確率是53%。這什么概念呢?就是說系統(tǒng)可以告訴你這是什么人,不是什么人,但是你隨便猜的概率是50%,用人臉識(shí)別技術(shù)的準(zhǔn)確率是53%。這就是很尷尬的產(chǎn)品。

所以說不是這個(gè)技術(shù)沒有革命性的貢獻(xiàn),它是有的,最關(guān)鍵的是它要過了工業(yè)的紅線,才能達(dá)到工業(yè)應(yīng)用的條件。

工業(yè)的紅線的定義就是人的準(zhǔn)確率。就算當(dāng)時(shí)有人臉識(shí)別算法,跑了一遍之后還是需要人來看,因?yàn)樗臏?zhǔn)確率沒有人高。所以這算是人工指導(dǎo)的智能。需要用人的先驗(yàn)知識(shí),進(jìn)行人工指導(dǎo)的智能,一般不能超越人。

第二階段:超越大眾。

就是說算法要超越普通人的準(zhǔn)確率。從這個(gè)角度講,人臉識(shí)別最先的應(yīng)用就是替代大眾。比如安防攝像頭,每天2000小時(shí)的視頻需要人來看,那么機(jī)器看的準(zhǔn)確率高過普通人的時(shí)候,就可以找機(jī)器來看。這是非常大的需求。

再一個(gè)例子是金融。比如說上海有一家互聯(lián)網(wǎng)金融公司,創(chuàng)辦三個(gè)月已有3000名員工,我一問都震驚了,我說這發(fā)展太快了吧。他說不是,因?yàn)樾枰蟼鞲鞣N證件,需要很多人來驗(yàn)證這些證件。但是到現(xiàn)在,基本上已經(jīng)不需要人來做這些事情,所有這些驗(yàn)證都是機(jī)器來做。原因就是人臉識(shí)別已經(jīng)過了那條工業(yè)紅線,機(jī)器做的已經(jīng)能夠比普通人做得好,那么干嘛還浪費(fèi)人力來做呢?

為什么強(qiáng)調(diào)是超越大眾(普通人)呢?因?yàn)楝F(xiàn)在還是所謂大數(shù)據(jù)驅(qū)動(dòng)的模式。以前是人工指導(dǎo)的智能,現(xiàn)在能夠處理大量數(shù)據(jù)之后,成為純數(shù)據(jù)驅(qū)動(dòng)的智能,這樣帶來了超越大眾的可能性。

人的知識(shí)可以通過數(shù)據(jù)標(biāo)注教給電腦。那么什么樣的數(shù)據(jù)最容易獲得呢?就是普羅大眾都會(huì)的事情。他們具備普通的知識(shí),他們的知識(shí)可以通過數(shù)據(jù)標(biāo)注傳達(dá)給電腦,只要有了這些標(biāo)注的結(jié)果,你就可以教計(jì)算機(jī)學(xué)會(huì)。

第三階段:超越專家。

這個(gè)階段我們很多情況下都沒有達(dá)到。專家的知識(shí)很多情況下很難通過數(shù)據(jù)標(biāo)注教給電腦。比如說金融交易,雖然很多交易都自動(dòng)化了,但一些頭部的交易員還在,因?yàn)樗麄冇刑厥獾闹R(shí),特殊的信息或者技能。

但AlphaGo是個(gè)特例。AlphaGo早期還處于中間這個(gè)階段,就是超越大眾。因?yàn)樗怯萌祟惖?0萬棋譜來訓(xùn)練的。后來它就脫離了棋譜,它在某種決策問題上,決策空間確定的情況下已經(jīng)可以做到超越專家。

這就是人工智能發(fā)展的三個(gè)階段,第二個(gè)階段只是實(shí)現(xiàn)artificial labor,第三個(gè)階段才能做到服務(wù)升級(jí)?,F(xiàn)在大部分情況下我們還處于第一階段和第二階段之間。

中國AI實(shí)力全球領(lǐng)先,商湯創(chuàng)中國首個(gè)深度學(xué)習(xí)框架

有幾個(gè)數(shù)據(jù)能夠反映中國在人工智能領(lǐng)域的實(shí)力是全球領(lǐng)先的。

2016年時(shí)中國的人工智能專利的數(shù)量增長(zhǎng)了70%,雖然總數(shù)量還是美國領(lǐng)先。另外在泛AI的學(xué)術(shù)頂會(huì)AAAI上,中國發(fā)表的論文數(shù)量占據(jù)31%;具體在視覺這個(gè)垂直領(lǐng)域,CVPR論文的中國作者占據(jù)40%,這也跟我們的認(rèn)知是吻合的,不知道為什么干視覺的都是中國人。

最后一個(gè)數(shù)據(jù)是商湯的,商湯創(chuàng)立三年來在CVPR發(fā)表的論文達(dá)到119篇,這是去年的數(shù)據(jù)。現(xiàn)在已經(jīng)遠(yuǎn)超了,因?yàn)榻衲闏VPR我們有44篇入選。

所以說中國在計(jì)算機(jī)視覺這個(gè)垂直領(lǐng)域做得是不錯(cuò)的,而且熱度很高。

下面這張是谷歌搜索Deep Learning的熱度圖,熱度越高顏色越深,可以看到深度學(xué)習(xí)在中國是很熱的。

說到深度學(xué)習(xí),大家知道谷歌有TensorFlow,F(xiàn)acebook有Torch,伯克利呢有Caffe。所以商湯開發(fā)了自己的深度學(xué)習(xí)原創(chuàng)平臺(tái),叫Parrots。有了這個(gè)平臺(tái)我們可以處理的東西就很多,當(dāng)時(shí)在ImageNet,我們做了超過1000層的深度神經(jīng)網(wǎng)絡(luò)。我們有三大要素保障這個(gè)平臺(tái)的優(yōu)異性能,除了剛才說的超深網(wǎng)絡(luò),還有超大數(shù)據(jù)學(xué)習(xí),我們有20億人臉數(shù)據(jù)同時(shí)訓(xùn)練;此外還有復(fù)雜關(guān)聯(lián)應(yīng)用的多模態(tài)數(shù)據(jù)學(xué)習(xí)。

深度學(xué)習(xí),學(xué)習(xí)的是對(duì)事物的刻畫。普通的機(jī)器學(xué)習(xí)依賴專家知識(shí),深度學(xué)習(xí)提供另外的可能性,學(xué)的是一種全局表達(dá)。這樣的學(xué)習(xí)可以帶來很強(qiáng)的對(duì)事情的描述。

計(jì)算機(jī)視覺的技術(shù)突破和行業(yè)需求:浸透衣食住行方方面面

計(jì)算機(jī)視覺的技術(shù)突破之一是“生成”。比如這張PPT中,我們給出一段文字描述“這只小鳥有白色的胸部,淺灰色的頭部,和黑色的翅膀和尾巴”,計(jì)算機(jī)可以生成這只鳥。“無中生有”,這非常厲害。

這很有意思,可以帶來很多想象力。技術(shù)突破是說每次都可以超越你的想象,達(dá)到更高的水平。

那么行業(yè)需求是什么呢?衣食住行,人們生活的每一個(gè)方面都受到計(jì)算機(jī)視覺技術(shù)的廣泛的影響。

舉一些簡(jiǎn)單的例子:

衣:用文字可以生成你想要的衣服,只需要一張照片,每天可以隨時(shí)換衣服。這些都是生成的結(jié)果。

食:吃飯當(dāng)中也有各種各樣可以利用計(jì)算機(jī)視覺的場(chǎng)景。比如說可以識(shí)別食物,計(jì)算食物的卡路里。

住:比如說人臉識(shí)別的閘機(jī),這個(gè)已經(jīng)非常普遍了。另外一個(gè)很大的應(yīng)用場(chǎng)景時(shí)無人商店。

行:很容易想到的就算自動(dòng)駕駛??赡苡腥苏f這還遙遙無期,但是在特定的情況下,慢速的自動(dòng)駕駛很多已經(jīng)可以應(yīng)用起來。

視覺計(jì)算:成像、感知、識(shí)別、理解

成像、感知、識(shí)別、理解,這整一套就是視覺。那怎樣是又看又理解呢?我們剛才說過技術(shù)紅線,就是要超過人,就計(jì)算機(jī)視覺來說,技術(shù)紅線就是看清和理解都需要超過人的水平。

在“看清”這一點(diǎn),機(jī)器很多情況下已經(jīng)遠(yuǎn)遠(yuǎn)超過人。比如上面這張畫是一張明信片,畫的是一個(gè)城市,上面有這個(gè)城市的名稱。機(jī)器可以看出來:

機(jī)器能夠從單張照片里面抓取很多信息,這很厲害。

機(jī)器在藝術(shù)創(chuàng)作方面也能做得很好。上面這張圖,左邊是人創(chuàng)作的,右邊是機(jī)器創(chuàng)作的,可以說機(jī)器畫的并不比人差。

機(jī)器也能夠?qū)σ曨l進(jìn)行藝術(shù)加工,例如視頻的風(fēng)格化。

人臉識(shí)別應(yīng)用場(chǎng)景案例:模糊——增強(qiáng)

怎么在非常模糊的情況下如何識(shí)別?比如說上面這張圖,你們覺得像誰?

這對(duì)公安來說非常重要。

人臉識(shí)別技術(shù)在這方面非常厲害,它能把左邊這張模糊的圖增強(qiáng)。

不光是抓人,增強(qiáng)技術(shù)的應(yīng)用非常廣泛。比如說日本有一個(gè)網(wǎng)站叫Waifu2x,可以利用圖像增強(qiáng)技術(shù)修復(fù)漫畫。

在深圳我們已經(jīng)大規(guī)模部署人臉識(shí)別技術(shù)。再舉一個(gè)在實(shí)操中的應(yīng)用的例子:我們將歷年在展館有案底的嫌疑人照片導(dǎo)入布控目標(biāo)庫,建立布控任務(wù),系統(tǒng)自動(dòng)化比對(duì)出在逃的嫌疑人,在深圳文博會(huì)期間成功抓獲了25人。

對(duì)話環(huán)節(jié)

清華大學(xué)海峽研究院大數(shù)據(jù) AI 中心專家委員雷鳴,商湯科技聯(lián)合創(chuàng)始人、CEO徐立,清華大學(xué)自動(dòng)化系教授季向陽,軟銀賽富投資基金資深合伙人羊東就計(jì)算機(jī)視覺未來的突破點(diǎn)、商湯將技術(shù)成功落地的經(jīng)驗(yàn)、投資的經(jīng)驗(yàn)、創(chuàng)業(yè)的建議等問題進(jìn)行了對(duì)話。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29383

    瀏覽量

    267670
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5437

    瀏覽量

    120791

原文標(biāo)題:商湯科技徐立:AI 將在10 年內(nèi)創(chuàng)造一個(gè)印度和中國的總產(chǎn)值

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    商湯科技亮相第八屆中國品牌日活動(dòng)

    商湯科技董事長(zhǎng)兼CEO受邀出席中國品牌發(fā)展大會(huì)圓桌對(duì)話,闡述多條關(guān)于中國科技創(chuàng)新品牌建設(shè)和品牌價(jià)值積累的深刻見解和實(shí)踐經(jīng)驗(yàn),商湯君這里稍作整理分享給大家。
    的頭像 發(fā)表于 09-26 10:22 ?378次閱讀

    商湯科技大模型產(chǎn)業(yè)化路徑的實(shí)踐經(jīng)驗(yàn)

    AI 2.0時(shí)代,垂直領(lǐng)域的數(shù)據(jù)會(huì)成為重要的生產(chǎn)資料,并帶來新的生產(chǎn)力突破?!?商湯科技董事長(zhǎng)兼CEO在“人工智能與數(shù)據(jù)要素產(chǎn)業(yè)生態(tài)大會(huì)”上說。
    的頭像 發(fā)表于 09-26 10:11 ?337次閱讀

    功放和運(yùn)放到底是什么區(qū)別?

    想請(qǐng)問一下功放和運(yùn)放到底是什么區(qū)別,感覺只要接一個(gè)小負(fù)載,運(yùn)放的輸出電流也可以很大?。?b class='flag-5'>到底有什么區(qū)別啊
    發(fā)表于 09-10 07:00

    運(yùn)放的輸入電容到底是什么?

    我想請(qǐng)問一下運(yùn)放的輸入電容到底是什么?
    發(fā)表于 09-04 06:52

    商湯如影AI視頻生成平臺(tái)數(shù)字人AI亮相央視舞臺(tái)

    ”業(yè)務(wù)嫻熟、表達(dá)自然。依托商湯日日新大模型技術(shù)能力,“AI 冰冰”在舞臺(tái)上靈活化身為多語種主持人,無縫開啟土耳其語、俄語和西班牙語等外語的隱藏能力,驚艷全場(chǎng)。 商湯科技董事長(zhǎng)兼CEO
    的頭像 發(fā)表于 06-30 17:29 ?2255次閱讀

    商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對(duì)標(biāo)GPT-4 Turbo

    商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對(duì)標(biāo)GPT-4 Turbo 4月23日,商湯科技董事長(zhǎng)兼CEO在2024商湯技術(shù)交流日上發(fā)布
    的頭像 發(fā)表于 04-24 16:49 ?1016次閱讀

    共享單車到底是什么通信原理

    我們經(jīng)常騎的共享單車到底是什么通信原理,有人了解過嗎? 一、智能車鎖 共享單車最核心的硬件是智能車鎖,主要用于實(shí)現(xiàn)控制和定位功能。
    發(fā)表于 04-09 10:33 ?736次閱讀
    共享單車<b class='flag-5'>到底是</b>什么通信原理

    商湯科技:AI 2.0時(shí)代的“新質(zhì)生產(chǎn)力工具”

    2024年全球開發(fā)者先鋒大會(huì)(GDC)在上海盛大開幕,匯聚了全球頂尖的開發(fā)者與科技創(chuàng)新者。商湯科技董事長(zhǎng)兼CEO受邀出席,并發(fā)表了題為《AI 2.0時(shí)代的“新質(zhì)生產(chǎn)力工具”》的主旨
    的頭像 發(fā)表于 03-25 09:28 ?560次閱讀

    共享單車到底是什么通信原理?

    我們經(jīng)常騎的共享單車到底是什么通信原理,有人了解過嗎?下面寶藍(lán)小編就帶大家了解下。
    的頭像 發(fā)表于 02-25 10:32 ?1268次閱讀
    共享單車<b class='flag-5'>到底是</b>什么通信原理?

    邊緣AI到底是什么?能做什么?

    邊緣AI到底是什么?能做什么? 邊緣人工智能是一種新興的人工智能技術(shù),它將人工智能的計(jì)算和決策能力移動(dòng)到離數(shù)據(jù)生成源和終端設(shè)備更近的邊緣節(jié)點(diǎn)上。與傳統(tǒng)的云計(jì)算方式相比,邊緣AI將計(jì)算和決策推向網(wǎng)絡(luò)
    的頭像 發(fā)表于 01-11 14:44 ?1168次閱讀

    商湯科技與上海聯(lián)通達(dá)成戰(zhàn)略合作

    11月28日,商湯科技與上海聯(lián)通簽署戰(zhàn)略合作框架協(xié)議,共同打造世界級(jí)人工智能產(chǎn)業(yè)集群。 商湯科技董事長(zhǎng)兼CEO商湯科技聯(lián)合創(chuàng)始人、大裝
    的頭像 發(fā)表于 11-28 20:15 ?663次閱讀
    <b class='flag-5'>商湯</b>科技與上海聯(lián)通達(dá)成戰(zhàn)略合作

    呼吸燈到底是如何影響人的視覺的?

    呼吸燈到底是通過使燈快速亮滅還是改變平均電壓來影響人的視覺的
    發(fā)表于 11-08 06:04

    請(qǐng)問單片機(jī)的中斷系統(tǒng)到底是什么?

    中斷系統(tǒng)到底是什么?還搞不定
    發(fā)表于 11-07 07:40

    上拉電阻到底是咋完成上拉的???

    上拉電阻到底是咋完成上拉的啊
    發(fā)表于 10-31 06:52

    單片機(jī)的“性能”到底是什么?

    單片機(jī)的“性能”到底是什么?
    的頭像 發(fā)表于 10-24 16:58 ?502次閱讀
    單片機(jī)的“性能”<b class='flag-5'>到底是</b>什么?