德國(guó)人工智能研究中心(DFKI)成立于1988年,是全球最大的基于人工智能的非營(yíng)利軟件技術(shù)中心,是德國(guó)最大的從事軟件技術(shù)和應(yīng)用的研究機(jī)構(gòu),研究方向覆蓋大數(shù)據(jù)分析、知識(shí)管理、畫面處理與理解、自然語(yǔ)言處理、人機(jī)交互、機(jī)器人等各個(gè)領(lǐng)域。中心成功吸引了谷歌、英特爾、微軟、寶馬等多家全球前十的頂級(jí)科技企業(yè)的投資。
不僅如此,DFKI在科技成果商業(yè)轉(zhuǎn)化方面也有深厚積累,已經(jīng)孵化百余家創(chuàng)業(yè)公司。其中,50多家目前保持著較高的市場(chǎng)活躍度,在各自所處的細(xì)分領(lǐng)域也都極具競(jìng)爭(zhēng)力。
3月29日,DFKI科學(xué)董事漢斯·烏思克爾特(Hans Uszkoreit)教授受邀出席2018新智元產(chǎn)業(yè)躍遷AI技術(shù)峰會(huì),并與新智元交流了中美歐人工智能市場(chǎng)和技術(shù)發(fā)展差異,以及他認(rèn)為有前景的研究方向。
如何構(gòu)建一家偉大的人工智能研究機(jī)構(gòu)?DFKI在科技成果轉(zhuǎn)化方面遵循一套怎樣的流程?深度學(xué)習(xí)在自然語(yǔ)言處理方面有怎樣的發(fā)展?本文一一給出解答。
漢斯·烏思克爾特(Hans Uszkoreit)
歐洲科學(xué)院院士
深知無(wú)限人工智能研究院院長(zhǎng)兼首席科學(xué)家
漢斯·烏思克爾特教授是德國(guó)人工智能研究中心(DFKI)科學(xué)董事,北京深知無(wú)限人工智能研究院(AITC)院長(zhǎng)兼首席科學(xué)家,聯(lián)想研究院人工智能首席顧問,柏林工業(yè)大學(xué)榮譽(yù)教授,歐洲科學(xué)院院士和國(guó)際計(jì)算語(yǔ)言學(xué)委員會(huì)成員。烏思克爾特教授多年來(lái)從事并引領(lǐng)著人工智能領(lǐng)域的學(xué)術(shù)及研究工作,尤其在語(yǔ)言和知識(shí)科技領(lǐng)域,擁有超過(guò)30年的經(jīng)驗(yàn),參與創(chuàng)立并指導(dǎo)了數(shù)十家人工智能初創(chuàng)公司,其研究成果刊登于200多家國(guó)際出版物。
如何構(gòu)建一家偉大的AI研究院:最激烈的競(jìng)爭(zhēng)是爭(zhēng)取人才
DFKI是世界上最大的人工智能研究機(jī)構(gòu)之一,到2018年正好有30年的歷史,成果豐碩。很自然地,如何創(chuàng)建以及管理這樣一家偉大的AI研究機(jī)構(gòu),就成了我們首先請(qǐng)教烏思克爾特教授的問題。
烏思克爾特教授告訴新智元,如今的情況與30年前發(fā)生了很大的變化?!?0年前,就算前路坎坷,只要我們非常有遠(yuǎn)見,有一個(gè)強(qiáng)大的團(tuán)隊(duì),得到業(yè)界和政府專門支持,就可以著手成立研究院。我們有充足的時(shí)間去發(fā)展和改變研究主題,同時(shí)探索和不斷適應(yīng)商業(yè)化戰(zhàn)略。”
“但在今天,雖然社會(huì)對(duì)人工智能的需求變大了,但競(jìng)爭(zhēng)也很激烈。最激烈的競(jìng)爭(zhēng)就是爭(zhēng)取人才。因此,需要仔細(xì)計(jì)劃,選擇主題,決定次序,整理強(qiáng)有力的材料,才能找到需要的專業(yè)人才。
“總體來(lái)說(shuō),要完成現(xiàn)有前沿技術(shù)商業(yè)化,還需要踏踏實(shí)實(shí)、兢兢業(yè)業(yè)做好研究(以及金融支持),明天才可以獲得新成果,畢竟今天的技術(shù)也會(huì)成為歷史?!?span style="text-indent: 2em; font-size: 12px;">此外,擁有一個(gè)國(guó)際化的顧問團(tuán)隊(duì)也很重要,“在疑惑時(shí)幫你做正確選擇,在受到資助方質(zhì)疑時(shí)維護(hù)你、支持你,借鑒經(jīng)驗(yàn),且保持科學(xué)高標(biāo)準(zhǔn)?!?/span>吸引人才的最強(qiáng)磁鐵是人才本身;錢不是最主要的,但沒有錢不行
如今,DFKI旗下有千名研究人員,其中不乏院士、兩院院士甚至三院院士,在眾多領(lǐng)域展開交叉合作。這對(duì)管理提出了極高的要求。與此同時(shí),近幾年來(lái),以谷歌為首的科技巨頭也在AI人才方面大量挖掘。作為DFKI的管理者,烏思克爾特教授表示,招聘和留住年輕的優(yōu)秀人才和經(jīng)驗(yàn)豐富的專家,一直都是最大的挑戰(zhàn)之一。
“吸引人才的最強(qiáng)磁鐵是人才本身,尤其是成功人士。壯志酬酬的年輕研究人才會(huì)被值得學(xué)習(xí)的對(duì)象吸引,會(huì)被可以讓人才成長(zhǎng)和增長(zhǎng)才智的地方吸引。一個(gè)新成立的研究中心很難迅速達(dá)到這種程度。除非成立之初就有一批能人相助,不然就要慢慢積累以達(dá)到高水平?!?span style="text-indent: 2em; font-size: 12px;">“為了吸引年輕人才,錢不是最主要的。然而,想要在人才稀缺,薪酬隨之飛升的時(shí)代,要留住經(jīng)驗(yàn)豐富的領(lǐng)袖人才,錢就成了重要問題?!?/span>
“但還是有成熟的研究員愿意做基礎(chǔ)研究,即使同行的工資是他們的兩倍。但現(xiàn)在行業(yè)內(nèi)工資上漲了三倍,產(chǎn)業(yè)界有很多機(jī)會(huì)從事振奮人心的研究,波動(dòng)隨之變得很大。公共研發(fā)資助必須適應(yīng)這種環(huán)境,年輕的博士生也要快速成長(zhǎng),承擔(dān)領(lǐng)導(dǎo)任務(wù)?!?/p>
孵化公司是研究成果商業(yè)化的一條重要渠道,要在市場(chǎng)需求產(chǎn)生前創(chuàng)立公司
DFKI成功的一大因素,在于其自籌建之初就非常注重對(duì)從研究到實(shí)際應(yīng)用的轉(zhuǎn)化,積累了大量產(chǎn)業(yè)成果。不僅如此,自成立以來(lái),DFKI在全球范圍內(nèi)孵化了Chusable、B4、Ascella、Camelot、DHC、Digipen等在內(nèi)的數(shù)十家分支機(jī)構(gòu),孵化了近百家AI科技公司。其中,50多家目前保持著較高的市場(chǎng)活躍度,在各自所處的細(xì)分領(lǐng)域也都極具競(jìng)爭(zhēng)力。
烏思克爾特教授說(shuō),DFKI擁有多種渠道將研究成果商業(yè)化,孵化公司就是其中之一,也是很重要的一條渠道?!拔覀儍H在極少數(shù)的情況下直接對(duì)接市場(chǎng),換言之就是在規(guī)范的軟件平臺(tái)上出售產(chǎn)品,因?yàn)橄胍3诌@種商業(yè)模式,必須建立和穩(wěn)固銷售及支持團(tuán)隊(duì)?!?/p>
DFKI成功實(shí)現(xiàn)商業(yè)化的原因之一,是他們的戰(zhàn)略規(guī)劃方案。每一個(gè)研究中心都有短期和長(zhǎng)期發(fā)展路線圖,這些路線圖由研究團(tuán)隊(duì)制定,再經(jīng)DFKI指導(dǎo)委員會(huì)會(huì)議討論、修訂和最終協(xié)調(diào)確定,實(shí)現(xiàn)研究目標(biāo)和研究機(jī)遇同實(shí)際需求和未來(lái)期望相互結(jié)合。如此一來(lái),可以在熱點(diǎn)話題變成熱點(diǎn)之前開展研究。
“但找出最合適的一條商業(yè)化渠道,還是需要一段時(shí)間?!睘跛伎藸柼亟淌谡f(shuō)。
中國(guó)現(xiàn)有AI研究尚不足以支撐垂直領(lǐng)域解決方案
在AI技術(shù)落地方面,歐洲、美國(guó)和中國(guó)的現(xiàn)實(shí)情況存在很大不同。以創(chuàng)業(yè)公司為例:DFKI成功孵化了很多創(chuàng)業(yè)公司,但在德國(guó)或者歐洲,有時(shí)候孵化公司雖然成立,但市場(chǎng)還未產(chǎn)生前沿技術(shù)需求。
在德國(guó),前沿技術(shù)需求市場(chǎng)數(shù)量很少,遠(yuǎn)遠(yuǎn)不及美國(guó)或者中國(guó)。很多德國(guó)公司規(guī)模尚小,又走不出歐洲市場(chǎng)。癥結(jié)或在于歐洲市場(chǎng)規(guī)模較小,市場(chǎng)估值較小,外資規(guī)模自然小于美國(guó)和中國(guó)。這就導(dǎo)致很多DFKI的孵化公司發(fā)展速度遠(yuǎn)遠(yuǎn)低于中國(guó)或美國(guó)的平均水平。
但烏思克爾特教授指出,這樣做仍然比在需求產(chǎn)生后再成立公司要好,因?yàn)槭袌?chǎng)需求產(chǎn)生后,經(jīng)濟(jì)實(shí)力更加雄厚的競(jìng)爭(zhēng)者會(huì)成立規(guī)模更大的公司?!凹幢闶袌?chǎng)還沒有準(zhǔn)備好,初創(chuàng)技術(shù)公司仍然可以依靠堅(jiān)實(shí)的創(chuàng)新技術(shù)繼續(xù)發(fā)展?!?/p>
另一點(diǎn)不同是產(chǎn)業(yè)結(jié)構(gòu)。美國(guó)互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展速度十分可觀,中國(guó)是全球唯一擁有大規(guī)?;ヂ?lián)網(wǎng)產(chǎn)業(yè)且能與美國(guó)媲美的國(guó)家。美國(guó)電子產(chǎn)品產(chǎn)業(yè)規(guī)模也十分巨大,中國(guó)、韓國(guó)和日本也擁有優(yōu)勢(shì),德國(guó)卻沒有。德國(guó)的制造業(yè)發(fā)展強(qiáng)勁,但大多服務(wù)于出口,中國(guó)也是如此。所以,“中國(guó)和德國(guó)都需要人工智能賦能制造業(yè)走向世界?!?/p>
烏思克爾特教授認(rèn)為,在中國(guó)成熟人工智能技術(shù)商業(yè)化要容易得多。“如果在中國(guó)也有一家DFKI,市場(chǎng)需求規(guī)模大,投資規(guī)模大,商業(yè)化會(huì)比在歐洲容易得多?!?/p>
在中國(guó),大多數(shù)人工智能研究都集中在幾個(gè)領(lǐng)域,近期重大突破促進(jìn)技術(shù)發(fā)展日臻成熟。中國(guó)在計(jì)算機(jī)視覺產(chǎn)品開發(fā)方面處于領(lǐng)先地位,在機(jī)器人研究和人工智能增強(qiáng)數(shù)據(jù)分析方面實(shí)力雄厚,語(yǔ)音技術(shù)發(fā)展日趨強(qiáng)勁,機(jī)器翻譯逐步完善。
但是,“中國(guó)現(xiàn)有的研究還不能滿足垂直解決方案需求,這種方案結(jié)合多種人工智能技術(shù)和可循環(huán)利用的顯性知識(shí),對(duì)制造業(yè)、醫(yī)療、交通和旅游業(yè)發(fā)展都有益處。在視覺產(chǎn)品開發(fā)方面,中國(guó)很有可能在國(guó)際市場(chǎng)上取得成功。我覺得中國(guó)在幾個(gè)有關(guān)機(jī)器人研究的領(lǐng)域也會(huì)取得領(lǐng)先地位。關(guān)于基于海量知識(shí)的應(yīng)用,語(yǔ)言障礙是很大挑戰(zhàn),因?yàn)榫瓦B結(jié)構(gòu)化知識(shí)也極大地依賴于語(yǔ)言?!?/p>
最有前景領(lǐng)域:將深度學(xué)習(xí)和結(jié)構(gòu)性知識(shí)相結(jié)合
在談到最近自然語(yǔ)言處理領(lǐng)域令他興奮的工作和進(jìn)展時(shí),烏思克爾特教授不出意外地提到了機(jī)器翻譯。機(jī)器翻譯實(shí)現(xiàn)跨越式發(fā)展令他非常激動(dòng),雖然現(xiàn)在的機(jī)器翻譯還不能完全取代專業(yè)譯員,但還是很受用戶歡迎。
“得益于深度學(xué)習(xí),端對(duì)端的基于神經(jīng)系統(tǒng)的自然語(yǔ)言處理發(fā)展速度非常驚人,相比之下,用于深度解讀,基于語(yǔ)言學(xué)和知識(shí)的自然語(yǔ)言系統(tǒng)發(fā)展速度就相對(duì)扎實(shí)平緩。這說(shuō)明語(yǔ)音識(shí)別系統(tǒng)、語(yǔ)音生成系統(tǒng)、中等質(zhì)量機(jī)器翻譯、簡(jiǎn)單問答系統(tǒng),甚至短篇新聞報(bào)道生成系統(tǒng),都具備應(yīng)用于現(xiàn)實(shí)的能力?!?/p>
但是,在自然語(yǔ)言處理領(lǐng)域和計(jì)算機(jī)視覺領(lǐng)域,要實(shí)現(xiàn)“理解”場(chǎng)景和觀察行為,我們需要更多世界知識(shí),這也包括從標(biāo)記文本、標(biāo)記圖片中得到的常識(shí)知識(shí)?!按蠖鄶?shù)知識(shí)只有在你已經(jīng)擁有很多知識(shí)的情況下才能獲得,對(duì)機(jī)器來(lái)說(shuō)也是如此?!睘跛伎藸柼亟淌谡f(shuō):“因此,現(xiàn)在應(yīng)用于自然語(yǔ)言處理的學(xué)習(xí)方案,還不足以讓產(chǎn)品生成對(duì)話、文本理解或高質(zhì)量翻譯,必須有更多知識(shí)才行。目前的系統(tǒng)在現(xiàn)有標(biāo)注語(yǔ)言數(shù)據(jù)中還歸納不出這么多知識(shí)?!?/p>
“我覺得最有前景的研究領(lǐng)域就是把深度學(xué)習(xí)和在維基數(shù)據(jù)、DBpedia和谷歌搜索的知識(shí)圖譜中找到的結(jié)構(gòu)性知識(shí)相結(jié)合。這并不意味著我們要將所有需要的知識(shí)機(jī)械地表達(dá)出來(lái),大部分知識(shí)可以被自動(dòng)提取。但這就意味著我們需要神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)系統(tǒng)的獲取知識(shí),并不同階段持續(xù)學(xué)習(xí)。”
“研究機(jī)器學(xué)習(xí)會(huì)演化更大的領(lǐng)域,包括研究機(jī)器教學(xué)或全面機(jī)器教育,將涵蓋控制獲取基礎(chǔ)世界知識(shí),常識(shí)知識(shí),語(yǔ)言能力和專業(yè)領(lǐng)域知識(shí)?!?/p>
以下是漢斯·烏思克爾特教授在2018新智元產(chǎn)業(yè)·躍遷AI技術(shù)峰會(huì)上的演講《基于知識(shí)和機(jī)器學(xué)習(xí)技術(shù)的人工智能強(qiáng)化決策支持應(yīng)用》。
漢斯·烏思克爾特:各位下午好!今天我想談一談AI在深度分析現(xiàn)有動(dòng)態(tài)數(shù)據(jù)和動(dòng)態(tài)資源方面的應(yīng)用。
在機(jī)器學(xué)習(xí)出現(xiàn)之前,AI領(lǐng)域有兩種系統(tǒng):一種是基于知識(shí)的系統(tǒng),比如基于規(guī)則的信用檢查系統(tǒng);一種是基于行為的系統(tǒng),比如傳統(tǒng)反應(yīng)性的機(jī)器人控制。機(jī)器學(xué)習(xí)出現(xiàn)后,機(jī)器不僅可以學(xué)習(xí)行為,也可以學(xué)習(xí)知識(shí)。
有些人可能會(huì)很意外,Google的機(jī)器翻譯并不是基于知識(shí)的,而是基于行為,或者說(shuō)基于人類的經(jīng)驗(yàn),它的基礎(chǔ)是大量已經(jīng)有過(guò)翻譯的文獻(xiàn)和文本資料。無(wú)人駕駛也是基于人類行為的一種系統(tǒng)。同樣的還有閱讀理解,嚴(yán)格來(lái)講并不是“理解”,而只是從人類的語(yǔ)言當(dāng)中學(xué)習(xí)記憶。
相反的,IBM Watson是基于知識(shí)的一種系統(tǒng),文本分析系統(tǒng)也是基于知識(shí)的系統(tǒng),還有聊天機(jī)器人,和人聊天的時(shí)候,在自己的系統(tǒng)當(dāng)中尋找答案。
我們可以在這些基于知識(shí)的系統(tǒng)當(dāng)中看到基于行為的系統(tǒng),比如在學(xué)習(xí)的時(shí)候,除了以知識(shí)為基礎(chǔ),還會(huì)學(xué)習(xí)行為和經(jīng)驗(yàn)。
我們?yōu)槭裁磿?huì)看到這樣的發(fā)展?為什么以前沒有這樣的變革?因?yàn)槲宕箢I(lǐng)域的進(jìn)展,包括大數(shù)據(jù)、機(jī)器學(xué)習(xí)、知識(shí)技術(shù)、互聯(lián)網(wǎng)技術(shù)和硬件。
AI發(fā)展有4個(gè)階段,啟發(fā)式搜索和推理,基于人工設(shè)置的規(guī)則進(jìn)行知識(shí)處理,從海量數(shù)據(jù)中進(jìn)行機(jī)器學(xué)習(xí),最后是結(jié)合了機(jī)器學(xué)習(xí)和知識(shí)技術(shù)的認(rèn)知系統(tǒng)。
現(xiàn)在有兩大令人興奮的發(fā)展,其中一個(gè)是網(wǎng)絡(luò)2.0、語(yǔ)義網(wǎng)(也即“網(wǎng)絡(luò)3.0”)和數(shù)據(jù)知識(shí)社區(qū),比如維基百科、維基數(shù)據(jù)和DBPedia。另一個(gè)就是各種相連的系統(tǒng),現(xiàn)在我們有非常多的數(shù)據(jù)庫(kù),我們常說(shuō)的物聯(lián)網(wǎng)信息物理系統(tǒng),還有工業(yè)4.0當(dāng)中的“數(shù)字雙胞胎”(Digital Twin,指物理資產(chǎn)或流程的軟件模型)、智能企業(yè)等以產(chǎn)品為驅(qū)動(dòng)力的生產(chǎn)行為??傮w來(lái)講,所有智能企業(yè)都是屬于這個(gè)領(lǐng)域。
在工業(yè)4.0概念中的智能工廠,其核心是智能制造,基礎(chǔ)是產(chǎn)品、經(jīng)驗(yàn)和記憶。拓展開去,外面的部分并不完全來(lái)自制造業(yè),比如智能出行、智能物流和智能樓宇。
現(xiàn)在我們做的工作,原先并沒有出現(xiàn)在這幅圖景當(dāng)中,但也十分重要,比如最重要的競(jìng)爭(zhēng)者、消費(fèi)者和供應(yīng)商,有了這些,工廠才能正常運(yùn)營(yíng),媒體也很重要,包括投資方和監(jiān)管方,還有技術(shù)的提供方。
我們需要把這些結(jié)合到工廠的運(yùn)作當(dāng)中,要把圈內(nèi)的內(nèi)容和圈外的內(nèi)容結(jié)合起來(lái),才能做到企業(yè)的管理、工廠的管理。這些工作看起來(lái)好像和我們狹義的生產(chǎn)制造不是那么近,但其實(shí)這是很重要的,比如我們要知道智能客戶關(guān)系管理、客戶喜不喜歡我們的東西,還可以做到智能的項(xiàng)目管理,也要知道供應(yīng)商提供的物料來(lái)源怎樣、價(jià)格怎樣,還需要社會(huì)政府關(guān)系,所有的這些都是我們工作的一部分,這樣才能帶來(lái)企業(yè)的成功。
因此,我們需要得到許多外部的信息和數(shù)據(jù),很多可能需要買,但還有很多數(shù)據(jù)是開放和開源的,比如網(wǎng)絡(luò)上的資料、新聞媒體的報(bào)道、社交媒體的資料。我們可以分析這些外部的數(shù)據(jù)和信息,幫助圓圈內(nèi)部的企業(yè)和工廠,加入到他們的決策和運(yùn)作當(dāng)中,比如我們可以做偏航的預(yù)警,也可以做到流程的優(yōu)化和預(yù)測(cè)分析,根據(jù)過(guò)往的經(jīng)驗(yàn)預(yù)測(cè)這個(gè)月或者下個(gè)月哪種產(chǎn)品會(huì)有更好的銷量。
以產(chǎn)品的銷量分析為例,我們就希望能夠分析為什么有的時(shí)候銷量是上升的,有的時(shí)候銷量是下降的,再把銷量的數(shù)據(jù)和其他數(shù)據(jù)進(jìn)行比較?,F(xiàn)在我們專門拿出來(lái)一條天氣的曲線,比較天氣的曲線和銷量的曲線是有大致的相關(guān)性,但并不是完全相關(guān)。
我們繼續(xù)分析更多的信息,可以看到一個(gè)高點(diǎn),紐波特舉辦游艇展的時(shí)候,給我們帶來(lái)了更多的銷量,這是不是因?yàn)橛辛烁嗟娜藖?lái)到這個(gè)區(qū)域?
不光是簡(jiǎn)單分析一家企業(yè)或者工廠的數(shù)據(jù),各個(gè)地區(qū)的許多家企業(yè)聯(lián)合在一起,都可以應(yīng)用這樣一種分析的方法和思路。
這張圖展示了銅的銷量,高級(jí)銅的售價(jià)有升有降。為什么銅價(jià)會(huì)急劇上升?可以發(fā)現(xiàn)那段時(shí)間在智利的北部發(fā)生了地震,所有的這些紅點(diǎn)都是銅礦,所有的藍(lán)點(diǎn)都是煉銅廠。這個(gè)圓圈的波紋是地震的范圍。我們需要知道地震是否真的影響了銅價(jià),做了分析以后發(fā)現(xiàn),當(dāng)時(shí)的地震和銅價(jià)的上升是沒有關(guān)系的。
有時(shí)候我們會(huì)聽到很多的傳聞,A影響了B,B影響了C,但不管是否最后真的相關(guān),我們都需要讓機(jī)器來(lái)學(xué)習(xí),因?yàn)椴⒎敲恳粋€(gè)人都會(huì)根據(jù)特定的規(guī)則和傳統(tǒng)來(lái)行事,所以我們都需要讓機(jī)器來(lái)做分析和學(xué)習(xí)。
還是在這個(gè)銅價(jià)表上,藍(lán)色圓圈的位置是銅價(jià)下跌了,這個(gè)時(shí)候發(fā)生了什么事情呢?當(dāng)時(shí)有新聞報(bào)道,中國(guó)的銅礦價(jià)格平穩(wěn)。這條信息并沒有什么負(fù)面性,只是講到了中國(guó)的銅價(jià)是持平的,但展示了資訊的影響力。因此,緊跟資訊是一件很好的事情,能夠幫助我們做出商業(yè)上的決策。
這是大英百科全書的圖片,我們知道它的內(nèi)容非常詳盡,但維基百科的資訊量更多,里面不僅有傳統(tǒng)百科全書的內(nèi)容,還有很多新的數(shù)據(jù)和資訊。這里有達(dá)芬奇、蒙娜麗莎和米開朗其羅這些有關(guān)聯(lián)的概念,建立起了知識(shí)圖譜。
知識(shí)圖譜也是現(xiàn)在Google、百度、必應(yīng)搜集和存儲(chǔ)信息的一種方式。這是開放數(shù)據(jù)網(wǎng)絡(luò),有些是電影的數(shù)據(jù)庫(kù),有些是元素的數(shù)據(jù)庫(kù),可以說(shuō)是無(wú)所不包,但它們都在語(yǔ)義上相互關(guān)聯(lián),對(duì)知識(shí)系統(tǒng)來(lái)說(shuō)越來(lái)越重要。
我們可以把所有的知識(shí)放在一個(gè)系統(tǒng)當(dāng)中,這些知識(shí)系統(tǒng)沒有我們大腦的局限,在這種情況下,機(jī)器就會(huì)勝過(guò)我們,因?yàn)槲覀儧]有辦法拓展我們的大腦。在智能工廠中和人互動(dòng)的機(jī)器人,它們?cè)谇樯毯椭悄芊矫嬉矔?huì)越來(lái)越高,這可能就是未來(lái)的發(fā)展方向。
在我們的項(xiàng)目當(dāng)中,我們會(huì)把不同的數(shù)據(jù)結(jié)合起來(lái),比如氣象學(xué)數(shù)據(jù)、地理數(shù)據(jù),還有一些內(nèi)部企業(yè)數(shù)據(jù)。我們說(shuō)服一些公司,讓他們把知識(shí)放到我們的知識(shí)圖譜當(dāng)中,這些數(shù)據(jù)就會(huì)變成一種新的形式。我們?cè)谙朐鯓硬拍馨压緝?nèi)部和外部的數(shù)據(jù)鴻溝彌合起來(lái),怎樣才能讓這些數(shù)據(jù)為人所用。
我們和西門子以及更小一些的市場(chǎng)研究公司,比如VICO、維基百科以及其他的合作伙伴,聯(lián)手建立了一個(gè)世界性的項(xiàng)目,總部在柏林。我們想把內(nèi)部企業(yè)數(shù)據(jù)、公開數(shù)據(jù)和公開知識(shí)相連接,而為了實(shí)現(xiàn)這一點(diǎn),我們就需要知識(shí)圖譜、開源方法和工具,通過(guò)語(yǔ)言、技術(shù)和結(jié)構(gòu)性、統(tǒng)計(jì)性的學(xué)習(xí),這種工具叫做Apache Flink,對(duì)流數(shù)據(jù)的處理更好一些,我們也有很多的流數(shù)據(jù),所以把這些都嵌入到大數(shù)據(jù)的平臺(tái)當(dāng)中,通過(guò)方法分析這些數(shù)據(jù),并且和公司實(shí)現(xiàn)這些數(shù)據(jù)的利用。
我們有兩個(gè)商業(yè)領(lǐng)域的應(yīng)用,供應(yīng)鏈管理和市場(chǎng)研究。包括一些大公司在內(nèi),對(duì)于這兩個(gè)方面都有很大需求。這是Smart Data Web(SDW),就是智能數(shù)據(jù)網(wǎng),可以將不同的數(shù)據(jù)結(jié)合起來(lái)。SDW的理念是把公網(wǎng)上的信息和企業(yè)的內(nèi)部信息連接起來(lái),這樣我們就能夠把公開數(shù)據(jù)和企業(yè)數(shù)據(jù)結(jié)合起來(lái),而不是把這個(gè)企業(yè)的數(shù)據(jù)拿出來(lái),因?yàn)槠髽I(yè)不喜歡把他們的數(shù)據(jù)拿出來(lái),另一方面,維基百科也不喜歡單獨(dú)的公司把他們的世界觀放到維基百科上面。
同時(shí),我們必須找到方法來(lái)使用不斷增長(zhǎng)的數(shù)據(jù),獲取最核心、最重要的信息,比如地震在哪里,哪家公司可能會(huì)倒閉,哪家公司的高層人員要跳槽等等。現(xiàn)在問題的最大難點(diǎn)是什么呢?就是人類的語(yǔ)言,我們沒有辦法按照公式交流,同樣一件事情有很多不同的表述。
但是,還是能從中找到一些規(guī)律。我舉一個(gè)例子,舊金山有一家很出名的公司,叫做PowerSet,在2008年的時(shí)候以10億美元的價(jià)格被微軟收購(gòu)。如何讓機(jī)器學(xué)會(huì)從大量信息中學(xué)到這個(gè)事件?實(shí)際上很簡(jiǎn)單,用Google搜索可以發(fā)現(xiàn)很多不同的消息都是關(guān)于這起收購(gòu)案,一旦提到“微軟”、“PowerSet”、“2008年”這三個(gè)詞,說(shuō)的就是這件事,剩下的語(yǔ)言分析就簡(jiǎn)單了。當(dāng)然,也要注意虛假數(shù)據(jù)??赡苁沁@樣的句子,PowerSet對(duì)另外一家公司感興趣,并不是講這個(gè)收購(gòu)案的,所以我們需要剔除這樣的數(shù)據(jù)。
現(xiàn)在我們已經(jīng)在應(yīng)用這樣的技術(shù)了,正在為中國(guó)的一家制造企業(yè)提供相關(guān)的技術(shù),之前這家公司從來(lái)沒有用過(guò)AI方面的軟件,但是在全世界范圍內(nèi)都有很多的客戶,他們不知道客戶的想法是什么,因?yàn)樗麄儾欢ㄕZ(yǔ)和德語(yǔ),但我們幫助他們收集客戶評(píng)價(jià),并且告訴他們產(chǎn)品到底是什么特點(diǎn),客戶喜歡或者客戶不喜歡,競(jìng)爭(zhēng)對(duì)手的產(chǎn)品當(dāng)中,客戶喜歡什么或者不喜歡什么,其他產(chǎn)品價(jià)格如何,這些非常精準(zhǔn)的分析可以為企業(yè)提供自身產(chǎn)品和競(jìng)爭(zhēng)對(duì)手產(chǎn)品的比較。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1196瀏覽量
55246 -
AI
+關(guān)注
關(guān)注
87文章
29435瀏覽量
267737 -
人工智能
+關(guān)注
關(guān)注
1789文章
46397瀏覽量
236592
原文標(biāo)題:歐洲科學(xué)院院士:中國(guó)領(lǐng)先計(jì)算機(jī)視覺和機(jī)器人領(lǐng)域,但AI研究還不足以支撐垂直領(lǐng)域解決方案
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論