近年來(lái),人工智能技術(shù)(AI)一直是各行各業(yè)的討論焦點(diǎn),與物聯(lián)網(wǎng)、分布式數(shù)據(jù)庫(kù)、5G、自然語(yǔ)言處理等等熱詞一同涌現(xiàn)在時(shí)代的浪潮前沿。然而,當(dāng)各行各業(yè)關(guān)注于這些時(shí)代熱詞,探索研發(fā)新的AI場(chǎng)景時(shí),卻常常忽視了最成熟也很重要的AI技術(shù)——知識(shí)圖譜。
或許你說(shuō)不出知識(shí)圖譜的具體定義,但其實(shí)處于信息時(shí)代的我們?cè)缫央x不開它。當(dāng)你打開百度,搜索某個(gè)字怎么念,或者今年高考的高校錄取分?jǐn)?shù)線,其結(jié)果的聯(lián)想就來(lái)自于知識(shí)圖譜的構(gòu)建;當(dāng)你打開淘寶或者今日頭條,其中按照你的興趣愛(ài)好定制的個(gè)性化推薦內(nèi)容,背后也是知識(shí)圖譜在發(fā)揮作用……
而現(xiàn)在,互聯(lián)網(wǎng)巨頭們重新認(rèn)識(shí)到在數(shù)據(jù)之上的知識(shí)的重要,紛紛在知識(shí)圖譜上暗暗較勁。
在百度新春內(nèi)部演講中,李彥宏說(shuō),“知識(shí)圖譜(包括需求圖譜、用戶畫像等等),這些東西都是百度整個(gè)人工智能當(dāng)中非?;A(chǔ)的構(gòu)件,也是我們相對(duì)于其他任何一家公司的優(yōu)勢(shì)所在?!痹贏I World 世界人工智能大會(huì)上,百度副總裁、AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰也避開萬(wàn)眾矚目的眾多熱詞,將重心聚焦于知識(shí)圖譜上。
除了百度,谷歌、阿里、華為等玩家也在積極部署知識(shí)圖譜。谷歌將語(yǔ)音搜索、Google Assistant、Google Lens、Google Home諸多軟硬件產(chǎn)品均接入谷歌知識(shí)圖譜,以構(gòu)建更大的知識(shí)網(wǎng)絡(luò),阿里也利用自己的電商優(yōu)勢(shì)捕獲海量數(shù)據(jù)形成更有效的用戶畫像并入自己的知識(shí)網(wǎng)絡(luò),并聯(lián)合清華大學(xué)、中科院等機(jī)構(gòu)組建高級(jí)知識(shí)圖譜研究團(tuán)隊(duì)……
那究竟知識(shí)圖譜是什么?它又與人工智能有著怎樣的聯(lián)系呢?
中文知識(shí)圖譜(Chinese Knowledge Graph) ,最早起源于Google Knowledge Graph。Knowledge Graph是在2012年由谷歌提出的,用于增強(qiáng)其搜索引擎功能的知識(shí)庫(kù)。
知識(shí)圖譜本質(zhì)上是一種語(yǔ)義網(wǎng)絡(luò)。其結(jié)點(diǎn)代表實(shí)體(entity)或者概念(concept),邊代表實(shí)體/概念之間的各種語(yǔ)義關(guān)系。知識(shí)圖譜是一種結(jié)構(gòu)化的語(yǔ)義知識(shí)庫(kù),其基本組成單位是“實(shí)體-關(guān)系-實(shí)體”的三元組,以及實(shí)體及其相關(guān)屬性-值對(duì),通過(guò)實(shí)體間的關(guān)系構(gòu)成網(wǎng)狀的知識(shí)結(jié)構(gòu),每一個(gè)節(jié)點(diǎn)均為實(shí)體,實(shí)體具有屬性-值對(duì),同時(shí)實(shí)體與實(shí)體之間通過(guò)關(guān)系相互連接,構(gòu)成一個(gè)特定領(lǐng)域的知識(shí)網(wǎng)絡(luò)。
簡(jiǎn)而言之,知識(shí)圖譜就是通過(guò)不同知識(shí)的關(guān)聯(lián)性而形成的網(wǎng)狀的知識(shí)結(jié)構(gòu)。形成知識(shí)圖譜的過(guò)程實(shí)際上就是加工信息、建立認(rèn)知、理解所應(yīng)用的領(lǐng)域的過(guò)程。人類證實(shí)因?yàn)橛辛双@取知識(shí)、形成知識(shí)的能力才可以不斷進(jìn)步;同樣,知識(shí)是人工智能的基石,知識(shí)圖譜對(duì)于人工智能的價(jià)值也正是在于它可以讓機(jī)器具備認(rèn)知能力。
另外,知識(shí)對(duì)于AI的價(jià)值,王海峰的總結(jié)是,兩者結(jié)合可以正循環(huán):“有了知識(shí)的人工智能會(huì)變得更強(qiáng)大,可以做更多的事情。反過(guò)來(lái),因?yàn)楦鼜?qiáng)大的人工智能,可以幫我們更好地從客觀世界中去挖掘、獲取和沉淀知識(shí),這些知識(shí)和人工智能系統(tǒng)形成正循環(huán),兩者共同進(jìn)步。”
更具體而言,知識(shí)圖譜可以說(shuō)是AI應(yīng)用行業(yè)的先決條件。目前,人工智能已受到各行各業(yè)的關(guān)注,不只是BAT在戰(zhàn)略投資人工智能,金融、汽車、零售、娛樂(lè)、制造等等行業(yè)都在積極擁抱人工智能技術(shù)。然而,人工智能要在行業(yè)中得到應(yīng)用,首先必須要對(duì)行業(yè)建立起認(rèn)知,只有真正理解了行業(yè)和場(chǎng)景,才能實(shí)現(xiàn)智能化。也就是說(shuō),只有建立了行業(yè)知識(shí)圖譜,才能給出行業(yè)AI方案。
例如在金融行業(yè)。眾所周知,金融是百度最先商用的AI場(chǎng)景,正如李彥宏曾說(shuō):“金融的數(shù)據(jù)化本質(zhì),加上業(yè)務(wù)規(guī)則清晰,使它成為人工智能最佳的應(yīng)用場(chǎng)景。”金融的知識(shí)相對(duì)垂直,因此也非常適合與知識(shí)圖譜技術(shù)結(jié)合。在五年前,百度就已將知識(shí)圖譜應(yīng)用在股票領(lǐng)域,旗下產(chǎn)品股市通通過(guò)數(shù)據(jù)、信息與股票的關(guān)系,以及股票與股票之間的關(guān)系,在股票領(lǐng)域首創(chuàng)知識(shí)圖譜,實(shí)現(xiàn)智能選股。不只是百度金融(現(xiàn)度小滿)在應(yīng)用知識(shí)圖譜,整個(gè)金融行業(yè)都在將知識(shí)圖譜應(yīng)用在個(gè)人征信、貸款風(fēng)控、保險(xiǎn)銷售、保險(xiǎn)策劃、金融指數(shù)、反欺詐、客戶管理管理、智能客服等領(lǐng)域,出現(xiàn)了不少提供金融AI技術(shù)或者是金融知識(shí)圖譜服務(wù)的創(chuàng)業(yè)公司,百度金融(現(xiàn)度小滿)也一直在積極地推進(jìn)智能金融科技的開放,包括金融知識(shí)圖譜的開放。
除了金融領(lǐng)域,咨詢也是知識(shí)圖譜應(yīng)用的典型場(chǎng)景。
隨著內(nèi)容創(chuàng)作進(jìn)入自媒體時(shí)代,目前內(nèi)容分發(fā)信息流日益流行,而信息流的基礎(chǔ)就是個(gè)性化推薦技術(shù)。要做好個(gè)性化推薦技術(shù)只需做好兩點(diǎn):一個(gè)是理解用戶的閱讀興趣;另一個(gè)是理解資訊內(nèi)容。然而兩點(diǎn)要做到都不容易,理解用戶的前提是足夠多的用戶興趣數(shù)據(jù),理解內(nèi)容的前提則是知識(shí)圖譜,平臺(tái)必須要有一定的“認(rèn)知”才知道不同內(nèi)容意味著什么,適合哪些興趣的用戶,而不是簡(jiǎn)單的關(guān)鍵詞匹配。
舉個(gè)例子,一個(gè)文章內(nèi)容是馬云最新演講解讀,是將其推薦給電商行業(yè)人士,還是希望獲得成功的年輕人,還是李彥宏等企業(yè)家們?每個(gè)人都可能感興趣,如何推薦就要結(jié)合對(duì)內(nèi)容的認(rèn)知,以及對(duì)用戶興趣以及當(dāng)前場(chǎng)景的理解,這時(shí)知識(shí)圖譜就派上用場(chǎng)了。特別是在視頻領(lǐng)域,要理解內(nèi)容不是靠文字識(shí)別,而是要靠機(jī)器視覺(jué)技術(shù),對(duì)內(nèi)容本身的理解難度更高,知識(shí)圖譜在這時(shí)則顯得更為重要。
現(xiàn)在,今日頭條、百度、一點(diǎn)資訊、搜狐、網(wǎng)易、企鵝、UC、微博等等都在做信息流。百度世界大會(huì)上宣布百度信息流月活超過(guò)6億,相比去年5月剛推出時(shí)日均閱讀量提升105倍,短視頻日均播放量提升169倍,這個(gè)成果,與知識(shí)圖譜的優(yōu)勢(shì)密不可分。
王海峰在演講中也指出,“人工智能與傳統(tǒng)產(chǎn)業(yè)融合的過(guò)程中,要想為這個(gè)行業(yè)提供更好的服務(wù),就需要對(duì)這個(gè)行業(yè)進(jìn)行定制化,要有行業(yè)知識(shí),這時(shí)候就需要在通用知識(shí)圖譜的基礎(chǔ)上,有相應(yīng)的行業(yè)知識(shí)圖譜,進(jìn)而幫助這個(gè)行業(yè)提升生產(chǎn)力,幫助這些行業(yè)、產(chǎn)業(yè)升級(jí)?!?/p>
從王海峰的邏輯,我們窺見一條未來(lái)人工智能走向應(yīng)用的必經(jīng)之路:
機(jī)器通過(guò)人工智能技術(shù)與用戶的互動(dòng),從中獲取數(shù)據(jù)、優(yōu)化算法,更重要的是構(gòu)建和完善知識(shí)圖譜,認(rèn)知和理解世界,進(jìn)而服務(wù)于這個(gè)世界,讓人類的生活更加美好。
-
人工智能
+關(guān)注
關(guān)注
1789文章
46368瀏覽量
236554 -
自然語(yǔ)言處理
+關(guān)注
關(guān)注
1文章
588瀏覽量
13464 -
知識(shí)圖譜
+關(guān)注
關(guān)注
2文章
132瀏覽量
7675
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論