斯坦福張首晟團(tuán)隊(duì)創(chuàng)造了一個(gè)人工智能程序Atom2Vec,只用幾個(gè)小時(shí)就重新得出了元素周期表。這項(xiàng)研究更宏大的目標(biāo)是設(shè)計(jì)出替代作為機(jī)器智能標(biāo)準(zhǔn)的圖靈檢驗(yàn)的新標(biāo)準(zhǔn)。張首晟教授在接受新智元采訪時(shí)認(rèn)為,實(shí)驗(yàn)是檢驗(yàn)規(guī)律的唯一標(biāo)準(zhǔn),人類可以通過實(shí)驗(yàn)來(lái)認(rèn)證人工智能做出的理論預(yù)言。
元素周期表可以說是化學(xué)歷史上最重要的科學(xué)成就,人類科學(xué)家們經(jīng)過將近一個(gè)世紀(jì)的摸索和嘗試來(lái)把元素周期表整理成當(dāng)前的形式; 而一個(gè)來(lái)自斯坦福的物理學(xué)家們的人工智能程序只需要幾個(gè)小時(shí)。
這個(gè)程序叫Atom2Vec(從原子到矢量)。它能夠分析從網(wǎng)絡(luò)數(shù)據(jù)庫(kù)得到的不同元素組合而成的化合物名稱來(lái)學(xué)習(xí)區(qū)分不同的原子,整個(gè)過程是獨(dú)立無(wú)監(jiān)督的,并沒有人類智能的參與。這個(gè)程序的開發(fā)借用了自然語(yǔ)言處理中的簡(jiǎn)單概念:一個(gè)詞語(yǔ)的特性是可以從它周圍出現(xiàn)的其他單詞來(lái)得出的;把化學(xué)元素根據(jù)它們所出的化學(xué)環(huán)境聚類。
項(xiàng)目的負(fù)責(zé)斯坦福人文與科學(xué)學(xué)院J.G. Jackson and C.J. Wood
教授張首晟說:“我們想知道是否一個(gè)人工智能可以智慧到獨(dú)立發(fā)現(xiàn)元素周期表,我們的團(tuán)隊(duì)證明了這一點(diǎn)?!?/p>
借鑒NLP概念搭配化合物中的原子,Atom2Vec將來(lái)可用于發(fā)現(xiàn)和設(shè)計(jì)新材料
張教授和他的團(tuán)隊(duì)對(duì)于Atom2Vec的開發(fā)基于谷歌工程師們分析自然語(yǔ)言使用的Word2Vec。這是一個(gè)可以把單詞濃縮成為電腦中有限的幾個(gè)數(shù)字(矢量)。通過分析這些矢量,這個(gè)人工智能程序可以估計(jì)在這個(gè)單詞周圍可能出現(xiàn)哪些其他單詞,他們的概率是多少,之間的組合關(guān)系如何。
例如,單詞“國(guó)王”經(jīng)常和“王后”出現(xiàn)在一起,而“男人”經(jīng)常和“女人”出現(xiàn)在一起。因此,Word2Vec分析出的代表“國(guó)王”的矢量可以跟代表“王后”,“男人”和“女人”的矢量有如下簡(jiǎn)單的關(guān)系:“國(guó)王”=“王后”-“女人”+“男人”。
張教授指出,“我們可以把類似的想法用到原子上,就像輸入給谷歌的Word2Vec很多文本里不同單詞組成的句子,我們可以輸入給我們的Atom2Vec不同原子組成的化合物,就像NaCl(氯化鈉), KCl(氯化鉀), H2O(水) 等等?!?/p>
從這些數(shù)據(jù)的分析中,人工智能程序可以發(fā)現(xiàn)鉀和鈉有著類似的性質(zhì),因?yàn)樗鼈兌伎梢愿u素結(jié)合成化合物,張教授說,“就像國(guó)王和王后很類似一樣,鉀和鈉也是類似的?!?/p>
Atom2Vec工作流學(xué)習(xí)材料數(shù)據(jù)庫(kù)中的原子。對(duì)材料數(shù)據(jù)庫(kù)中的每一種化合物生成原子-環(huán)境對(duì),在此基礎(chǔ)上構(gòu)造原子-環(huán)境矩陣。這里使用一個(gè)包含7個(gè)化合物的小數(shù)據(jù)集作為示例。原子-環(huán)境矩陣的條目表示原子-環(huán)境對(duì)的數(shù)量。插圖顯示化合物的單元中和對(duì)應(yīng)于目標(biāo)原子Bi和環(huán)境(2)Se3的條目。只考慮成分信息,而忽略結(jié)構(gòu)信息。Atom2Vec學(xué)習(xí)算法從原子環(huán)境矩陣中提取原子的知識(shí),并對(duì)原子向量中學(xué)習(xí)的屬性進(jìn)行編碼。
張教授希望在未來(lái),科學(xué)家們可以使用Atom2Vec的知識(shí)來(lái)發(fā)現(xiàn)和設(shè)計(jì)新材料,“在這個(gè)項(xiàng)目里,我們的程序是無(wú)監(jiān)督的,但是你可以給它一個(gè)特定的目標(biāo)去優(yōu)化,例如,找到最有效率轉(zhuǎn)換太陽(yáng)能的材料?!?/p>
張教授的團(tuán)隊(duì)已經(jīng)開始團(tuán)隊(duì)人工智能程序2.0版本的研究,集中攻克一個(gè)生物醫(yī)學(xué)上很困難的問題:設(shè)計(jì)出正確可以攻擊抗原的抗體,通常來(lái)講,抗體是由免疫機(jī)制生成的。這對(duì)于癌癥的研究極其重要,當(dāng)前最有前景的治療癌癥方案之一——免疫治療,就試圖找到并且控制能夠攻擊癌細(xì)胞抗原的抗體。
然而人類身體可以創(chuàng)造超過1000萬(wàn)種不同的抗體,每一種都是大約50個(gè)基因的一種不同組合,“如果我們可以把這些基因數(shù)據(jù)里的信息濃縮到一個(gè)數(shù)學(xué)矢量里去,像排列元素周期表一樣排列它們,那么,如果我們發(fā)現(xiàn)其中一種抗體對(duì)一個(gè)抗原有效然而有毒,我們可以從我們的表中接著尋找它同類的但毒性更小的抗體。”
更宏大的目標(biāo):設(shè)計(jì)出替代圖靈檢驗(yàn)的新標(biāo)準(zhǔn)
張首晟表示,這項(xiàng)發(fā)表于6月25日美國(guó)國(guó)家科學(xué)院院刊的研究將是實(shí)現(xiàn)更宏大的目標(biāo)之前的重要的第一步。更宏大的目標(biāo)是設(shè)計(jì)出替代作為機(jī)器智能標(biāo)準(zhǔn)的圖靈檢驗(yàn)的新標(biāo)準(zhǔn)。
圖靈檢驗(yàn)里面,一個(gè)機(jī)器如果可以和人類一樣回復(fù)檢驗(yàn)者的問題,讓檢驗(yàn)者無(wú)法區(qū)分其是否是人類,就可以通過檢驗(yàn)。但張教授認(rèn)為,這種檢驗(yàn)是有瑕疵的,主觀的,“人類是一個(gè)漫長(zhǎng)進(jìn)化的結(jié)果,人類的心智里充滿了種種不理性的因素,如果一個(gè)人工智能要通過圖靈檢驗(yàn),它需要能夠重復(fù)這些人類復(fù)雜的非理性的一面,這是非常困難而瑣碎的,因此并不能夠有效利用程序設(shè)計(jì)者的時(shí)間創(chuàng)造價(jià)值?!?/p>
張教授提出,對(duì)于一個(gè)機(jī)器智能可以有另一種標(biāo)準(zhǔn),“我們想試試我們是否可以設(shè)計(jì)出在發(fā)現(xiàn)自然規(guī)律上可以擊敗人類的人工智能,但是在此之前,我們要先測(cè)試我們的人工智能是否可以重復(fù)人類已經(jīng)完成的一些偉大發(fā)現(xiàn)。而Atom2Vec獨(dú)立發(fā)現(xiàn)元素周期表就是后者的一個(gè)成果”。
新智元向張首晟教授提問:如果AI發(fā)現(xiàn)了自然規(guī)律,我們?cè)趺粗滥蔷褪鞘聦?shí)呢?張首晟教授認(rèn)為,實(shí)驗(yàn)是檢驗(yàn)規(guī)律的唯一標(biāo)準(zhǔn),人類可以通過實(shí)驗(yàn)來(lái)認(rèn)證人工智能做出的理論預(yù)言。
張首晟教授還認(rèn)為,純理性的標(biāo)準(zhǔn)才是客觀的,人機(jī)競(jìng)智的標(biāo)準(zhǔn)一定要客觀才行。
此外,這個(gè)項(xiàng)目中其他的參與者有,斯坦福的博士生周權(quán)和劉慎修,博士后湯沛哲等。
-
人工智能
+關(guān)注
關(guān)注
1789文章
46365瀏覽量
236541 -
圖靈
+關(guān)注
關(guān)注
1文章
37瀏覽量
9676 -
自然語(yǔ)言處理
+關(guān)注
關(guān)注
1文章
588瀏覽量
13464
原文標(biāo)題:斯坦福AI幾小時(shí)發(fā)現(xiàn)元素周期表,張首晟團(tuán)隊(duì)將設(shè)計(jì)替代圖靈測(cè)試的新標(biāo)準(zhǔn)
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論