6月18日,IBM的AI系統(tǒng)Project Debater首次與人類(lèi)進(jìn)行現(xiàn)場(chǎng)公開(kāi)辯論。Project Debater能夠理解對(duì)方觀點(diǎn),并有針對(duì)性地做出清晰的反駁,最終成功戰(zhàn)勝人類(lèi)辯手。
美國(guó)時(shí)間6月18日,IBM Research推出了人工智能系統(tǒng)Project Debater,一個(gè)具有幽默感、小巧機(jī)智和偶爾有強(qiáng)有力的論點(diǎn)的實(shí)驗(yàn)性會(huì)話AI系統(tǒng)。當(dāng)日,Project Debater首次與人類(lèi)進(jìn)行現(xiàn)場(chǎng)公開(kāi)辯論,此次辯論比賽在舊金山的IBM沃森西部廠區(qū)( Watson West Site)舉行。
Project Debater是IBM Research(即超級(jí)電腦沃森背后的團(tuán)隊(duì))最新研制的AI系統(tǒng),也是第一個(gè)可以對(duì)復(fù)雜話題進(jìn)行辯論的AI系統(tǒng),旨在通過(guò)公正的辯論來(lái)拓展人們的思維。Project Debater擁有數(shù)以?xún)|計(jì)的論文、報(bào)告和新聞文章的龐大數(shù)據(jù)庫(kù)。通過(guò)消化這些數(shù)據(jù),Project Debater可以就特定主題做出邏輯結(jié)構(gòu)良好的演講,提出清晰明確的論點(diǎn),并對(duì)對(duì)手觀點(diǎn)進(jìn)行反駁。盡管在一些敘述上不是很自然,并不能完全和人類(lèi)相提并論,但Project Debater的思考和答辯仍然令人印象深刻。
IBM Research首席調(diào)查員兼Project Debater的創(chuàng)造者Noam Slonim稱(chēng),該AI系統(tǒng)的訓(xùn)練始于六年前,直到兩年前才有能力參與與人們的辯論。
IBM研究人員正在通過(guò)教授計(jì)算機(jī)來(lái)探索人工智能的界限,以創(chuàng)造引人入勝且信息更加豐富的觀點(diǎn)。他們的目標(biāo)是建立一個(gè)智能系統(tǒng),幫助人們?cè)诖鸢改:龝r(shí)作出基于證據(jù)的決定。自2012年起,Project Debater是IBM對(duì)AI的下一個(gè)重要里程碑,是繼深藍(lán)(Deep Blue)和沃森(Watson)后的又一突破。根據(jù)IBM的計(jì)劃,Project Debater未來(lái)將能夠通過(guò)提供引人注目的、以證據(jù)為基礎(chǔ)的論點(diǎn)并限制情感、偏見(jiàn)或模棱兩可的影響來(lái)幫助人們做出理智的判斷。
首戰(zhàn)告捷,戰(zhàn)勝頂尖人類(lèi)辯手
Project Debater和2016年的以色列國(guó)家辯論冠軍Noa Ovadia、以色列國(guó)際辯論協(xié)會(huì)主席Dan Zafrir分別進(jìn)行了辯論比賽。
圖左為Noa Ovadia,圖右為Dan Zafrir
在比賽中,Project Debater參與了兩個(gè)辯論主題,即“政府是否應(yīng)該資助太空探索”和“遠(yuǎn)程醫(yī)療是否應(yīng)該在醫(yī)療保健中發(fā)揮更大作用”。IBM公司希望確保人工智能系統(tǒng)能在不知道將研究什么的情況下進(jìn)行辯論,因此Project Debater在辯論前并不知道論題。
就“政府是否應(yīng)資助太空探索”的論題,Project Debater持正方,Noa Ovadia持反方。雙方隨后發(fā)布了四分鐘開(kāi)幕詞、四分鐘反駁和兩分鐘論證總結(jié)。在每個(gè)部分之間,Project Debater聽(tīng)取了人類(lèi)對(duì)手的四分鐘開(kāi)場(chǎng)白,解析了這些數(shù)據(jù),并創(chuàng)建了一個(gè)突出顯示并試圖駁斥人類(lèi)對(duì)手所提出的信息的論據(jù)。這令人難以置信,因?yàn)樗粌H要理解單詞,還要理解這些單詞的背景。鸚鵡學(xué)舌般復(fù)述維基百科條目很容易做到,但獲取數(shù)據(jù)并創(chuàng)建一個(gè)不僅基于原始數(shù)據(jù)而且還考慮到剛才聽(tīng)到的敘述的內(nèi)容,卻十分困難。
Project Debater提出一個(gè)開(kāi)放性觀點(diǎn),即空間探索有益于人類(lèi),因?yàn)榭臻g探索不僅有助于推動(dòng)科學(xué)發(fā)現(xiàn),還能激勵(lì)年輕人突破思考的壁壘。Noa Ovadia則認(rèn)為諸如地球科學(xué)研究之類(lèi)的項(xiàng)目有更值得獲得政府補(bǔ)貼。在聽(tīng)取了Noa的論點(diǎn)后,Project Debater發(fā)表了反駁言論,認(rèn)為太空探索帶來(lái)的潛在技術(shù)和經(jīng)濟(jì)利益超過(guò)其他政府支出。
在雙方總結(jié)陳詞后,一項(xiàng)快速調(diào)查顯示,大多數(shù)觀眾認(rèn)為Project Debater比人類(lèi)的論述更能豐富他們的知識(shí)。
在這次辯論過(guò)程中,AI系統(tǒng)確實(shí)也出了些差錯(cuò),并做出了一些瘋狂的斷言,比如它認(rèn)為太空探索“比更好的道路、更好的學(xué)?;蚋玫尼t(yī)療保健更重要”,或者在辯論過(guò)程中隨機(jī)地說(shuō)出“Scott Pelley畫(huà)外音”,這似乎是參考了哥倫比亞廣播公司(CBS)新聞和60分鐘(60 Minutes)記者的言論。
Chris Reed是論證技術(shù)中心(Center for Argument Technology)的主任,負(fù)責(zé)的是一個(gè)探索會(huì)話式人工智能的學(xué)術(shù)團(tuán)隊(duì),并沒(méi)有參與Project Debater項(xiàng)目。應(yīng)IBM的邀請(qǐng),Reed在周一的第一次演出中觀看了Project Debater的表現(xiàn),并表示就像在看“如此多的難題聚集在一起”,包括堅(jiān)持自己論點(diǎn)的能力、語(yǔ)法錯(cuò)誤的欠缺以及在做出決定之前能夠預(yù)測(cè)和反駁其反對(duì)者的論點(diǎn)等問(wèn)題。
“爭(zhēng)論和辯論,本質(zhì)上是驅(qū)動(dòng)科學(xué)進(jìn)程的引擎,描述了大多數(shù)政治論壇發(fā)生的事情,甚至描繪了現(xiàn)代宗教的大多數(shù)概念。”Reed說(shuō),“論證是人類(lèi)的一個(gè)決定性特征,如果我們的機(jī)器能夠傳達(dá)其中的一部分,那么我認(rèn)為這意味著一件非常重要的事情正在發(fā)生改變?!睆奈幕蟻?lái)看,辯論的起源不在于沖突和競(jìng)爭(zhēng),而在于民主和討論。辯論豐富了決策制定過(guò)程,幫助人們權(quán)衡新思想和新理念的利弊。它處于文明社會(huì)的核心。我們辯論的不僅是為了讓別人相信我們自己的觀點(diǎn),而且也是為了理解和學(xué)習(xí)彼此的觀點(diǎn)。
試想一下,一個(gè)與專(zhuān)業(yè)人類(lèi)辯論家交流的AI系統(tǒng)聽(tīng)取了他的觀點(diǎn),并以令人信服的方式提出了自己的無(wú)腳本推論,說(shuō)服聽(tīng)眾思考其在有爭(zhēng)議的話題上的立場(chǎng),這說(shuō)明AI系統(tǒng)可以像人類(lèi)一樣去理解意見(jiàn)并有針對(duì)性地給予自己的觀點(diǎn)。未來(lái),相信機(jī)器能夠通過(guò)幫助人類(lèi)做出許多重要決定。
之后,Project Debater與另一名以色列辯論專(zhuān)家Dan Zafrir之間進(jìn)行了第二次辯論,對(duì)“應(yīng)該增加對(duì)遠(yuǎn)程醫(yī)療的使用”的論題持反對(duì)意見(jiàn)。
此次辯論有四十名成員參與投票,Project Debater比Dan Zafrir多得9票,成功贏得比賽。
在辯論中,Project Debater能夠引用阿拉伯聯(lián)合酋長(zhǎng)國(guó)的一系列資料以及德國(guó)經(jīng)濟(jì)事務(wù)部長(zhǎng)的報(bào)告,獲得太空探索所能提供的就業(yè)數(shù)量等有效數(shù)據(jù)。但是,為了避免犯引用和語(yǔ)言邏輯方面的錯(cuò)誤,Project Debater沒(méi)有直接引用其對(duì)手的論述。
“無(wú)偏見(jiàn)”的辯論機(jī)器
根據(jù)IBM研究人員Noam Slonim和Ranit Aharonov的說(shuō)法,盡管人類(lèi)辯論機(jī)器是對(duì)該技術(shù)的有趣展示,但Project Debater的真正力量將是其展現(xiàn)無(wú)偏見(jiàn)論述的能力。
圖左為Ranit Aharonov,圖右為Noam Slonim
我們生活在一個(gè)被情緒和偏見(jiàn)染上色彩的世界中,難免看問(wèn)題的角度不夠真實(shí)與客觀。IBM表示,世界充滿了錯(cuò)誤的信息和膚淺的想法,片面的、被篡改的敘事的興起正在挑戰(zhàn)社會(huì)和互聯(lián)網(wǎng)平臺(tái)。AI在語(yǔ)言和推理的新發(fā)展可以幫助提供多樣的、消息靈通的觀點(diǎn),而Project Debater推動(dòng)AI的前沿發(fā)展,促進(jìn)智慧辯論,幫助人們建立充分知情的論點(diǎn)并做出更好的決策。
Project Debater可以幫助公司和政府透過(guò)我們生活經(jīng)歷中的喧囂提取出一些本質(zhì)的東西,并產(chǎn)生大多數(shù)公正的結(jié)論。當(dāng)然,它所提供的數(shù)據(jù)集是基于人類(lèi)的寫(xiě)作作品,而這些數(shù)據(jù)仍然會(huì)存在作者的情感與偏見(jiàn)。
雖然Project Debater的目標(biāo)是一個(gè)沒(méi)有偏見(jiàn)的機(jī)器,但在辯論期間,它還是出現(xiàn)疑似帶有偏見(jiàn)的表現(xiàn)。在反駁人類(lèi)辯手Dan Zafrir關(guān)于遠(yuǎn)程醫(yī)療擴(kuò)張的論題時(shí),該系統(tǒng)聲稱(chēng),Zafrir在開(kāi)幕聲明中并沒(méi)有說(shuō)出有關(guān)遠(yuǎn)程醫(yī)療使用增加的事實(shí)。換句話說(shuō),它認(rèn)為Zafrir是個(gè)騙子。
當(dāng)被問(wèn)及Project Debater這一表現(xiàn)時(shí),IBM研究人員Noam Slonim表示,在反駁期間,該系統(tǒng)有一個(gè)置信度閾值。如果感覺(jué)非常自信,它會(huì)創(chuàng)建一個(gè)更復(fù)雜的陳述;如果感覺(jué)不那么自信,那么陳述就不那么令人印象深刻。因此,Project Debater對(duì)反駁意見(jiàn)不是很有信心,所以它基本上把Zafrir當(dāng)成一個(gè)騙子。有趣的是,這大概是這個(gè)系統(tǒng)整個(gè)晚上做的最人性化的事情。
構(gòu)建新AI系統(tǒng)困難重重
在此之前,人工智能可以對(duì)關(guān)鍵詞搜索回復(fù)簡(jiǎn)單的問(wèn)題或要求,比如“一升多少盎司?”或者“致電媽媽”,這為人們?nèi)粘I钐峁O大便利。Project Debater則開(kāi)始探索新的領(lǐng)域:吸收了大量不同的信息和觀點(diǎn),幫助人們建立有說(shuō)服力的論點(diǎn)并做出明智的決定。
構(gòu)建系統(tǒng)是一項(xiàng)非常困難和復(fù)雜的挑戰(zhàn)。Slonim說(shuō),為了使Project Debater成為可能,研究人員開(kāi)發(fā)了數(shù)十篇研究論文中記載的許多創(chuàng)新技術(shù)。雖然準(zhǔn)備辯論和反駁或理解對(duì)手的論點(diǎn)可能需要大量的技術(shù),但辯論者的大部分對(duì)話仍然可以直接從文章中提取出來(lái)。
圖為研究人員Noam Slonim和Project Debater機(jī)器的合影
過(guò)去六年來(lái),IBM以色列海法實(shí)驗(yàn)室領(lǐng)導(dǎo)的全球IBM研究團(tuán)隊(duì)賦予了Project Debater三種功能,每種功能都在AI方面開(kāi)辟了新的天地:首先是數(shù)據(jù)驅(qū)動(dòng)的語(yǔ)音編寫(xiě)和交付功能;其次,聽(tīng)力理解能夠識(shí)別隱藏在人類(lèi)連續(xù)冗長(zhǎng)的自然語(yǔ)音中的關(guān)鍵主張,并構(gòu)建有意義的反駁;第三,系統(tǒng)的模擬人類(lèi)困境,基于一個(gè)獨(dú)特的知識(shí)圖譜,提煉出原則性的論點(diǎn)。
辯論的形式為這些核心能力提供了理想的測(cè)試基礎(chǔ)。辯論規(guī)則源于人類(lèi)的討論文化,論證的內(nèi)核往往是內(nèi)在的主觀的。Project Debater必須適應(yīng)人的理性和思考邏輯,并提出人們可以理解和接受的論點(diǎn)。在辯論中,人工智能必須學(xué)會(huì)在凌亂的非結(jié)構(gòu)化人類(lèi)世界中進(jìn)行導(dǎo)航和檢索,而不是像在棋盤(pán)游戲中那樣使用預(yù)先定義的規(guī)則。
與Big Blue在國(guó)際象棋中打敗國(guó)際象棋大師Gary Kasparov、DeepMind的AlphaGo擊敗世界頂級(jí)圍棋選手不同,辯論比其他比賽更加細(xì)致,與會(huì)者通過(guò)投票來(lái)決定本場(chǎng)比賽的最佳辯手,而人工智能通常擁有勝過(guò)人類(lèi)豐富觀眾知識(shí)的能力,Ranit Aharanov如是說(shuō)。
結(jié)語(yǔ):Project Debater有助于人類(lèi)做出明智的決定
Project Debater讓我們更接近人工智能的一個(gè)巨大界限:掌握語(yǔ)言。它是IBM一系列主要AI創(chuàng)新產(chǎn)品中的最新產(chǎn)品,其它產(chǎn)品還包括1997年獲得國(guó)際象棋世界冠軍Garry Kasparov的IBM深?!癉eep Blue”,以及2011年在Jeopardy上擊敗人類(lèi)冠軍的超級(jí)智能系統(tǒng)沃森(Watson)。
盡管Project Debater的工作還遠(yuǎn)遠(yuǎn)沒(méi)有完成,它有時(shí)會(huì)像人一樣犯錯(cuò)。但在不遠(yuǎn)的將來(lái),它很有可能幫助解決數(shù)千個(gè)復(fù)雜的人類(lèi)決策。例如,幫助收集和整理某個(gè)金融事實(shí)的相關(guān)材料,或提出與公共政策有關(guān)的贊成和反對(duì)的論點(diǎn)。由于不經(jīng)常受到人類(lèi)主觀意識(shí)和偏見(jiàn)的影響,Project Debater提出的觀點(diǎn)可能會(huì)貼近事實(shí)。
Project Debater將擴(kuò)展沃森的功能,目前數(shù)十家公司正在使用沃森的功能挖掘大量?jī)?nèi)部數(shù)據(jù)集以獲得新的業(yè)務(wù)洞察力。該系統(tǒng)已經(jīng)使用了Watson Speech to Text API,并將有助于增強(qiáng)沃森的高級(jí)語(yǔ)言和對(duì)話功能。未來(lái),它的基礎(chǔ)技術(shù)也將在IBM云平臺(tái)和IBM沃森中商業(yè)化。
這對(duì)AI來(lái)說(shuō)是一個(gè)非常積極的發(fā)展。我們可以使這種變革性技術(shù)更加透明和可解釋?zhuān)@樣我們就越能信任它;而我們?cè)侥苄湃嗡驮侥軒椭覀冊(cè)谌找鎻?fù)雜的世界中做出最好、最明智的決定。
Slonim在接受采訪時(shí)告訴VentureBeat,在此次辯論賽之后,Project Debrater將在今年晚些時(shí)候參加一場(chǎng)曠日持久的辯論,隨后可能會(huì)舉行一次研討會(huì),學(xué)者可以提出他們對(duì)Project Debater的意見(jiàn)和評(píng)論。
-
IBM
+關(guān)注
關(guān)注
3文章
1736瀏覽量
74545 -
AI
+關(guān)注
關(guān)注
87文章
29383瀏覽量
267670
原文標(biāo)題:辯論屆人機(jī)大戰(zhàn):IBM新AI完勝人類(lèi)冠軍!
文章出處:【微信號(hào):drc_iite,微信公眾號(hào):全球技術(shù)地圖】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論