0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌大腦開發(fā)人類翻譯器 打破AI黑盒新方式

電子工程師 ? 來源:cc ? 2019-01-29 09:59 ? 次閱讀

如果一個醫(yī)生告訴你需要做手術,你肯定會想知道為什么,進一步地,你會希望他給你一個就算沒學過醫(yī)也能聽得懂的明確解釋。谷歌大腦(Google Brain)的研究科學家Been Kim認為,我們應該對人工智能抱有同樣的期望。作為“可解釋”機器學習的專家,她希望構建一個能夠向任何人解釋人工智能的軟件。

自從十年前人工智能興起以來,人工智能中的神經網絡技術已經從電子郵件滲透到了藥物研究等各個方面,它具有越來越強大的能力來學習和識別出數(shù)據(jù)中的模式。

但這種能力帶來了一個讓人頭疼的問題:現(xiàn)代深度學習網絡之所以能夠實現(xiàn)自動駕駛和保險欺詐識別這樣的壯舉,主要原因在于網絡的復雜性,其復雜度之高讓神經網絡專家也不能解釋清楚網絡內部到底是怎么工作的。

如果一個神經網絡被訓練來識別有患肝癌和精神分裂癥等疾病風險的患者,例如2015年紐約Mount Sinai醫(yī)院的“深度患者”系統(tǒng),我們無法得知網絡關注的是數(shù)據(jù)中的哪些特征,因為神經網絡的層數(shù)太多了,每層中神經元還有成百上千個連接。

越來越多的行業(yè)正在試圖通過人工智能實現(xiàn)自動化決策或增強他們的決策制定依據(jù),這個所謂的黑盒問題不是技術上的問題,而是神經網路的根本性缺陷。

DARPA的“XAI”項目(針對“可解釋的人工智能”)正在積極鉆研這個問題,可解釋性在機器學習中的地位越來越高。Kim認為:“人工智能正處于發(fā)展的關鍵時刻,我們需要判斷這項技術是否對我們有益。如果我們不能解決可解釋性問題,人工智能的發(fā)展可能會受到阻礙甚至被放棄?!?/p>

Kim和她在Google Brain的同事最近開發(fā)了一個名為“概念激活向量測試”(TCAV)的系統(tǒng),她將該系統(tǒng)描述為“人類翻譯器”,允許用戶查詢黑盒人工智能工作過程,即一個特定的高級概念在其訓練中發(fā)揮了多大作用。例如,如果一個機器學習系統(tǒng)被訓練來識別圖像中的斑馬,那么人們可以使用TCAV來確定系統(tǒng)在做出決策時“條紋”特征起了多重要的作用。

TCAV最初是在用于識別圖像的機器學習模型上進行測試的,但它也適用于文本和某些特定類型圖形數(shù)據(jù)(如腦電圖波形)的模型。 Kim表示,TCAV的通用性讓它能夠解釋許多不同的模型。

在Quanta雜志的采訪中Kim討論了可解釋性意味著什么,以及它為什么現(xiàn)在受到了這么多的關注。下面是一個經過編輯和濃縮的采訪版本。

Q:你的職業(yè)生涯專注于機器學習的“可解釋性”,但那個詞究竟意味著什么呢?

A:可解釋性有兩個重要意義。對于科學研究來說:如果你把神經網絡作為研究對象,那么你就可以進行科學實驗來真正理解模型的訓練過程、神經元是如何反饋信息等各種細節(jié)。

而對于實際應用來說:用戶不必了解模型的每一個細節(jié),只要用戶能夠正確地使用該工具即可。這個方面是我最關注的,也是我們最終想要達到的目標。

Q:你為什么會對一個你不完全理解運作細節(jié)的系統(tǒng)有信心?

A:我給你打個比方。假設我后院有一棵樹,我想砍掉它,我可能會選擇使用電鋸去鋸樹。雖然現(xiàn)在,我不太了解電鋸的工作原理是什么,但電鋸的使用手冊上說明了使用步驟等信息,我可以安全地使用它。所以,有了這本手冊,我更愿意使用省時省力的電鋸,而不是更安全的手鋸。

就好像你知道怎么運用神經網絡,但是你不完全知道這個機制是如何實現(xiàn)的?

對。這就是第二個可解釋性的目標是:我們能充分理解一個工具,以便安全地使用它。我們可以通過確認工具中反映出的有用的人類知識來形成理解。

Q:“反映人類知識體系”為什么會使黑盒子AI變得更容易理解?

A:再舉個例子解釋一下,如果醫(yī)生使用機器學習模型來進行癌癥診斷,那么醫(yī)生會想確認,該模型沒有關注不必要的數(shù)據(jù)點。確保這一點的一種方法就是確認機器學習模型會做一些醫(yī)生想要做的事情,換句話說,就是證明模型學習到了醫(yī)生的診斷知識。

因此,如果醫(yī)生正在使用一個細胞標本來診斷癌癥,他們是為了在標本中尋找一種叫做“融合腺”的東西。同時,他們還需要考慮患者的年齡,以及患者過去是否接受過化療等情況。這些都是醫(yī)生診斷癌癥時關心的因素,如果我們能證明機器學習模型也注意到了這些因素,那么模型就更容易被理解了,因為它反映了醫(yī)生的知識體系。

Google Brain的Been Kim正在研究如何讓我們理解機器學習系統(tǒng)做出的決定。

Q:那這就是TCAV的作用嗎?是為了揭示機器學習模型正在使用哪些高級概念來做出決策嗎?

A:對。在此之前,可解釋性方法只解釋了神經網絡在“輸入特征”方面所做的工作。簡單來說,如果你有一張圖像,每個像素都作為一個輸入特征。事實上,Yann Lecun(一位早期的深度學習先驅,目前是Facebook的人工智能研究主管)認為,神經網絡模型已經具有可解釋性,因為你可以查看神經網絡中的每個節(jié)點,并查看每個輸入功能的數(shù)值。這對計算機來說沒問題,但人類的思維表示不是這樣的。我不會跟你說圖像的 100到200像素的RGB值是0.2和0.3,我會告訴你照片中狗的毛發(fā)特別蓬松,這就是人類描述的方式,我們是通過概念來溝通的。

Q:TCAV如何把輸入特征轉換為概念?

A:讓我們回到醫(yī)生使用機器學習模型的例子,例子中已經訓練過的模型對細胞標本的圖像進行分類以確定潛在的癌癥。作為醫(yī)生,你可能想知道“融合腺體”的概念在預測癌癥時對模型的重要性。首先你要收集一些有融合腺體的圖像示例——假設你收集了20 幅。然后,你將這些帶標簽的示例輸入到模型中。

TCAV在模型內部的作用被稱為“靈敏度測試”。當我們添加這些標記為融合腺體的圖片時,癌癥陽性預測的概率增加了多少,可以用0到1之間的數(shù)值來表示,那就是你的TCAV分數(shù)。如果概率增加,那么這是模型的一個重要概念。如果沒有,則不是一個重要概念。

Q:“概念”是一個模糊的術語。有沒有TCAV不起作用的時候?

A:如果你無法使用數(shù)據(jù)集的某些子集來描述你的概念,那么它就不起作用。如果你的機器學習模型是用圖像訓練的,那么這個概念必須得是可視化表達的。比方說我想在視覺上表達“愛情”的概念就真的很難。

我們也仔細驗證了這個概念。我們有一個統(tǒng)計測試程序,如果一個概念向量對模型的影響與隨機向量相同,那么這個概念向量就會被程序拋棄。如果你的概念沒有通過這個測試,那么TCAV會說:“我不知道。這個概念看起來不像對模型很重要的東西?!?/p>

Q:TCAV主要是用于在AI中建立信任,而不是真正理解它嗎?

A:不,不是這樣。接下來我會解釋原因,因為它很好區(qū)分。

我們從認知學和心理學的反復研究中得知人類非常容易上當受騙。這意味著,騙一個人相信任某些東西實際上很容易。而機器學習的可解釋性的目標正與此相反,它是要告訴你,使用某系統(tǒng)是否安全,并揭露背后的真相,所以“信任”這個詞的表達并不準確。

Q:所以“可解釋性”的意思是揭示AI推理中的潛在缺陷?

A:是的,正是這樣。

Q:它如何揭示這些潛在缺陷?

A:您可以使用TCAV向受過訓練的模型詢問不相關的概念?;氐绞褂肁I進行癌癥預測的醫(yī)生的例子,醫(yī)生可能會突然想到,“看起來機器對于許多帶藍色的圖像給出癌癥陽性預測。我們認為不應該考慮這個因素?!币虼?,如果TCAV對于“藍色”給出高評分,那么他們就發(fā)現(xiàn)了機器學習模型中的一個問題。

TCAV旨在找出現(xiàn)有不可解釋的AI系統(tǒng)。那為什么不從一開始就使用可解釋的系統(tǒng),而要使用黑盒呢?

可解釋性研究的其中一個方面是構建反映人類理解過程的固有可解釋模型。但我認為:現(xiàn)在許多用于重要目的AI模型在一開始都沒有考慮可解釋性,這才是事實。比如,我們谷歌就有很多!你可以說,“既然解釋性是如此有用,那我為你建立另一個模型來取代你現(xiàn)有的模型吧。”好吧,那就祝你好運。

Q:那么你下一步要做什么?

決定這項技術是否對我們有利對我們來說仍然很關鍵。這就是我使用“事后可解釋性”方法的原因。如果某人給你一個模型并且你無法改變它,你如何為其行為生成解釋,以便你可以安全地使用它?這就是TCAV的工作。

Q:TCAV可以讓人類詢問AI某概念是否重要。但是如果我們不知道該問什么怎么辦?如果我們想讓AI系統(tǒng)自己給出解釋呢?

A:我們目前正在編寫的系統(tǒng)可以自動發(fā)掘概念。我們稱之為DTCAV——發(fā)掘型TCAV。但實際上,我認為增加人為操作,并實現(xiàn)機器與人之間的對話,是實現(xiàn)可解釋性的關鍵。

很多時候,在高風險的應用程序中,領域專家已經有了他們關心的概念列表。我們在Google Brain的醫(yī)療應用中不止一次看到這一點。他們不希望模型自己找出一系列概念——他們想要告訴模型他們感興趣的概念。我們與治療糖尿病視網膜病變(一種眼疾)的醫(yī)生一起工作,當我們告訴她什么是TCAV的時候她非常興奮,因為她已經有很多關于這個模型可能做什么的假設,現(xiàn)在她正好可以驗證一下這些假設。TCAV實際上很有優(yōu)勢,因為它是一種以用戶為中心的協(xié)作機器學習方式。

Q:AI技術非常強大,你真的認為人們會因為其不具備可解釋性而放棄使用嗎?

A:是的,我認為是這樣。在專家系統(tǒng)上已經發(fā)生過類似的事情了。20世紀80年代,使用專家系統(tǒng)執(zhí)行某些任務比雇傭人類操作員要便宜的多。但是現(xiàn)在誰還在使用專家系統(tǒng)?沒人。因此,很久以后我們也可能會放棄使用AI技術。

當然目前放棄AI不太可能,因為AI現(xiàn)在被炒的很熱,而且已經投入了大量的資金。但從長遠來看,我認為人類可能會判定這種技術不適合我們,或許是出于恐懼,或許是因為其缺乏可解釋性,這都是有可能的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6106

    瀏覽量

    104837
  • AI
    AI
    +關注

    關注

    87

    文章

    29456

    瀏覽量

    267775

原文標題:谷歌大腦開發(fā)機器思維的“人類翻譯器”,打破AI“黑盒”新方式

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    谷歌:聚焦AI與技術創(chuàng)新,攜手中國開發(fā)者共筑未來

    2024年8月9日,備受矚目的谷歌開發(fā)者大會——I/O Connect China圓滿落幕。此次盛會,谷歌面向中國廣大的開發(fā)者群體,全面展示了其在人工智能(
    的頭像 發(fā)表于 08-09 17:03 ?816次閱讀

    谷歌Chrome瀏覽新增三大AI功能,提升用戶體驗

    谷歌近日宣布,在其廣受歡迎的Chrome瀏覽中引入了三項前沿的AI技術功能,旨在為用戶提供更加智能、便捷的瀏覽體驗。這些新功能由Gemini技術強力驅動,目前已在Chrome桌面版上線,標志著
    的頭像 發(fā)表于 08-05 11:26 ?602次閱讀

    如何在Python中開發(fā)人工智能

    在Python中開發(fā)人工智能(AI)是一個廣泛而深入的主題,它涵蓋了從基礎的數(shù)據(jù)處理到復雜的機器學習、深度學習以及自然語言處理等多個領域。
    的頭像 發(fā)表于 07-15 15:01 ?1524次閱讀

    微軟、谷歌等科技巨頭承諾安全開發(fā)AI模型

    近日,微軟、谷歌、OpenAI等16家科技巨頭在“人工智能(AI)首爾峰會”上達成共識,承諾在AI模型的開發(fā)過程中注重安全性,并在無法控制最極端風險時關閉其尖端系統(tǒng)。
    的頭像 發(fā)表于 05-22 11:25 ?457次閱讀

    谷歌發(fā)布多模態(tài)AI新品,加劇AI巨頭競爭

    在全球AI競技場上,谷歌與OpenAI一直穩(wěn)居領先地位。近日,谷歌在I/O開發(fā)者大會上掀起了一股新的技術浪潮,發(fā)布了多款全新升級的多模態(tài)AI
    的頭像 發(fā)表于 05-16 09:28 ?397次閱讀

    英偉達壟斷地位遭挑戰(zhàn),谷歌、高通聯(lián)手打破

    然而,一家名為UXL的聯(lián)合體正在努力打破這一局面。該機構由高通、谷歌、英特爾、ARM等諸多知名科技巨頭構成,意欲引導開發(fā)者從對英偉達芯片的依賴中走出,降低英偉達在AI領域的壟斷性優(yōu)勢。
    的頭像 發(fā)表于 03-26 15:24 ?413次閱讀

    谷歌發(fā)布開源AI大模型Gemma

    近日,谷歌發(fā)布了全新AI大模型Gemma,這款模型為各種規(guī)模的組織提供了前所未有的機會,以負責任的方式在商業(yè)應用中進行分發(fā)。
    的頭像 發(fā)表于 02-28 17:38 ?768次閱讀

    谷歌發(fā)布輕量級開源人工智能模型Gemma

    谷歌近日宣布推出開源人工智能(AI)模型系列Gemma,旨在為開發(fā)人員和研究人員提供一個負責任的AI構建平臺。這一舉措標志著自2022年OpenAI的ChatGPT引領
    的頭像 發(fā)表于 02-23 11:38 ?746次閱讀

    【國產FPGA+OMAPL138開發(fā)板體驗】(原創(chuàng))5.FPGA的AI加速源代碼

    OMAP-L138(定點/浮點DSP C674x+ARM9)+ FPGA處理開發(fā)板。 編寫一個用于AI加速的FPGA程序是一個相當復雜的過程,涉及硬件描述語言(如VHDL或Verilog)以及針對特定
    發(fā)表于 02-12 16:18

    谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企

    近日,剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創(chuàng)辦了一家名為“AI Agent”的創(chuàng)企。Ioannis Antonoglou常駐倫敦,此前曾擔任谷歌
    的頭像 發(fā)表于 02-04 10:02 ?688次閱讀

    NXT4559SIM卡接口級翻譯器產品介紹

    電子發(fā)燒友網站提供《NXT4559SIM卡接口級翻譯器產品介紹.pdf》資料免費下載
    發(fā)表于 01-03 16:30 ?0次下載
    NXT4559SIM卡接口級<b class='flag-5'>翻譯器</b>產品介紹

    谷歌發(fā)布全新AI SDK,簡化安卓應用集成

    谷歌破繭而出,全新發(fā)布 Google AI SDK,引領 Android 應用邁向高性能 AI 集成新時代。這次發(fā)布的 SDK,專門為 Android 應用打造,將 Gemini Pro 模型的能力無縫融入應用中。對于
    的頭像 發(fā)表于 01-03 14:18 ?745次閱讀

    背靠人類第四大科學計劃,腦虎科技如何讓大腦連接未來

    電子發(fā)燒友網報道(文/周凱揚)人的大腦可以被視為一個微縮的宇宙,但它也是我們人類最脆弱、最重要和最復雜的器官。而腦計劃是我們人類繼曼哈頓計劃、阿波羅計劃和人類基因組計劃后的第四大計劃,
    的頭像 發(fā)表于 12-21 15:39 ?4534次閱讀
    背靠<b class='flag-5'>人類</b>第四大科學計劃,腦虎科技如何讓<b class='flag-5'>大腦</b>連接未來

    谷歌推出AI驅動的代碼補全和生成工具Duet AI

    谷歌稱,Duet AI現(xiàn)在可運用上述合作伙伴的數(shù)據(jù),協(xié)助開發(fā)者們編寫相關平臺的代碼。它還將與Datadog、JetBrains及Langchain等公司的文檔和知識資源相結合,以協(xié)助開發(fā)
    的頭像 發(fā)表于 12-14 11:22 ?831次閱讀

    人類認知如何幫助我們制造更好的AI系統(tǒng)?

    我們重點關注“一致性”問題,即AI系統(tǒng)思考和表征世界的方式人類相比,有多大的一致性?我們需要做的是進行更多的研究,找出AI系統(tǒng)擅長的事情,并幫助人們了解在哪些情況下可以與這些
    的頭像 發(fā)表于 11-15 16:34 ?356次閱讀