0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)全新打開(kāi)方式Google Brain提出概念激活向量新方法

Hf1h_BigDataDig ? 來(lái)源:YXQ ? 2019-07-31 14:11 ? 次閱讀

可解釋性仍然是現(xiàn)代深度學(xué)習(xí)應(yīng)用的最大挑戰(zhàn)之一。計(jì)算模型和深度學(xué)習(xí)研究的最新進(jìn)展使我們能夠創(chuàng)建極度復(fù)雜的模型,包括數(shù)千隱藏層和數(shù)千萬(wàn)神經(jīng)元。效果驚人的前沿深度神經(jīng)網(wǎng)絡(luò)模型構(gòu)建相對(duì)簡(jiǎn)單,但了解這些模型如何創(chuàng)造和使用知識(shí)仍然是一個(gè)挑戰(zhàn)。

最近,Google Brain團(tuán)隊(duì)的研究人員發(fā)表了一篇論文,提出了一種名為概念激活向量(Concept Activation Vectors, CAV)的新方法,它為深度學(xué)習(xí)模型的可解釋性提供了一個(gè)新的視角。

可解釋性 vs 準(zhǔn)確性

要理解CAV技術(shù),需要了解深度學(xué)習(xí)模型中可解釋性難題的本質(zhì)。在當(dāng)今一代深度學(xué)習(xí)技術(shù)中,模型的準(zhǔn)確性與可解釋性之間存在著永恒的矛盾??山忉屝?準(zhǔn)確性矛盾存在于完成復(fù)雜知識(shí)任務(wù)的能力和理解這些任務(wù)是如何完成能力之間。知識(shí)與控制,績(jī)效表現(xiàn)與可核查性,效率與簡(jiǎn)便性...任意一項(xiàng)抉擇其實(shí)都是準(zhǔn)確性和可解釋性之間的權(quán)衡。

你是關(guān)心獲得最佳結(jié)果,還是關(guān)心結(jié)果是如何產(chǎn)生的?這是數(shù)據(jù)科學(xué)家在每個(gè)深度學(xué)習(xí)場(chǎng)景中都需要回答的問(wèn)題。許多深度學(xué)習(xí)技術(shù)本質(zhì)上非常復(fù)雜,盡管它們?cè)谠S多場(chǎng)景中都很準(zhǔn)確,解釋起來(lái)卻非常困難。如果我們?cè)谝粋€(gè)準(zhǔn)確性-可解釋性圖表中繪制一些最著名的深度學(xué)習(xí)模型,我們將得到以下結(jié)果:

深度學(xué)習(xí)模型中的可解釋性不是一個(gè)單一的概念。我們可以從多個(gè)層次理解它:

要得到上圖每層定義的可解釋性,需要幾個(gè)基本的構(gòu)建模塊。在最近的一篇論文中,谷歌的研究人員概述了他們看來(lái)的一些可解釋性的基本構(gòu)建模塊。

Google總結(jié)了如下幾項(xiàng)可解釋性原則:

- 了解隱藏層的作用:深層學(xué)習(xí)模型中的大部分知識(shí)都是在隱藏層中形成的。在宏觀層面理解不同隱藏層的功能對(duì)于解釋深度學(xué)習(xí)模型至關(guān)重要。

- 了解節(jié)點(diǎn)的激活方式:可解釋性的關(guān)鍵不在于理解網(wǎng)絡(luò)中各個(gè)神經(jīng)元的功能,而在于理解同一空間位置被一起激發(fā)的互連神經(jīng)元群。通過(guò)互連神經(jīng)元群對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行分割能讓我們從一個(gè)更簡(jiǎn)單的抽象層面來(lái)理解其功能。

-理解概念的形成過(guò)程:理解深度神經(jīng)網(wǎng)絡(luò)如何形成組成最終輸出的單個(gè)概念,這是可解釋性的另一個(gè)關(guān)鍵構(gòu)建模塊。

這些原則是Google新CAV技術(shù)背后的理論基礎(chǔ)。

概念激活向量

遵循前文討論的想法,通常所認(rèn)為的可解釋性就是通過(guò)深度學(xué)習(xí)模型的輸入特征來(lái)描述其預(yù)測(cè)。邏輯回歸分類(lèi)器就是一個(gè)典型的例子,其系數(shù)權(quán)重通常被解釋為每個(gè)特征的重要性。然而,大多數(shù)深度學(xué)習(xí)模型對(duì)諸如像素值之類(lèi)的特征進(jìn)行操作,這些特征與人類(lèi)容易理解的高級(jí)概念并不對(duì)應(yīng)。此外,模型的內(nèi)部值(例如,神經(jīng)元激活)也很晦澀難懂。雖然諸如顯著圖之類(lèi)的技術(shù)可以有效測(cè)量特定像素區(qū)域的重要性,但是它們無(wú)法與更高層級(jí)的概念相關(guān)聯(lián)。

CAV背后的核心思想是衡量一個(gè)概念在模型輸出中的相關(guān)性。概念的CAV就是一組該概念的實(shí)例在不同方向的值(例如,激活)構(gòu)成的向量。在論文中,Google研究團(tuán)隊(duì)概述了一種名為Testing with CAV(TCAV)的線(xiàn)性可解釋方法,該方法使用偏導(dǎo)數(shù)來(lái)量化預(yù)測(cè)CAV表示的潛在高級(jí)概念的敏感度。他們構(gòu)想TCAV定義有四個(gè)目標(biāo):

- 易懂:使用者幾乎不需要機(jī)器學(xué)習(xí)專(zhuān)業(yè)知識(shí)。

- 個(gè)性化:適應(yīng)任何概念(例如,性別),并且不限于訓(xùn)練中涉及的概念。

- 插入即用:無(wú)需重新訓(xùn)練或修改機(jī)器學(xué)習(xí)模型即可運(yùn)作。

- 全局量化:可以使用單一定量測(cè)度來(lái)解釋所有類(lèi)或所有實(shí)例,而非僅僅解釋單個(gè)數(shù)據(jù)輸入。

為實(shí)現(xiàn)上述目標(biāo),TCAV方法分為三個(gè)基本步驟:

1)為模型定義相關(guān)概念。

2)理解預(yù)測(cè)對(duì)這些概念的敏感度。

3)推斷每個(gè)概念對(duì)每個(gè)模型預(yù)測(cè)類(lèi)的相對(duì)重要性的全局定量解釋。

TCAV方法的第一步是定義相關(guān)的概念(CAV)。為實(shí)現(xiàn)此目的,TCAV選擇一組代表該概念的實(shí)例或?qū)ふ覙?biāo)記為該概念的獨(dú)立數(shù)據(jù)集。我們可以通過(guò)訓(xùn)練線(xiàn)性分類(lèi)器區(qū)分概念實(shí)例產(chǎn)生的激活和各層中的實(shí)例來(lái)學(xué)習(xí)CAV。

第二步是生成一個(gè)TCAV分?jǐn)?shù),用于量化預(yù)測(cè)對(duì)特定概念的敏感度。TCAV使用了用于衡量ML預(yù)測(cè)值在某一概念方向、在激活層對(duì)輸入敏感度的偏導(dǎo)數(shù)。

最后一步嘗試評(píng)估學(xué)到的CAV的全局相關(guān)性,避免依賴(lài)不相關(guān)的CAV。畢竟TCAV技術(shù)的一個(gè)缺陷就是可能學(xué)到無(wú)意義的CAV,因?yàn)槭褂秒S機(jī)選擇的一組圖像仍然能得到CAV,在這種隨機(jī)概念上的測(cè)試不太可能有意義。為了應(yīng)對(duì)這一難題,TCAV引入了統(tǒng)計(jì)顯著性檢驗(yàn),該檢驗(yàn)以隨機(jī)的訓(xùn)練次數(shù)(通常為500次)評(píng)估CAV。其基本思想是,有意義的概念應(yīng)該在多次訓(xùn)練中得到一致的TCAV分?jǐn)?shù)。

TCAV的運(yùn)作

團(tuán)隊(duì)進(jìn)行了多次實(shí)驗(yàn)來(lái)評(píng)估TCAV相比于其他可解釋性方法的效率。在一項(xiàng)最引人注目的測(cè)試中,團(tuán)隊(duì)使用了一個(gè)顯著圖,嘗試預(yù)測(cè)出租車(chē)這一概念與標(biāo)題或圖像的相關(guān)性。顯著圖的輸出如下所示:

使用這些圖像作為測(cè)試數(shù)據(jù)集,Google Brain團(tuán)隊(duì)在Amazon Mechanical Turk上邀請(qǐng)50人進(jìn)行了實(shí)驗(yàn)。每個(gè)實(shí)驗(yàn)人員執(zhí)行一系列共六個(gè)針對(duì)單個(gè)模型的隨機(jī)順序任務(wù)(3類(lèi)對(duì)象 x 2種顯著圖)。

在每項(xiàng)任務(wù)中,實(shí)驗(yàn)人員首先會(huì)看到四幅圖片和相應(yīng)的顯著性蒙版。然后,他們要評(píng)估圖像對(duì)模型的重要程度(10分制),標(biāo)題對(duì)模型的重要程度(10分制),以及他們對(duì)答案的自信程度(5分制)。實(shí)驗(yàn)人員總共評(píng)定了60個(gè)不同的圖像(120個(gè)不同的顯著圖)。

實(shí)驗(yàn)的基本事實(shí)是圖像概念比標(biāo)題概念更相關(guān)。然而,看顯著圖時(shí),人們認(rèn)為標(biāo)題概念更重要(0%噪聲的模型),或者辨別不出差異(具有100%噪聲的模型)。相比之下,TCAV結(jié)果正確地表明圖像概念更重要。

TCAV是這幾年最具創(chuàng)新性的神經(jīng)網(wǎng)絡(luò)解釋方法之一。初始的代碼可以在GitHub上看到。許多主流深度學(xué)習(xí)框架可能會(huì)在不久的將來(lái)采用這些想法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6104

    瀏覽量

    104783
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5437

    瀏覽量

    120791

原文標(biāo)題:谷歌大腦發(fā)布概念激活向量,了解神經(jīng)網(wǎng)絡(luò)的思維方式

文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    保護(hù)4-20 mA,±20-mA模擬輸入的新方法

    電子發(fā)燒友網(wǎng)站提供《保護(hù)4-20 mA,±20-mA模擬輸入的新方法.pdf》資料免費(fèi)下載
    發(fā)表于 09-24 09:27 ?0次下載
    保護(hù)4-20 mA,±20-mA模擬輸入的<b class='flag-5'>新方法</b>

    實(shí)踐JLink 7.62手動(dòng)增加新MCU型號(hào)支持新方法

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是實(shí)踐JLink 7.62手動(dòng)增加新MCU型號(hào)支持新方法。
    的頭像 發(fā)表于 08-08 15:25 ?477次閱讀
    實(shí)踐JLink 7.62手動(dòng)增加新MCU型號(hào)支持<b class='flag-5'>新方法</b>

    新品|酷暑的新打開(kāi)方式:SXB3568主板

    開(kāi)源鴻蒙硬件方案領(lǐng)跑者觸覺(jué)智能選主板,接口雜太多?成本太高?性能不夠?來(lái)看看觸覺(jué)智能全新推出基于RockchipRK3568處理器開(kāi)發(fā)設(shè)計(jì)的SXB3568商顯行業(yè)主板,低成本、高性能、全功能模塊拓展
    的頭像 發(fā)表于 07-13 08:33 ?270次閱讀
    新品|酷暑的新<b class='flag-5'>打開(kāi)方式</b>:SXB3568主板

    一種利用光電容積描記(PPG)信號(hào)和深度學(xué)習(xí)模型對(duì)高血壓分類(lèi)的新方法

    使用的方法將在以下部分中詳細(xì)闡述。 AlexNet是一種深度卷積神經(jīng)網(wǎng)絡(luò),由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton在2012年提出。整體結(jié)構(gòu)由5個(gè)卷積
    發(fā)表于 05-11 20:01

    軋機(jī)牌坊滑板壓虧修復(fù)的新方法

    電子發(fā)燒友網(wǎng)站提供《軋機(jī)牌坊滑板壓虧修復(fù)的新方法.docx》資料免費(fèi)下載
    發(fā)表于 03-14 16:16 ?0次下載

    氫壓機(jī)軸承位磨損維修的新方法

    電子發(fā)燒友網(wǎng)站提供《氫壓機(jī)軸承位磨損維修的新方法.docx》資料免費(fèi)下載
    發(fā)表于 03-01 16:23 ?0次下載

    一種產(chǎn)生激光脈沖新方法

    等離子體中脈沖壓縮的概念 英國(guó)和韓國(guó)的科學(xué)家提出了一種產(chǎn)生激光脈沖的新方法,其功率是現(xiàn)有激光脈沖的1000多倍。 科學(xué)家們使用計(jì)算機(jī)模擬聯(lián)合研究,展示了一種壓縮光的新方法,以充分提高光
    的頭像 發(fā)表于 12-07 06:32 ?424次閱讀
    一種產(chǎn)生激光脈沖<b class='flag-5'>新方法</b>

    IC封裝中快速創(chuàng)建結(jié)構(gòu)的新方法

    IC封裝中快速創(chuàng)建結(jié)構(gòu)的新方法
    的頭像 發(fā)表于 12-06 16:34 ?499次閱讀
    IC封裝中快速創(chuàng)建結(jié)構(gòu)的<b class='flag-5'>新方法</b>

    應(yīng)對(duì)傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線(xiàn)和集成的新方法

    應(yīng)對(duì)傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線(xiàn)和集成的新方法
    的頭像 發(fā)表于 12-05 15:32 ?493次閱讀
    應(yīng)對(duì)傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線(xiàn)和集成的<b class='flag-5'>新方法</b>

    基于PMSM 控制系統(tǒng)仿真建模的新方法

    電子發(fā)燒友網(wǎng)站提供《基于PMSM 控制系統(tǒng)仿真建模的新方法.pdf》資料免費(fèi)下載
    發(fā)表于 11-29 11:22 ?1次下載
    基于PMSM 控制系統(tǒng)仿真建模的<b class='flag-5'>新方法</b>

    一種產(chǎn)生激光脈沖的新方法

    英國(guó)和韓國(guó)的科學(xué)家提出了一種產(chǎn)生激光脈沖的新方法,其功率是現(xiàn)有激光脈沖的1000多倍。
    的頭像 發(fā)表于 11-20 16:56 ?504次閱讀
    一種產(chǎn)生激光脈沖的<b class='flag-5'>新方法</b>

    VLSI系統(tǒng)設(shè)計(jì)的最新方法

    電子發(fā)燒友網(wǎng)站提供《VLSI系統(tǒng)設(shè)計(jì)的最新方法.pdf》資料免費(fèi)下載
    發(fā)表于 11-20 11:10 ?0次下載
    VLSI系統(tǒng)設(shè)計(jì)的最<b class='flag-5'>新方法</b>

    FPGA新IP核學(xué)習(xí)的正確打開(kāi)方式

    的情況時(shí),總會(huì)遇到一些以前未曾接觸過(guò)的新內(nèi)容,這些新內(nèi)容會(huì)讓我們感到陌生和恐懼,不知道該如何下手。 那么今天以xilinx vivado 為例分享學(xué)習(xí)FPGA 新IP核的正確打開(kāi)方式。 一、常規(guī)
    發(fā)表于 11-17 11:09

    戶(hù)外全彩LED顯示屏亮度色度檢測(cè)新方法

    電子發(fā)燒友網(wǎng)站提供《戶(hù)外全彩LED顯示屏亮度色度檢測(cè)新方法.doc》資料免費(fèi)下載
    發(fā)表于 11-02 11:05 ?1次下載
    戶(hù)外全彩LED顯示屏亮度色度檢測(cè)<b class='flag-5'>新方法</b>

    一種改善微波模塊增益指標(biāo)溫度特性的新方法

    電子發(fā)燒友網(wǎng)站提供《一種改善微波模塊增益指標(biāo)溫度特性的新方法.pdf》資料免費(fèi)下載
    發(fā)表于 10-25 10:05 ?0次下載
    一種改善微波模塊增益指標(biāo)溫度特性的<b class='flag-5'>新方法</b>