0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

卷積神經(jīng)網(wǎng)絡(luò)四種卷積類型

Dbwd_Imgtec ? 來(lái)源:lp ? 2019-04-19 16:48 ? 次閱讀

使用內(nèi)核大小為3,步長(zhǎng)為1和填充的2D卷積

一般卷積

首先,我們需要就定義卷積層的一些參數(shù)達(dá)成一致。

卷積核大小(KernelSize):卷積核定義了卷積的大小范圍,二維卷積核最常見(jiàn)的就是3*3的卷積核。

步長(zhǎng)(Stride):步長(zhǎng)定義了當(dāng)卷積核在圖像上面進(jìn)行卷積操作的時(shí)候,每次卷積跨越的長(zhǎng)度。在默認(rèn)情況下,步長(zhǎng)通常為1,但我們也可以采用步長(zhǎng)是2的下采樣過(guò)程,類似于MaxPooling操作。

填充(Padding):卷積層采用一定數(shù)量的輸入通道(I),并且設(shè)計(jì)特定數(shù)量的輸出通道(O)。每一層所需的參數(shù)可以通過(guò)I*O*K來(lái)進(jìn)行計(jì)算,其中K等于卷積核的數(shù)量。

輸入和輸出管道(Input&OutputChannels):卷積層采用一定數(shù)量的輸入通道

擴(kuò)張的卷積

使用3內(nèi)核進(jìn)行2D卷積,擴(kuò)展率為2且無(wú)填充

擴(kuò)張的卷積為卷積層引入另一個(gè)參數(shù),稱為擴(kuò)張率。這定義了卷積核中值之間的間距。擴(kuò)張率為2的3x3內(nèi)核與5x5內(nèi)核具有相同的視野,而僅使用9個(gè)參數(shù)。想象一下,獲取一個(gè)5x5內(nèi)核并刪除每一個(gè)第二列和第二行(間隔刪除),就是我們介紹的卷積。

這以相同的計(jì)算成本提供了更寬的視野。擴(kuò)張卷積在實(shí)時(shí)分割領(lǐng)域中特別受歡迎。如果您需要廣泛的視野并且無(wú)法承受多個(gè)卷積或更大的核,請(qǐng)使用它們。

轉(zhuǎn)置卷積

(又稱解卷積或分?jǐn)?shù)跨度卷積)

有些消息來(lái)源使用名稱deconvolution,這是不合適的,因?yàn)樗皇墙饩矸e。為了使事情更糟,確實(shí)存在解卷積,但它們?cè)?a target="_blank">深度學(xué)習(xí)領(lǐng)域并不常見(jiàn)。實(shí)際的反卷積會(huì)使卷積過(guò)程恢復(fù)。想象一下,將圖像輸入到單個(gè)卷積層中。現(xiàn)在取出輸出,將它扔進(jìn)一個(gè)黑盒子里然后再出現(xiàn)原始圖像。這個(gè)黑盒子進(jìn)行反卷積。它是卷積層的數(shù)學(xué)逆。

轉(zhuǎn)置卷積有點(diǎn)類似,因?yàn)樗a(chǎn)生與假設(shè)的反卷積層相同的空間分辨率。但是,對(duì)值執(zhí)行的實(shí)際數(shù)學(xué)運(yùn)算是不同的。轉(zhuǎn)置卷積層執(zhí)行常規(guī)卷積,但恢復(fù)其空間變換。

2D卷積,沒(méi)有填充,步幅為2,內(nèi)核為3

此時(shí)你應(yīng)該很困惑,讓我們看一個(gè)具體的例子。將5×5的圖像送入卷積層。步幅設(shè)置為2,填充停用,內(nèi)核為3x3。這導(dǎo)致2x2圖像。

如果我們想要反轉(zhuǎn)這個(gè)過(guò)程,我們需要逆數(shù)學(xué)運(yùn)算,以便從我們輸入的每個(gè)像素生成9個(gè)值。然后,我們以2的步幅遍歷輸出圖像。這將是反卷積。

轉(zhuǎn)換2D卷積,沒(méi)有填充,步幅為2,內(nèi)核為3

轉(zhuǎn)置卷積不會(huì)這樣做。唯一的共同點(diǎn)是它保證輸出也是5x5圖像,同時(shí)仍然執(zhí)行正常的卷積操作。為此,我們需要在輸入上執(zhí)行一些花哨的填充。

正如您現(xiàn)在可以想象的那樣,此步驟不會(huì)從上面顛倒過(guò)程。至少不涉及數(shù)值。

它只是從之前重建空間分辨率并執(zhí)行卷積。這可能不是數(shù)學(xué)逆,但對(duì)于編碼器-解碼器架構(gòu),它仍然非常有用。這樣我們就可以將圖像的升級(jí)與卷積相結(jié)合,而不是進(jìn)行兩個(gè)單獨(dú)的處理。

可分離的卷積

在可分離的卷積中,我們可以將內(nèi)核操作分成多個(gè)步驟。讓我們將卷積表示為y=conv(x,k),其中y是輸出圖像,x是輸入圖像,k是核。簡(jiǎn)單。接下來(lái),假設(shè)k可以通過(guò)以下公式計(jì)算:k=k1.dot(k2)。這將使它成為可分離的卷積,因?yàn)槲覀兛梢酝ㄟ^(guò)用k1和k2進(jìn)行2個(gè)1D卷積來(lái)得到相同的結(jié)果,而不是用k進(jìn)行2D卷積。

Sobel X和Y濾鏡

以Sobel內(nèi)核為例,它通常用于圖像處理。你可以通過(guò)乘以向量[1,0,-1]和[1,2,1].T得到相同的內(nèi)核。在執(zhí)行相同操作時(shí),這將需要6個(gè)而不是9個(gè)參數(shù)。上面的例子顯示了所謂的空間可分卷積,據(jù)我所知,它不用于深度學(xué)習(xí)。

編輯:實(shí)際上,通過(guò)堆疊1xN和Nx1內(nèi)核層,可以創(chuàng)建與空間可分離卷積非常相似的東西。這最近在一個(gè)名為EffNet的架構(gòu)中使用,顯示了有希望的結(jié)果。

神經(jīng)網(wǎng)絡(luò)中,我們通常使用稱為深度可分離卷積的東西。這將執(zhí)行空間卷積,同時(shí)保持通道分離,然后進(jìn)行深度卷積。在我看來(lái),通過(guò)一個(gè)例子可以最好地理解它。

假設(shè)我們?cè)?6個(gè)輸入通道和32個(gè)輸出通道上有一個(gè)3x3卷積層。詳細(xì)情況是,32個(gè)3x3核遍歷16個(gè)通道中的每個(gè)通道,產(chǎn)生512(16x32)個(gè)特征映射。接下來(lái),我們通過(guò)添加它們來(lái)合并每個(gè)輸入通道中的1個(gè)特征圖。由于我們可以做32次,我們得到了我們想要的32個(gè)輸出通道。

對(duì)于同一示例中的深度可分離卷積,我們遍歷16個(gè)通道,每個(gè)通道有1個(gè)3x3內(nèi)核,為我們提供了16個(gè)特征映射?,F(xiàn)在,在合并任何東西之前,我們遍歷這16個(gè)特征映射,每個(gè)特征映射有32個(gè)1x1卷積,然后才開(kāi)始將它們加在一起。這導(dǎo)致656(16x3x3+16x32x1x1)參數(shù)與上面的4608(16x32x3x3)參數(shù)相反。

該示例是深度可分離卷積的特定實(shí)現(xiàn),其中所謂的深度乘數(shù)為1.這是迄今為止這種層的最常見(jiàn)設(shè)置。我們這樣做是因?yàn)榭臻g和深度信息可以解耦的假設(shè)??匆幌耎ception模型的表現(xiàn),這個(gè)理論似乎有效。由于其有效使用參數(shù),深度可分離卷積也用于移動(dòng)設(shè)備。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4722

    瀏覽量

    100308
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1078

    瀏覽量

    40345
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5431

    瀏覽量

    120790

原文標(biāo)題:卷積神經(jīng)網(wǎng)絡(luò)四種卷積類型

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    什么是卷積神經(jīng)網(wǎng)絡(luò)?完整的卷積神經(jīng)網(wǎng)絡(luò)(CNNS)解析

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一特殊類型神經(jīng)網(wǎng)絡(luò),在圖像上表現(xiàn)特別出色。卷積
    發(fā)表于 08-10 11:49 ?1.9w次閱讀

    利用Keras實(shí)現(xiàn)四種卷積神經(jīng)網(wǎng)絡(luò)(CNN)可視化

    Keras實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)(CNN)可視化
    發(fā)表于 07-12 11:01

    卷積神經(jīng)網(wǎng)絡(luò)如何使用

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)究竟是什么,鑒于神經(jīng)網(wǎng)絡(luò)在工程上經(jīng)歷了曲折的歷史,您為什么還會(huì)在意它呢? 對(duì)于這些非常中肯的問(wèn)題,我們似乎可以給出相對(duì)簡(jiǎn)明的答案。
    發(fā)表于 07-17 07:21

    什么是圖卷積神經(jīng)網(wǎng)絡(luò)

    卷積神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 08-20 12:05

    卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)是什么

    卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)
    發(fā)表于 05-05 18:12

    卷積神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu)和常用框架

      卷積神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu)  卷積神經(jīng)網(wǎng)絡(luò)的常用框架
    發(fā)表于 12-29 06:16

    卷積神經(jīng)網(wǎng)絡(luò)一維卷積的處理過(guò)程

    。本文就以一維卷積神經(jīng)網(wǎng)絡(luò)為例談?wù)勗趺磥?lái)進(jìn)一步優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)使用的memory。文章(卷積神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 12-23 06:16

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    十余年來(lái)快速發(fā)展的嶄新領(lǐng)域,越來(lái)越受到研究者的關(guān)注。卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型是深度學(xué)習(xí)模型中最重要的一經(jīng)典結(jié)構(gòu),其性能在近年來(lái)深度學(xué)習(xí)任務(wù)上逐步提高。由于可以自動(dòng)學(xué)習(xí)樣本數(shù)據(jù)的特征表示,
    發(fā)表于 08-02 10:39

    卷積神經(jīng)網(wǎng)絡(luò)原理:卷積神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)算法

    卷積神經(jīng)網(wǎng)絡(luò)原理:卷積神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)算法 卷積
    的頭像 發(fā)表于 08-17 16:30 ?1337次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 卷積神經(jīng)網(wǎng)絡(luò)通常用來(lái)處理什么

    卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 卷積神經(jīng)網(wǎng)絡(luò)通常用來(lái)處理什么 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Ne
    的頭像 發(fā)表于 08-21 16:41 ?4771次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)概述 卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn) cnn卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)

    卷積神經(jīng)網(wǎng)絡(luò)概述 卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn) cnn卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)?
    的頭像 發(fā)表于 08-21 16:41 ?2702次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理 卷積神經(jīng)網(wǎng)絡(luò)發(fā)展 卷積神經(jīng)網(wǎng)絡(luò)三大特點(diǎn)

    中最重要的神經(jīng)網(wǎng)絡(luò)之一。它是一由多個(gè)卷積層和池化層(也可稱為下采樣層)組成的神經(jīng)網(wǎng)絡(luò)。CNN 的基本思想是以圖像為輸入,通過(guò)網(wǎng)絡(luò)
    的頭像 發(fā)表于 08-21 16:49 ?2192次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)卷積層講解

    卷積神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)卷積層講解 卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 08-21 16:49 ?7092次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的介紹 什么是卷積神經(jīng)網(wǎng)絡(luò)算法

    卷積神經(jīng)網(wǎng)絡(luò)的介紹 什么是卷積神經(jīng)網(wǎng)絡(luò)算法 卷積神經(jīng)網(wǎng)絡(luò)涉及的關(guān)鍵技術(shù)
    的頭像 發(fā)表于 08-21 16:49 ?1766次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實(shí)現(xiàn)

    1.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語(yǔ)言處理等領(lǐng)域。 卷積
    的頭像 發(fā)表于 07-02 16:47 ?378次閱讀