0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于殘差精煉的新模塊提升圖像超分辨性能

nlfO_thejiangme ? 來源:YXQ ? 2019-07-22 16:53 ? 次閱讀

近年來基于深度學(xué)習(xí)的單圖像超分辨技術(shù)得到飛速發(fā)展,從SRCNN到VDSR,從DRCN到MSRN深度學(xué)習(xí)模型,解決了一個又一個超分辨率領(lǐng)域的難題。但目前的研究結(jié)果也表明,盲目地使用殘差結(jié)構(gòu)和稠密連接將導(dǎo)致模型過分地復(fù)用特征,使得網(wǎng)絡(luò)臃腫膨脹同時難以訓(xùn)練。

為了解決這一問題,來自西安電子科技大學(xué)的研究人員基于殘差網(wǎng)絡(luò)提出了一種簡單高效的信息提煉方法DRN(distilling with residual network)用于單圖像超分辨率技術(shù),利用高效獲取信息的殘差精煉單元(RDB,residual distilling block)及其堆疊的組操作(RDG, residual distilling group),實現(xiàn)了對于信息更好的抽取和提煉,并平衡了模型的大小與性能,達到了非常好的圖像超分辨率效果。

殘差精煉模塊RDB

為了有效地抽取并提煉低分辨率圖像中的信息,研究人員提出了高效的殘差精煉單元RDB來對圖像進行操作。RDB中包含了兩個分支,其中一個分支用于進行基本的殘差操作;另一個分支則用于從輸入中提煉出有效的信息,在融合信息的同時保持了對于重要特征的抽取能力。

圖中顯示的殘差精煉單元的構(gòu)造

其中的塊狀結(jié)構(gòu)為每次操作輸出的張量輸出

上圖顯示了RDB模塊的基本構(gòu)成,其中Di表示輸入,Di+1表示模塊的輸出。在模塊最開始的位置,輸入的Di 通過卷積的作用得到量兩個中間輸出(1*1,3*3,1*1的卷積),其中Dout,i表示這一層級側(cè)殘差輸出,而d則表示第i層和第i+1層之間的信息精煉通道。

隨后輸入Di與殘差輸出Dout,i相加,并與d相接,構(gòu)成的整個RDB模塊將從中抽取有效的信息輔助超分辨率中高頻信息的重建。此外在RDB的最后位置引入了1*1的卷積核用于特征融合。

基于RDB模塊,研究人員將RDB堆疊成組操作,并使得RDB模塊的輸出可以接入下一個RDB模塊的每一層,使特征可以進行連續(xù)的轉(zhuǎn)換。隨后研究人員還在多個堆疊的RDB模塊間加入了一條長程的跳接,用于保存先前階段信息,在有效抽取特征的同時將有助于網(wǎng)絡(luò)融合局部與全局特征,并得到有利于圖像重建的有效特征。

網(wǎng)絡(luò)架構(gòu)

在RDB和RDG的基礎(chǔ)上,研究人員構(gòu)建了基于殘差網(wǎng)絡(luò)的精煉模型,其中主要包含三個組成部分:低層級特征抽取LFE,殘差精煉組的操作RDGs以及最終進行圖像重建的操作。

在這一網(wǎng)絡(luò)架構(gòu)中,除了進行底層信息抽取和圖像重建的模塊外,最重要的就是n個殘差精煉的組操作RDGs,其中每個組操作中包含了K個殘差精煉模塊RDB。整個模型可以表達成下面的式子:

從內(nèi)到外分別表示了特征提取操作,殘差組操作和信息融合以及最后的圖像重建。針對每個組操作中的特征抽取模塊,可以看作是多個RDB模塊操作Fg的融合以及長程跳接的銜接:

整個模型的結(jié)構(gòu)可以理解為多個殘差模塊的操作堆疊成殘差提煉組操作,而多個組操作又結(jié)合在一起實現(xiàn)了更有效的特征抽取和殘差提煉,最終層層疊加與與融合實現(xiàn)了最后的特征輸出。

基于這些特征研究人員利用pixelshuffle的方法進行上采樣和圖像重建,并選擇了MAE作為損失函數(shù)進行訓(xùn)練。

最終研究人員在DIV2K上進行了充分地訓(xùn)練,并在Set5,Set14,Urban100,BSDB100,Manga109等基準數(shù)據(jù)集上進行了測試,分別在2x-3x-4x倍的超方便率尺度上進行了實驗。

結(jié)果表明,與其他先進的方法相比,DRN系列方法在峰值信噪比和結(jié)構(gòu)相似性等方面均取得了較好的提升。

在使用更少參數(shù)的訓(xùn)練下能達到與先前的模型接近甚至更好地結(jié)果:

最后來看一下在數(shù)據(jù)集圖像上取得的顯著效果,可以看到DRN模型可以更好地克服人工恢復(fù)的模糊痕跡,并保留更多的細節(jié)信息。

恢復(fù)出的文字也較為清晰可辨:

此外對于線條的恢復(fù)能力也較強,去除模糊的同時,對于線條細節(jié)的恢復(fù)較好:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1272

    瀏覽量

    56506
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5437

    瀏覽量

    120794

原文標題:拒絕馬賽克!基于殘差抽取的單圖像超分辨率技術(shù)

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    性能圖像傳感器如何選?關(guān)鍵在于這五點

    在當今快速發(fā)展的科技領(lǐng)域,圖像傳感器作為機器視覺和自動駕駛等技術(shù)的核心部件,其性能直接關(guān)系到系統(tǒng)的效率和準確性。高性能圖像傳感器的選擇不僅需要考慮
    的頭像 發(fā)表于 10-23 15:05 ?33次閱讀

    六類網(wǎng)線是什么樣的?如何分辨?

    六類網(wǎng)線(Cat6a)作為高性能網(wǎng)絡(luò)電纜,具有優(yōu)異的傳輸性能、廣闊的頻寬和強大的抗干擾能力。以下是對六類網(wǎng)線的詳細描述以及如何分辨它的方
    的頭像 發(fā)表于 09-29 10:14 ?250次閱讀

    六類非屏蔽模塊和屏蔽模塊的區(qū)別

    六類非屏蔽模塊和屏蔽模塊在網(wǎng)絡(luò)通信中各有其獨特的特點和應(yīng)用場景,它們之間的主要區(qū)別體現(xiàn)在以下幾個方面: 一、抗干擾性能 六類屏蔽
    的頭像 發(fā)表于 09-09 10:04 ?366次閱讀

    六類非屏蔽模塊是什么

    是一種符合高標準網(wǎng)絡(luò)傳輸要求的連接模塊,它支持更高的數(shù)據(jù)傳輸速率和更遠的傳輸距離,適用于現(xiàn)代高速網(wǎng)絡(luò)環(huán)境。與普通的六類非屏蔽模塊相比,六類模塊
    的頭像 發(fā)表于 09-09 09:58 ?362次閱讀

    視頻分技術(shù)是指什么?

    ??分辨率技術(shù)(SuperResolution),是通過硬件或軟件的方法提高圖像或視頻幀的分辨率,通過一系列低分辨
    的頭像 發(fā)表于 09-04 08:05 ?258次閱讀
    視頻<b class='flag-5'>超</b>分技術(shù)是指什么?

    圖像識別算法的提升有哪些

    引言 圖像識別是計算機視覺領(lǐng)域的核心任務(wù)之一,旨在使計算機能夠自動地識別和理解圖像中的內(nèi)容。隨著計算機硬件的發(fā)展和深度學(xué)習(xí)技術(shù)的突破,圖像識別算法的性能得到了顯著
    的頭像 發(fā)表于 07-16 11:12 ?504次閱讀

    網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)嗎

    網(wǎng)絡(luò)(Residual Network,通常簡稱為ResNet) 是深度神經(jīng)網(wǎng)絡(luò)的一種 ,其獨特的結(jié)構(gòu)設(shè)計在解決深層網(wǎng)絡(luò)訓(xùn)練中的梯度消失和梯度爆炸問題上取得了顯著的突破,并因此成為圖像處理、語音識別等多個領(lǐng)域的重要模型。以下
    的頭像 發(fā)表于 07-11 18:13 ?846次閱讀

    研究人員利用人工智能提升透鏡相機的圖像質(zhì)量

    研究人員利用深度學(xué)習(xí)技術(shù)提高了直接集成在 CMOS 成像芯片上的透鏡相機(左)的圖像質(zhì)量。透鏡利用 1000 納米高的圓柱形氮化硅納米柱陣列(右圖)操縱光線。 研究人員利用深度學(xué)習(xí)技術(shù)提高了
    的頭像 發(fā)表于 06-11 06:34 ?293次閱讀
    研究人員利用人工智能<b class='flag-5'>提升</b><b class='flag-5'>超</b>透鏡相機的<b class='flag-5'>圖像</b>質(zhì)量

    如何修改Kernel Affinity提升openplc性能

    如何修改Kernel Affinity提升openplc性能
    發(fā)表于 05-22 06:36

    提升電子設(shè)備性能的秘密:優(yōu)質(zhì)DC電源模塊

    BOSHIDA 提升電子設(shè)備性能的秘密:優(yōu)質(zhì)DC電源模塊 電子設(shè)備在現(xiàn)代社會中起著至關(guān)重要的作用,而其性能提升對于用戶體驗和功能的改進至關(guān)
    的頭像 發(fā)表于 04-26 13:56 ?311次閱讀
    <b class='flag-5'>提升</b>電子設(shè)備<b class='flag-5'>性能</b>的秘密:優(yōu)質(zhì)DC電源<b class='flag-5'>模塊</b>

    基于CNN的圖像分辨率示例

    考慮單個低分辨圖像,首先使用雙三次插值將其放大到所需的大小,這是執(zhí)行的唯一預(yù)處理。將插值圖像表示為Y。我們的目標是從Y中恢復(fù)與真實高分辨圖像
    的頭像 發(fā)表于 03-11 11:40 ?608次閱讀
    基于CNN的<b class='flag-5'>圖像</b><b class='flag-5'>超</b><b class='flag-5'>分辨</b>率示例

    維修安捷倫示波器DSO1024A-案例

    維修型號:安捷倫-DSO1024A。 二、報修故障:儀器。 三、故障檢測:開機鍵不靈敏,CH3和CH4通道故障,工程師拆機檢測,對內(nèi)部元件進行詳細檢測,拆開后蓋固定螺絲、拆開外殼發(fā)現(xiàn)通道芯片被打磨過。 四、維修措施:整體更換控制板,對儀器
    的頭像 發(fā)表于 01-12 16:36 ?392次閱讀
    維修安捷倫示波器DSO1024A-<b class='flag-5'>超</b><b class='flag-5'>差</b>案例

    安捷倫示波器維修-DSO1024A-案例

    維修型號:安捷倫-DSO1024A。 二、報修故障:儀器。 三、故障檢測:開機鍵不靈敏,CH3和CH4通道故障,工程師拆機檢測,對內(nèi)部元件進行詳細檢測,拆開后蓋固定螺絲、拆開外殼發(fā)現(xiàn)通道芯片被打磨過。 四、維修措施:整體更換控制板,對儀器
    的頭像 發(fā)表于 01-12 16:26 ?411次閱讀
    安捷倫示波器維修-DSO1024A-<b class='flag-5'>超</b><b class='flag-5'>差</b>案例

    淺談相機的圖像分辨

    談到顯微成像系統(tǒng),常常會用分辨率來評價成像能力的高低,那分辨率到底指的是什么,又怎樣計算呢?其實對于一個特定的顯微成像系統(tǒng),分辨率要從兩個方面來考慮,一種是光學(xué)系統(tǒng)的分辨率—光學(xué)衍射極
    的頭像 發(fā)表于 01-09 09:54 ?1394次閱讀
    淺談相機的<b class='flag-5'>圖像</b><b class='flag-5'>分辨</b>率

    圖像采集卡的性能參數(shù)有哪些需要注意的?

    圖像采集卡的性能參數(shù)有哪些需要注意的? 圖像采集卡是用于將圖像信號轉(zhuǎn)換為數(shù)字信號的硬件設(shè)備,用于圖像捕捉、數(shù)據(jù)傳輸、視頻處理等應(yīng)用。在選擇和
    的頭像 發(fā)表于 12-15 09:58 ?1068次閱讀