0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

卷積神經(jīng)網(wǎng)絡(luò) 物體檢測(cè) YOLOv2

倩倩 ? 來(lái)源:三姐的哥 ? 2020-04-17 15:51 ? 次閱讀

繼2015的YOLO后,2016年作者對(duì)YOLO升級(jí)到Y(jié)OLO2,另外一個(gè)版本YOLO9000是基于wordtree跨數(shù)據(jù)集達(dá)到檢測(cè)9000個(gè)分類,卷積層模型稱為darknet-19,達(dá)到速度和效果的雙提升,文章里充滿了作者的自豪,也值得自豪;

作者正視了YOLO的兩個(gè)大問(wèn)題:回歸框不精準(zhǔn)和召回不夠;一般的解決思路都是把網(wǎng)絡(luò)加深加寬,不過(guò)本文不屑,作者反而要通過(guò)優(yōu)化網(wǎng)絡(luò)學(xué)習(xí)在準(zhǔn)確率不降的情況下提升精度和召回!

升級(jí)點(diǎn)

Batch Normalization:每個(gè)卷積層加了BN,正則都不要了,droupout也省了,過(guò)擬合也沒(méi)了,效果還好了,+2%mAP;

High Resolution Classifier - 高分辨率分類:模型訓(xùn)練時(shí)經(jīng)典做法都是先在ImageNet上pre-train,然而ImageNet上的圖片是低分辨率小于256*256的,而要檢測(cè)的圖片是高分辨率448*448的,這樣模型需要同時(shí)在高分辨的圖片上做fine-tune和檢測(cè),所以作者提出了三步驟 1) 在ImageNet低分辨率上pre-train;2) 在高分辨率數(shù)據(jù)集上fine-tune;3) 在高分辨率數(shù)據(jù)集上檢測(cè);使得模型更容易學(xué)習(xí),+4%mAP

Convolution with Anchor Boxer - 加Anchor機(jī)制:YOLO是通過(guò)最后的全連接層直接預(yù)估絕對(duì)坐標(biāo),而FasterRCNN是通過(guò)卷積層預(yù)估相對(duì)坐標(biāo),作者認(rèn)為這樣更容易學(xué)習(xí),因此YOLOv2去掉了全連接層,在最后一層卷積層下采樣后用Anchor,yolo有7*7*2 = 98個(gè)框,而YOLOv2有超過(guò)1k的anchor,最終效果上雖然mAP略有下降3個(gè)千分點(diǎn),但是召回提升7個(gè)百分點(diǎn),值了!

Dimension Clusters - 維度聚類: Anchor的尺寸faster rcnn里人工選定的,YOLOv2通過(guò)k-mean聚類的方法,將訓(xùn)練數(shù)據(jù)里gt的框進(jìn)行聚類,注意這里不能直接用歐式距離,大框會(huì)比小框影響大,我們的目標(biāo)是IOU,因此距離為: d(box, centroid) = 1 IOU(box, centroid);下圖是結(jié)果,左圖是k和IOU的trand-off,右圖是5個(gè)中心的框尺寸,明顯看出和人工指定的差異很大;

Direct location prediction - 直接預(yù)測(cè)位置:直接預(yù)測(cè)x,y會(huì)導(dǎo)致模型訓(xùn)練不穩(wěn)定,本文預(yù)測(cè)如下tx,ty,tw,th,to,通過(guò)sigmolid歸一化到(0,1),結(jié)合dimension clusters,+5%mAP

Fine-Grained Freture - 細(xì)粒度特征:引入passthrough layer,將低維度特征傳遞給高維度,類似于resnet的shortcut,+1%mAP;

Multi-Scale Training - 多尺度訓(xùn)練:這里的多尺度是圖片的尺寸,多了迫使模型適應(yīng)更大范圍的尺寸,每隔一定的epoch就強(qiáng)制改變輸入圖片的尺寸;

效果

如下是在VOC數(shù)據(jù)集上效率(每秒處理幀數(shù))和效果(mAP)空間里不同算法的變現(xiàn),其中YOLOv2為藍(lán)色,有不同的trade-off,效率和效果都超過(guò)已有的方法;

如下是更多的實(shí)驗(yàn)結(jié)果:

如下是COCO上的效果,看得出COCO數(shù)據(jù)集還是很難的,小物體上YOLO2依然是差一些;

YOLO9000: Better, Faster, Stronger

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4575

    瀏覽量

    92339
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24590
  • voc
    voc
    +關(guān)注

    關(guān)注

    0

    文章

    98

    瀏覽量

    15643
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    卷積神經(jīng)網(wǎng)絡(luò)有何用途 卷積神經(jīng)網(wǎng)絡(luò)通常運(yùn)用在哪里

    和應(yīng)用場(chǎng)景。 圖像識(shí)別 圖像識(shí)別是卷積神經(jīng)網(wǎng)絡(luò)最廣泛的應(yīng)用之一。CNN能夠自動(dòng)學(xué)習(xí)圖像中的特征,實(shí)現(xiàn)對(duì)圖像的分類、識(shí)別和分析。以下是一些具體的應(yīng)用場(chǎng)景: 1.1 物體識(shí)別:CNN可以識(shí)別圖像中的
    的頭像 發(fā)表于 07-11 14:43 ?1200次閱讀

    BP神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是兩種在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域
    的頭像 發(fā)表于 07-10 15:24 ?839次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

    循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域中兩種非常重要的神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-04 14:24 ?782次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)原理

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語(yǔ)言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-03 10:49 ?450次閱讀

    bp神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是兩種不同類型的人工神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-03 10:12 ?710次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)分類方法有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、目標(biāo)檢測(cè)、語(yǔ)義分割等計(jì)算機(jī)視覺任務(wù)。本文將詳細(xì)介紹卷積
    的頭像 發(fā)表于 07-03 09:40 ?334次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和工作原理

    和工作原理。 1. 引言 在深度學(xué)習(xí)領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)是一種非常重要的模型。它通過(guò)模擬人類視覺系統(tǒng),能夠自動(dòng)學(xué)習(xí)圖像中的特征,從而實(shí)現(xiàn)對(duì)圖像的識(shí)別和分類。與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,CNN具有更強(qiáng)的特征提取能力,能夠處理更復(fù)雜的數(shù)據(jù)。 2
    的頭像 發(fā)表于 07-03 09:38 ?311次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)分類有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、目標(biāo)檢測(cè)、語(yǔ)義分割等領(lǐng)域。本文將詳細(xì)介紹CNN在分類任務(wù)中的應(yīng)用,包括基本結(jié)構(gòu)、關(guān)鍵技術(shù)、常見網(wǎng)絡(luò)架構(gòu)以及實(shí)際應(yīng)用案例。
    的頭像 發(fā)表于 07-03 09:28 ?383次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語(yǔ)言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-03 09:15 ?271次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本概念和工作原理

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是深度學(xué)習(xí)中非常重要的一類神經(jīng)網(wǎng)絡(luò),主要用于圖像識(shí)別、圖像分類、物體檢測(cè)等計(jì)算機(jī)視覺任務(wù)。CNN以其獨(dú)
    的頭像 發(fā)表于 07-02 18:17 ?2454次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實(shí)現(xiàn)

    1.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語(yǔ)言處理等領(lǐng)域。 卷積神經(jīng)網(wǎng)絡(luò)是一種前饋
    的頭像 發(fā)表于 07-02 16:47 ?377次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

    。 引言 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它通過(guò)模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能,實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)學(xué)習(xí)和特征提取。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中的一種重要模型,它通過(guò)卷積操作和池化操作,有效地提取
    的頭像 發(fā)表于 07-02 14:45 ?803次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的原
    的頭像 發(fā)表于 07-02 14:44 ?430次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)和BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Networks,簡(jiǎn)稱BPNN)是兩種
    的頭像 發(fā)表于 07-02 14:24 ?1702次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)

    卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)? 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,在圖
    的頭像 發(fā)表于 12-07 15:37 ?3871次閱讀