0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解析在目標(biāo)檢測(cè)中怎么解決小目標(biāo)的問(wèn)題?

新機(jī)器視覺(jué) ? 來(lái)源:AI公園 ? 作者:Nabil MADALI ? 2021-04-26 14:13 ? 次閱讀

導(dǎo)讀

本文介紹了一些小目標(biāo)物體檢測(cè)的方法和思路。

深度學(xué)習(xí)目標(biāo)檢測(cè)中,特別是人臉檢測(cè)中,由于分辨率低、圖像模糊、信息少、噪聲多,小目標(biāo)和小人臉的檢測(cè)一直是一個(gè)實(shí)用和常見(jiàn)的難點(diǎn)問(wèn)題。然而,在過(guò)去幾年的發(fā)展中,也出現(xiàn)了一些提高小目標(biāo)檢測(cè)性能的解決方案。本文將對(duì)這些方法進(jìn)行分析、整理和總結(jié)。

圖像金字塔和多尺度滑動(dòng)窗口檢測(cè)

一開(kāi)始,在深學(xué)習(xí)方法成為流行之前,對(duì)于不同尺度的目標(biāo),通常是從原始圖像開(kāi)始,使用不同的分辨率構(gòu)建圖像金字塔,然后使用分類器對(duì)金字塔的每一層進(jìn)行滑動(dòng)窗口的目標(biāo)檢測(cè)。

在著名的人臉檢測(cè)器MTCNN中,使用圖像金字塔法檢測(cè)不同分辨率的人臉目標(biāo)。然而,這種方法通常是緩慢的,雖然構(gòu)建圖像金字塔可以使用卷積核分離加速或簡(jiǎn)單粗暴地縮放,但仍需要做多個(gè)特征提取,后來(lái)有人借其想法想出一個(gè)特征金字塔網(wǎng)絡(luò)FPN,在不同層融合特征,只需要一次正向計(jì)算,不需要縮放圖片。它也被應(yīng)用于小目標(biāo)檢測(cè),這將在后面的文章中討論。

簡(jiǎn)單,粗暴和可靠的數(shù)據(jù)增強(qiáng)

通過(guò)增加訓(xùn)練集中小目標(biāo)樣本的種類和數(shù)量,也可以提高小目標(biāo)檢測(cè)的性能。有兩種簡(jiǎn)單而粗糙的方法:

針對(duì)COCO數(shù)據(jù)集中含有小目標(biāo)的圖片數(shù)量較少的問(wèn)題,使用過(guò)采樣策略:

31941d6e-a648-11eb-aece-12bb97331649.jpg

不同采樣比的實(shí)驗(yàn)。我們觀察到,不管檢測(cè)小目標(biāo)的比率是多少,過(guò)采樣都有幫助。這個(gè)比例使我們能夠在大小物體之間做出權(quán)衡。

針對(duì)同一張圖片中小目標(biāo)數(shù)量少的問(wèn)題,使用分割mask切出小目標(biāo)圖像,然后使用復(fù)制和粘貼方法(當(dāng)然,再加一些旋轉(zhuǎn)和縮放)。

通過(guò)復(fù)制粘貼小目標(biāo)來(lái)實(shí)現(xiàn)人工增強(qiáng)的例子。正如我們?cè)谶@些例子中所觀察到的,粘貼在同一幅圖像上可以獲得正確的小目標(biāo)的周?chē)h(huán)境。

在Anchor策略方法中,如果同一幅圖中有更多的小目標(biāo),則會(huì)匹配更多的正樣本。

31b10384-a648-11eb-aece-12bb97331649.jpg

與ground truth物體相匹配的不同尺度anchor示意圖,小的目標(biāo)匹配到更少的anchor。為了克服這一問(wèn)題,我們提出通過(guò)復(fù)制粘貼小目標(biāo)來(lái)人工增強(qiáng)圖像,使訓(xùn)練過(guò)程中有更多的anchor與小目標(biāo)匹配。

特征融合FPN

不同階段的特征圖對(duì)應(yīng)不同的感受野,其所表達(dá)的信息抽象程度也不同。

淺層特征圖感受野小,更適合檢測(cè)小目標(biāo),深層特征圖較大,更適合檢測(cè)大目標(biāo)。因此,有人提出將不同階段的特征映射整合在一起來(lái)提高目標(biāo)檢測(cè)性能,稱之為特征金字塔網(wǎng)絡(luò)FPN。

31cc7b5a-a648-11eb-aece-12bb97331649.jpg

(a)利用圖像金字塔建立特征金字塔。特征的計(jì)算是在每個(gè)圖像的尺度上獨(dú)立進(jìn)行的,這是很緩慢的。(b)最近的檢測(cè)系統(tǒng)選擇只使用單一尺度的特征以更快地檢測(cè)。另一種選擇是重用由ConvNet計(jì)算出的金字塔特征層次結(jié)構(gòu),就好像它是一個(gè)特征圖金字塔。(d)我們提出的特征金字塔網(wǎng)絡(luò)(FPN)與(b)和一樣快,但更準(zhǔn)確。在這個(gè)圖中,特征圖用藍(lán)色輪廓線表示,較粗的輪廓線表示語(yǔ)義上較強(qiáng)的特征。

由于可以通過(guò)融合不同分辨率的特征圖來(lái)提高特征的豐富度和信息含量來(lái)檢測(cè)不同大小的目標(biāo),自然會(huì)有人進(jìn)一步猜測(cè),如果只檢測(cè)高分辨率的特征圖(淺層特征)來(lái)檢測(cè)小人臉,使用中分辨率特征圖(中間特征)來(lái)檢測(cè)大的臉。

31d8be38-a648-11eb-aece-12bb97331649.jpg

SSH的網(wǎng)絡(luò)結(jié)構(gòu)

合適的訓(xùn)練方法SNIP, SNIPER, SAN

機(jī)器學(xué)習(xí)中有一點(diǎn)很重要,模型預(yù)訓(xùn)練的分布應(yīng)該盡可能接近測(cè)試輸入的分布。因此,在大分辨率(如常見(jiàn)的224 x 224)下訓(xùn)練的模型不適合檢測(cè)小分辨率的圖像,然后放大并輸入到模型中。

如果輸入的是小分辨率的圖像,則在小分辨率的圖像上訓(xùn)練模型,如果沒(méi)有,則應(yīng)該先用大分辨率的圖片訓(xùn)練模型,然后再用小分辨率的圖片進(jìn)行微調(diào),最壞的情況是直接使用大分辨率的圖像來(lái)預(yù)測(cè)小分辨率的圖像(通過(guò)上采樣放大)。

因此,在實(shí)際應(yīng)用中,對(duì)輸入圖像進(jìn)行放大并進(jìn)行高速率的圖像預(yù)訓(xùn)練,然后對(duì)小圖像進(jìn)行微調(diào)比針對(duì)小目標(biāo)訓(xùn)練分類器效果更好。

3202a8ce-a648-11eb-aece-12bb97331649.jpg

所有的圖都報(bào)告了ImageNet分類數(shù)據(jù)集驗(yàn)證集的準(zhǔn)確性。我們對(duì)48、64、80等分辨率的圖像進(jìn)行上采樣,在圖(a)中繪制出預(yù)訓(xùn)練的ResNet-101分類器的Top-1精度。圖(b、c)分別為原始圖像分辨率為48,96像素時(shí)不同cnn的結(jié)果。

更密集的Anchor采樣和匹配策略S3FD, FaceBoxes

如前面的數(shù)據(jù)增強(qiáng)部分所述,將一個(gè)小目標(biāo)復(fù)制到圖片中的多個(gè)位置,可以增加小目標(biāo)匹配的anchor數(shù)量,增加小目標(biāo)的訓(xùn)練權(quán)重,減少網(wǎng)絡(luò)對(duì)大目標(biāo)的偏置。同樣,在逆向思維中,如果數(shù)據(jù)集已經(jīng)確定,我們也可以增加負(fù)責(zé)小目標(biāo)的anchor的設(shè)置策略,使訓(xùn)練過(guò)程中對(duì)小目標(biāo)的學(xué)習(xí)更加充分。

例如,在FaceBoxes中,其中一個(gè)貢獻(xiàn)是anchor策略。

320c45dc-a648-11eb-aece-12bb97331649.jpg

Anchor變的密集例子。為了清晰起見(jiàn),我們只對(duì)一個(gè)感受野中心(即中央黑色網(wǎng)格)密集化錨點(diǎn),并只給對(duì)角錨點(diǎn)上色。

Anchor密集化策略,使不同類型的anchor在圖像上具有相同的密度,顯著提高小人臉的召回率。

總結(jié)

本文較詳細(xì)地總結(jié)了一般目標(biāo)檢測(cè)和特殊人臉檢測(cè)中常見(jiàn)的小目標(biāo)檢測(cè)解決方案。

英文原文:https://medium.datadriveninvestor.com/how-to-deal-with-small-objects-in-object-detection-44d28d136cbc

來(lái)源:AI公園

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 噪聲
    +關(guān)注

    關(guān)注

    13

    文章

    1113

    瀏覽量

    47325
  • 分辨率
    +關(guān)注

    關(guān)注

    2

    文章

    1016

    瀏覽量

    41832
  • 人臉檢測(cè)
    +關(guān)注

    關(guān)注

    0

    文章

    79

    瀏覽量

    16430

原文標(biāo)題:在目標(biāo)檢測(cè)中如何解決小目標(biāo)的問(wèn)題?

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    目標(biāo)檢測(cè)中大物體的重要性

    導(dǎo)讀實(shí)驗(yàn)表明,對(duì)大型物體賦予更大的權(quán)重可以提高所有尺寸物體的檢測(cè)分?jǐn)?shù),從而整體提升目標(biāo)檢測(cè)器的性能(COCOval2017數(shù)據(jù)集上使用InternImage-T模型,小物體
    的頭像 發(fā)表于 10-09 08:05 ?361次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>中大物體的重要性

    圖像分割與目標(biāo)檢測(cè)的區(qū)別是什么

    的區(qū)別。 定義 圖像分割是將圖像劃分為若干個(gè)區(qū)域或?qū)ο蟮倪^(guò)程,這些區(qū)域或?qū)ο缶哂邢嗨频膶傩?,如顏色、紋理或形狀。圖像分割的目的是將圖像的不同對(duì)象或區(qū)域分離出來(lái),以便進(jìn)行進(jìn)一步的分析和處理。 目標(biāo)檢測(cè)則是
    的頭像 發(fā)表于 07-17 09:53 ?856次閱讀

    目標(biāo)檢測(cè)與圖像識(shí)別的區(qū)別在哪

    檢測(cè)(Object Detection)是指在圖像或視頻識(shí)別并定位感興趣的目標(biāo),通常包括目標(biāo)的類別和位置。目標(biāo)
    的頭像 發(fā)表于 07-17 09:51 ?532次閱讀

    目標(biāo)檢測(cè)與識(shí)別技術(shù)有哪些

    視頻識(shí)別并定位感興趣的目標(biāo),通常包括目標(biāo)的類別和位置信息。目標(biāo)識(shí)別(Object Recognition)是指對(duì)檢測(cè)到的
    的頭像 發(fā)表于 07-17 09:40 ?447次閱讀

    目標(biāo)檢測(cè)與識(shí)別技術(shù)的關(guān)系是什么

    任務(wù)是圖像或視頻快速準(zhǔn)確地定位出感興趣的目標(biāo),并給出目標(biāo)的位置信息。目標(biāo)檢測(cè)技術(shù)通常包括候選
    的頭像 發(fā)表于 07-17 09:38 ?393次閱讀

    目標(biāo)檢測(cè)識(shí)別主要應(yīng)用于哪些方面

    介紹目標(biāo)檢測(cè)識(shí)別的應(yīng)用領(lǐng)域,以及其各個(gè)領(lǐng)域的具體應(yīng)用情況。 安全監(jiān)控 安全監(jiān)控是目標(biāo)檢測(cè)識(shí)別應(yīng)用最廣泛的領(lǐng)域之一。
    的頭像 發(fā)表于 07-17 09:34 ?744次閱讀

    慧視小目標(biāo)識(shí)別算法 解決目標(biāo)檢測(cè)的老大難問(wèn)題

    隨著深度學(xué)習(xí)和人工智能技術(shù)的興起與技術(shù)成熟,一大批如FasterR-CNN、RetinaNet、YOLO等可以工業(yè)界使用的目標(biāo)檢測(cè)算法已逐步成熟并進(jìn)入實(shí)際應(yīng)用,大多數(shù)場(chǎng)景下的目標(biāo)
    的頭像 發(fā)表于 07-17 08:29 ?311次閱讀
    慧視小<b class='flag-5'>目標(biāo)</b>識(shí)別算法   解決<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b><b class='flag-5'>中</b>的老大難問(wèn)題

    基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)

    計(jì)算機(jī)視覺(jué)領(lǐng)域,目標(biāo)檢測(cè)一直是研究的熱點(diǎn)和難點(diǎn)之一。特別是目標(biāo)檢測(cè)方面,由于小
    的頭像 發(fā)表于 07-04 17:25 ?639次閱讀

    基于“雙 碳 ”目標(biāo)的綜合用電服務(wù)管理系統(tǒng)介紹

    各類廠礦與企事企業(yè)單位,基于雙碳目標(biāo)的綜合智慧用電管理系統(tǒng)解決方案。
    發(fā)表于 04-08 16:29 ?1次下載

    深度學(xué)習(xí)檢測(cè)目標(biāo)常用方法

    深度學(xué)習(xí)的效果在某種意義上是靠大量數(shù)據(jù)喂出來(lái)的,小目標(biāo)檢測(cè)的性能同樣也可以通過(guò)增加訓(xùn)練集中小目標(biāo)樣本的種類和數(shù)量來(lái)提升。
    發(fā)表于 03-18 09:57 ?650次閱讀
    深度學(xué)習(xí)<b class='flag-5'>檢測(cè)</b>小<b class='flag-5'>目標(biāo)</b>常用方法

    百度開(kāi)源DETRs實(shí)時(shí)目標(biāo)檢測(cè)勝過(guò)YOLOs

    這篇論文介紹了一種名為RT-DETR的實(shí)時(shí)檢測(cè)Transformer,是第一個(gè)實(shí)時(shí)端到端目標(biāo)檢測(cè)器。
    的頭像 發(fā)表于 03-06 09:24 ?1262次閱讀
    百度開(kāi)源DETRs<b class='flag-5'>在</b>實(shí)時(shí)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b><b class='flag-5'>中</b>勝過(guò)YOLOs

    巍泰技術(shù)毫米波雷達(dá)如何助力道路車(chē)輛預(yù)警?靜態(tài)目標(biāo)檢測(cè)是關(guān)鍵

    毫米波雷達(dá)可以識(shí)別靜態(tài)目標(biāo),但在某些應(yīng)用場(chǎng)景下,為了防止功能誤觸,會(huì)濾除靜止目標(biāo)的特征。然而,在車(chē)輛預(yù)警的實(shí)際應(yīng)用,靜態(tài)目標(biāo)的檢測(cè)十分必要
    的頭像 發(fā)表于 02-27 15:59 ?848次閱讀
    巍泰技術(shù)毫米波雷達(dá)如何助力道路車(chē)輛預(yù)警?靜態(tài)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>是關(guān)鍵

    動(dòng)目標(biāo)顯示雷達(dá)工作原理

    目的:抑制由雜波產(chǎn)生的類似目標(biāo)的回波,而讓動(dòng)目標(biāo)回波通過(guò)后的損失盡量小或沒(méi)損失。
    發(fā)表于 01-24 10:06 ?447次閱讀
    動(dòng)<b class='flag-5'>目標(biāo)</b>顯示雷達(dá)工作原理

    利用毫米波雷達(dá)探測(cè)目標(biāo)的電子設(shè)備

    電子發(fā)燒友網(wǎng)站提供《利用毫米波雷達(dá)探測(cè)目標(biāo)的電子設(shè)備.docx》資料免費(fèi)下載
    發(fā)表于 11-06 17:23 ?5次下載

    如何使用質(zhì)心法進(jìn)行目標(biāo)追蹤--文末送書(shū)

    TBD方法完整的流程如圖2所示,該方法共有5個(gè)步驟,其中最關(guān)鍵的是“目標(biāo)檢測(cè)”和“目標(biāo)關(guān)聯(lián)”兩個(gè)步驟,“目標(biāo)檢測(cè)”需要一個(gè)訓(xùn)練好的
    的頭像 發(fā)表于 10-31 15:47 ?718次閱讀
    如何使用質(zhì)心法進(jìn)行<b class='flag-5'>目標(biāo)</b>追蹤--文末送書(shū)