0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里達(dá)摩院提出MogFace:人臉檢測(cè)新工作

CVer ? 來(lái)源:CVer ? 作者:CVer ? 2022-11-29 15:24 ? 次閱讀

一、開(kāi)源

77fd25c0-6f37-11ed-8abf-dac502259ad0.png

MogFace: Towards a Deeper Appreciation on Face Detection

1. 論文鏈接:

https://openaccess.thecvf.com/content/CVPR2022/papers/Liu_MogFace_Towards_a_Deeper_Appreciation_on_Face_Detection_CVPR_2022_paper.pdf

2. 代碼模型:

https://modelscope.cn/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

3. 可玩應(yīng)用:

https://modelscope.cn/studios/baigui/face_album/summary

二、背景

人臉檢測(cè)算法是在一幅圖片或者視頻序列中檢測(cè)出來(lái)人臉的位置,給出人臉的具體坐標(biāo),一般是矩形坐標(biāo)。它是人臉關(guān)鍵點(diǎn)、屬性、編輯、風(fēng)格化、識(shí)別等模塊的基礎(chǔ)。本文通過(guò)實(shí)驗(yàn)觀察發(fā)現(xiàn),對(duì)應(yīng)設(shè)計(jì)出如下三個(gè)模塊構(gòu)建出一個(gè)高性能的人臉檢測(cè)器MogFace:1.)動(dòng)態(tài)標(biāo)簽分配策略(dynamic label assignment),2.)誤檢上下文相關(guān)性分析(FP context analysis),3.)金字塔層級(jí)監(jiān)督信號(hào)分配(pyramid layer level GT assignment)。該方法的模型在WIDER FACE榜單上取得了截止目前將近兩年的六項(xiàng)第一。

三、觀察

1.1 動(dòng)態(tài)標(biāo)簽分配策略(dynamic label assignment)

為每個(gè)anchor點(diǎn)定義cls和reg目標(biāo)是訓(xùn)練檢測(cè)器的必要過(guò)程,在人臉檢測(cè)中這個(gè)過(guò)程稱之為標(biāo)簽分配(Label Assignment)。最近,標(biāo)簽分配吸引了諸多研究人員的注意,在人臉檢測(cè)及通用物體檢測(cè)領(lǐng)域提出了一系列方法,例如:OTA、PAA,ATSS以及HAMBox。如示例圖(a),標(biāo)簽分配過(guò)程依賴4個(gè)元素。分別是:1.)offline information: a.)IoU (anchor與ground-truth框的IoU) , b.)CPD (anchor與ground-truth中心點(diǎn)的距離) ,2.)online information: a.)PCS (cls分支對(duì)anchor的前景分類概率值) ,b.)PLC (reg分支對(duì)anchor的預(yù)測(cè)坐標(biāo)值)。

781a5fd2-6f37-11ed-8abf-dac502259ad0.png

但是,目前的標(biāo)簽分配方法存在三個(gè)問(wèn)題。1.)若只用offline information做靜態(tài)標(biāo)簽分配,那么會(huì)有很多具備更強(qiáng)回歸能力的negative anchor無(wú)法被有效利用起來(lái),會(huì)導(dǎo)致標(biāo)簽分配策略欠飽和。2.)若過(guò)度信任online information動(dòng)態(tài)調(diào)整正負(fù)anchor時(shí)(如OTA和Hambox),由于online information屬于預(yù)測(cè)信息可信度不高,會(huì)導(dǎo)致標(biāo)簽分配策略錯(cuò)誤多, 極端情況下會(huì)陷入trivial 的分配結(jié)果。3.) 若引入大量超參 (K in ATSS, alpha in OTA)做標(biāo)簽分配,則當(dāng)數(shù)據(jù)集分布發(fā)生變化時(shí),需要大量的調(diào)參時(shí)間。

1.2 誤檢上下文相關(guān)性分析(FP context analysis)

在實(shí)際應(yīng)用中,人臉檢測(cè)器并不會(huì)十分care AP的指標(biāo),而對(duì)誤檢(false positive [FP])的數(shù)量十分敏感。針對(duì)這個(gè)問(wèn)題,目前的做法是收集大量帶有FP的圖片去fine-tune或者from scratch訓(xùn)練檢測(cè)器,來(lái)幫助檢測(cè)器了解更多范式的FP,但是我們發(fā)現(xiàn)有些頻繁出現(xiàn)在訓(xùn)練集中的的FP在這種策略下無(wú)法有效解決。這篇文章,我們發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:對(duì)于同一個(gè)FP,當(dāng)它的context發(fā)生變化時(shí),對(duì)于同一個(gè)檢測(cè)器來(lái)說(shuō)它可能就不是FP了。如下圖(c),最左面的圖片里日歷是FP,剩余兩張日歷都不是FP。

783f0d50-6f37-11ed-8abf-dac502259ad0.png

1.3 金字塔層級(jí)監(jiān)督信號(hào)分配(pyramid layer level GT assignment)

scale-level 數(shù)據(jù)增強(qiáng)策略常常作通用物體檢測(cè)以及人臉檢測(cè)中解決scale variance主要手段。如圖(b)所示,相對(duì)于COCO,人臉檢測(cè)數(shù)據(jù)集Wider Face 中人臉的尺度分布更為嚴(yán)峻。為此,我們分提出了一個(gè)新的問(wèn)題,如何合理的分配ground-truth 在不同pyramidlayer上的分布?即檢測(cè)器的性能與每個(gè)pyramidlayer匹配ground-truth的個(gè)數(shù)之間的關(guān)系是什么?是否越多越好?通過(guò)嚴(yán)格的對(duì)比實(shí)驗(yàn)我們發(fā)現(xiàn):“對(duì)于所有的pyramid layer來(lái)說(shuō),并不是這個(gè)pyramid layer匹配到越多的ground-truth就越好”。這說(shuō)明要挖掘每一個(gè)pyramidlayer的最好性能,需要控制在這個(gè)pyramidlayer上的ground-truth分配的比例。

785e88d8-6f37-11ed-8abf-dac502259ad0.png

四、方法

2.1 Adaptive Online Incremental Anchor Mining Strategy (Ali-AMS)

針對(duì)上述“動(dòng)態(tài)標(biāo)簽分配策略(dynamic label assignment)”觀察分析,本文提出了在里面一種自適應(yīng)的在線增量錨挖掘策略(Ali-AMS),它基于standard anchor matching 策略,并進(jìn)一步adaptive 幫助outlier face匹配anchor。如下:

7880139a-6f37-11ed-8abf-dac502259ad0.png

2.2 Hierachical Context-Aware Module (HCAM)

基于上述“誤檢上下文相關(guān)性分析(FP context analysis)”觀察分析,發(fā)現(xiàn)“對(duì)于同一個(gè)FP,當(dāng)它的context發(fā)生變化時(shí),對(duì)于同一個(gè)檢測(cè)器來(lái)說(shuō)他可能就不是FP了”,我們進(jìn)一步提出了一個(gè)two-step的模塊來(lái)顯示的encode context 信息來(lái)幫助區(qū)分FP和TP,顯著減少了FP的數(shù)量。

7895de46-6f37-11ed-8abf-dac502259ad0.png

2.3 Selective Scale Enhancement Strategy (SSE)

基于上述的“金字塔層級(jí)監(jiān)督信號(hào)分配(pyramid layer level GT assignment)”觀察分析,發(fā)現(xiàn)“對(duì)于所有的pyramid layer來(lái)說(shuō),并不是這個(gè)pyramid layer匹配到越多的ground-truth就越好”,我們提出通過(guò)控制pyramid layer 匹配的ground-truth的數(shù)量來(lái)最大化pyramid layer 的性能。

78b71a5c-6f37-11ed-8abf-dac502259ad0.png

五、實(shí)驗(yàn)

3.1 Ablation Study

78d401a8-6f37-11ed-8abf-dac502259ad0.png

3.2 Comparison with sota

79003fac-6f37-11ed-8abf-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2628

    瀏覽量

    47216
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    855

    瀏覽量

    47600
  • 檢測(cè)算法
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    25198

原文標(biāo)題:WIDER FACE六項(xiàng)第一!阿里達(dá)摩院提出MogFace:人臉檢測(cè)新工作 | CVPR 2022

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    亞馬遜推新,阿里達(dá)摩退出,融資規(guī)模大幅下滑后量子計(jì)算還是好生意嗎?

    發(fā)燒友網(wǎng)都進(jìn)行了跟蹤報(bào)道,其中本文將重點(diǎn)聚焦AI量子芯片——Trainium2。 同時(shí),基于Trainium2芯片的發(fā)布,我們不僅會(huì)聯(lián)想到數(shù)日前的新聞:阿里達(dá)摩裁撤量子實(shí)驗(yàn)室,實(shí)驗(yàn)室以及儀器設(shè)備均捐給浙大。那么兩則新聞綜合來(lái)看
    的頭像 發(fā)表于 11-30 00:12 ?2918次閱讀
    亞馬遜推新,<b class='flag-5'>阿里</b><b class='flag-5'>達(dá)摩</b><b class='flag-5'>院</b>退出,融資規(guī)模大幅下滑后量子計(jì)算還是好生意嗎?

    阿里達(dá)摩發(fā)布玄鐵R908 CPU

    在杭州第四屆RISC-V中國(guó)峰會(huì)上,阿里達(dá)摩再次展現(xiàn)技術(shù)實(shí)力,隆重推出了玄鐵處理器家族的最新成員——R908 CPU。此次發(fā)布標(biāo)志著玄鐵系列在高端計(jì)算領(lǐng)域的全面升級(jí),吸引了業(yè)界的廣泛矚目。
    的頭像 發(fā)表于 08-23 16:27 ?839次閱讀

    人臉檢測(cè)模型有哪些

    人臉檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要研究方向,它涉及到從圖像或視頻中檢測(cè)出人臉的位置和大小。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,人臉檢測(cè)模型的性能得到了顯
    的頭像 發(fā)表于 07-03 17:05 ?800次閱讀

    人臉檢測(cè)人臉識(shí)別的區(qū)別是什么

    人臉檢測(cè)人臉識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域的兩個(gè)重要技術(shù),它們?cè)谠S多應(yīng)用場(chǎng)景中都有廣泛的應(yīng)用,如安全監(jiān)控、身份驗(yàn)證、社交媒體等。盡管它們?cè)谀承┓矫嬗邢嗨浦?,但它們之間存在一些關(guān)鍵的區(qū)別。本文將詳細(xì)介紹
    的頭像 發(fā)表于 07-03 14:49 ?694次閱讀

    阿里達(dá)摩提出“知識(shí)鏈”框架,降低大模型幻覺(jué)

    近日,阿里巴巴達(dá)摩(湖畔實(shí)驗(yàn)室)攜手新加坡南洋理工大學(xué)等研究機(jī)構(gòu),共同推出了大模型知識(shí)鏈(CoK)框架。該框架不僅可實(shí)時(shí)檢索異構(gòu)知識(shí)源,還能逐步糾正推理錯(cuò)誤,有效提高了大模型在回答知識(shí)型問(wèn)題時(shí)的準(zhǔn)確率,并顯著降低了所謂的“幻覺(jué)
    的頭像 發(fā)表于 05-10 11:46 ?619次閱讀

    潤(rùn)開(kāi)鴻榮膺達(dá)摩“玄鐵優(yōu)選伙伴”獎(jiǎng)

    江蘇潤(rùn)和軟件股份有限公司的控股子公司潤(rùn)開(kāi)鴻數(shù)字科技有限公司,在近期阿里巴巴達(dá)摩玄鐵團(tuán)隊(duì)主辦的2024玄鐵RISC-V生態(tài)大會(huì)上,榮獲了備受矚目的“玄鐵優(yōu)選伙伴”獎(jiǎng)。這一榮譽(yù)是對(duì)潤(rùn)開(kāi)鴻在推動(dòng)RISC-V生態(tài)發(fā)展方面所做出的杰出貢
    的頭像 發(fā)表于 03-21 10:41 ?1228次閱讀

    玄鐵RISC-V生態(tài)大會(huì)深圳召開(kāi),達(dá)摩引領(lǐng)RISC-V創(chuàng)新應(yīng)用

    達(dá)摩院長(zhǎng)張建鋒在玄鐵RISC-V生態(tài)大會(huì)上致詞,RISC即將迎來(lái)蝶變進(jìn)入應(yīng)用爆發(fā)期 ? 從2018年起,阿里巴巴開(kāi)始投入RISC-V架構(gòu),是國(guó)內(nèi)最早涉足RISC-V的技術(shù)團(tuán)隊(duì)之一。2019年玄鐵C910處理器推出,成為全球R
    的頭像 發(fā)表于 03-19 10:02 ?4217次閱讀
    玄鐵RISC-V生態(tài)大會(huì)深圳召開(kāi),<b class='flag-5'>達(dá)摩</b><b class='flag-5'>院</b>引領(lǐng)RISC-V創(chuàng)新應(yīng)用

    達(dá)摩牽頭成立“無(wú)劍聯(lián)盟”,探索RISC-V產(chǎn)業(yè)合作新范式

    3月14日,由達(dá)摩舉辦的2024玄鐵RISC-V生態(tài)大會(huì)在深圳舉行,來(lái)自Arteris、新思科技(Synopsys)、Imagination、中國(guó)科學(xué)院軟件研究所、中國(guó)電信研究等全球數(shù)百家企業(yè)
    發(fā)表于 03-14 16:56 ?288次閱讀
    <b class='flag-5'>達(dá)摩</b><b class='flag-5'>院</b>牽頭成立“無(wú)劍聯(lián)盟”,探索RISC-V產(chǎn)業(yè)合作新范式

    阿里達(dá)摩北京公司新增AI業(yè)務(wù)

    阿里巴巴達(dá)摩(北京)科技有限公司近日進(jìn)行了工商變更,經(jīng)營(yíng)范圍有所調(diào)整。具體來(lái)說(shuō),公司去除了智聯(lián)網(wǎng)、芯片技術(shù)、量子計(jì)算等數(shù)據(jù)通信、電子產(chǎn)品、軟件和硬件技術(shù)及產(chǎn)品的研究、開(kāi)發(fā)等業(yè)務(wù),而新增了人工智能應(yīng)用軟件開(kāi)發(fā)、人工智能基礎(chǔ)軟件開(kāi)
    的頭像 發(fā)表于 02-23 11:39 ?935次閱讀

    阿里達(dá)摩在上海成立新公司,聚焦人工智能與軟件開(kāi)發(fā)

    天眼查信息顯示,達(dá)摩(上海)科技有限公司已正式成立,法定代表人為張建鋒,注冊(cè)資本為1000萬(wàn)人民幣。該公司由阿里巴巴旗下阿里巴巴達(dá)摩
    的頭像 發(fā)表于 02-04 10:52 ?872次閱讀

    【飛騰派4G版免費(fèi)試用】飛騰派SeetafaceEngine人臉檢測(cè)

    收到個(gè)飛騰派,周末有空玩玩。。。 Seetaface是2016年中科老師開(kāi)源的的人臉識(shí)別引擎。https://github.com/seetaface/SeetaFaceEngine 源碼
    發(fā)表于 12-18 10:53

    阿里達(dá)摩裁撤量子實(shí)驗(yàn)室,將所有儀器設(shè)備都捐給浙大

    時(shí)長(zhǎng)、門操控、量子糾錯(cuò),量子計(jì)算控制架構(gòu)等領(lǐng)域,達(dá)摩取得了多個(gè)重要成果,包括高精度、多比特超導(dǎo)量子芯片,量子電路經(jīng)典模擬器“太章”等。
    的頭像 發(fā)表于 12-06 16:59 ?1802次閱讀

    阿里達(dá)摩裁撤量子實(shí)驗(yàn)室證實(shí)!

    據(jù)阿里達(dá)摩證實(shí),他們已經(jīng)決定裁撤量子實(shí)驗(yàn)室,并將實(shí)驗(yàn)室及儀器設(shè)備捐贈(zèng)給浙江大學(xué)。這一舉措的目的是為了促進(jìn)量子科技的協(xié)同發(fā)展,并將捐贈(zèng)的實(shí)驗(yàn)室和設(shè)備開(kāi)放給浙江大學(xué)及其他高校和科研機(jī)構(gòu)使用。
    的頭像 發(fā)表于 11-28 18:20 ?1032次閱讀

    阿里達(dá)摩量子實(shí)驗(yàn)室裁撤 整體捐獻(xiàn)給浙江大學(xué)

    日前,阿里達(dá)摩量子實(shí)驗(yàn)室裁撤,達(dá)摩量子實(shí)驗(yàn)室以及儀器設(shè)備全部被捐給浙江大學(xué)。相關(guān)信息從首席科學(xué)家施堯耘發(fā)布的動(dòng)態(tài)可以印證;這可以說(shuō)是來(lái)自
    的頭像 發(fā)表于 11-28 16:04 ?569次閱讀

    阿里新處理器三連發(fā):提速多達(dá)15倍

    阿里巴巴達(dá)摩宣布,推出三款基于RISC-V開(kāi)放架構(gòu)的平頭哥玄鐵系列處理器,分別是玄鐵C920、玄鐵C907、玄鐵R910。
    的頭像 發(fā)表于 11-25 14:41 ?1302次閱讀
    <b class='flag-5'>阿里</b>新處理器三連發(fā):提速多達(dá)15倍