0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何縮小弱監(jiān)督信號(hào)與密集預(yù)測(cè)之間的差距

新機(jī)器視覺(jué) ? 來(lái)源:極市平臺(tái) ? 作者:PaperWeekly ? 2022-07-13 10:51 ? 次閱讀

導(dǎo)讀本文圍繞非完全監(jiān)督下的圖像分割方法最新綜述,講述用于解決“如何縮小弱監(jiān)督信號(hào)與密集預(yù)測(cè)之間的差距”的四種通用的啟發(fā)式先驗(yàn)。

前言

0f48f706-01ec-11ed-ba43-dac502259ad0.jpg

論文鏈接:https://arxiv.org/abs/2207.01223團(tuán)隊(duì)介紹:https://shenwei1231.github.io/上海交通大學(xué)人工智能研究院楊小康、沈?yàn)閳F(tuán)隊(duì)聯(lián)合華為田奇團(tuán)隊(duì)共同發(fā)布了非完全監(jiān)督(即標(biāo)簽有限)下的圖像分割方法最新綜述 “A Survey on Label-efficient Deep Segmentation: Bridging the Gap between Weak Supervision and Dense Prediction”。該工作由人工智能研究院沈?yàn)楦苯淌谥鞒?,全文包?70余篇文獻(xiàn),全面總結(jié)了不同類型的監(jiān)督標(biāo)簽在不同分割任務(wù)上的進(jìn)展情況:包括無(wú)監(jiān)督、弱監(jiān)督、半監(jiān)督、部分監(jiān)督、域遷移等多種設(shè)置下的語(yǔ)義、實(shí)例、全景分割問(wèn)題,并以統(tǒng)一視角--“如何縮小弱監(jiān)督信號(hào)與密集預(yù)測(cè)之間的差距”進(jìn)行分析,總結(jié)出用于解決這個(gè)問(wèn)題的四種通用的啟發(fā)式先驗(yàn):① cross-label constraint (跨標(biāo)簽約束);② cross-pixel similarity(跨像素相似性);③ cross-view consistency(跨視圖一致性);④ cross-image relation(跨圖像關(guān)系)。

0f6192e8-01ec-11ed-ba43-dac502259ad0.jpg

▲不同模態(tài)的數(shù)據(jù)會(huì)被分別經(jīng)過(guò)“連續(xù)向量路徑”和“離散詞路徑”,分別為連續(xù)向量和離散詞向量作為其的特征;最終的特征為二者的向量和。

背景與問(wèn)題

圖像分割是計(jì)算機(jī)視覺(jué)領(lǐng)域最古老最廣泛的研究任務(wù)之一。它的目標(biāo)是對(duì)給定的圖像來(lái)生成密集的預(yù)測(cè),根據(jù)預(yù)測(cè)的類型決定具體的分割方向,例如:給每個(gè)像素分配一個(gè)預(yù)定義的類別標(biāo)簽為語(yǔ)義分割;為每個(gè)像素預(yù)測(cè)一個(gè)對(duì)象實(shí)例標(biāo)簽為實(shí)例分割;或前兩者的預(yù)測(cè)結(jié)果的組合為全景分割。無(wú)論哪種具體分割方向,其都能使語(yǔ)義相似的像素組成有意義的概念,如動(dòng)態(tài)對(duì)象(人、貓、球等)和靜態(tài)物體(道路、天空、水等)。在過(guò)去的近十年里,深度學(xué)習(xí)的出現(xiàn)極大地帶動(dòng)了圖像分割領(lǐng)域的研究進(jìn)展,特別是隨著全卷積網(wǎng)絡(luò)(FCN)的發(fā)展,諸如DeepLab系列,Mask RCNN系列等方法憑借卷積網(wǎng)絡(luò)強(qiáng)大的密集特征表征能力以及獨(dú)特的設(shè)計(jì)在圖像分割領(lǐng)域大放異彩,取得了非常好的分割效果。然而這些方法也存在著一個(gè)共同的缺點(diǎn),即往往分割效果與具有可用的密集標(biāo)注的圖像的數(shù)量是成正比的,對(duì)像素級(jí)的標(biāo)簽的需求量非常大。但是人為地給每一張圖像做像素級(jí)的標(biāo)注卻非常地耗費(fèi)時(shí)間與精力,這不僅限制了深度學(xué)習(xí)的進(jìn)一步發(fā)展,而且限制了圖像分割在真實(shí)工業(yè)場(chǎng)景中的應(yīng)用。近年來(lái),設(shè)計(jì)基于非完全監(jiān)督信號(hào)來(lái)減少對(duì)密集標(biāo)簽依賴的分割方法越來(lái)越受到關(guān)注,非完全監(jiān)督下的圖像分割方法的數(shù)量呈爆發(fā)式增長(zhǎng),由于缺少對(duì)這些方法進(jìn)行系統(tǒng)地歸納總結(jié),這給研究者學(xué)習(xí)跟進(jìn)最新研究進(jìn)展帶來(lái)不小的挑戰(zhàn)。 然而,目前僅有個(gè)別幾篇相關(guān)的調(diào)研論文,且它們僅僅關(guān)注于一個(gè)特定的分割任務(wù),并僅包含個(gè)別類型的弱標(biāo)簽,無(wú)法做到全面的總結(jié)。

本文工作

本文研究人員旨在提供一個(gè)面向于非完全監(jiān)督下圖像分割領(lǐng)域的全面的綜述,分析語(yǔ)義分割、實(shí)例分割、全景分割三類使用弱監(jiān)督信號(hào)(標(biāo)簽)來(lái)解決分割問(wèn)題的方法之間的統(tǒng)一性與關(guān)聯(lián)性。為了達(dá)到該目的,研究人員需要想好兩個(gè)問(wèn)題:

如何對(duì)這些方法建立合適分類與關(guān)聯(lián)?

如何從統(tǒng)一的角度總結(jié)這些方法所使用的策略?

研究人員注意到,弱標(biāo)簽的類型是設(shè)計(jì)非完全監(jiān)督圖像分割方法的關(guān)鍵,決定了可用信息的多少,因此試圖從弱標(biāo)簽信號(hào)差異的角度來(lái)回答上述兩個(gè)問(wèn)題。針對(duì)第一個(gè)問(wèn)題,本綜述首先總結(jié)出層次化的非完全監(jiān)督信號(hào)的分類,具體類型包括如下所示:

無(wú)監(jiān)督信號(hào):即訓(xùn)練集中的圖像沒(méi)有任何標(biāo)注信號(hào)(圖 2a)。

粗粒度監(jiān)督信號(hào):即訓(xùn)練集中的圖像有標(biāo)注信號(hào),但這些信號(hào)不是像素級(jí)的,無(wú)法為每一個(gè)像素提供類別信息或者實(shí)例信息。(圖2b)在該類型下主要包括:

圖像級(jí)別的標(biāo)注

檢測(cè)框級(jí)別的標(biāo)注

涂鴉級(jí)別的標(biāo)注

不完全監(jiān)督信號(hào):即訓(xùn)練集中的一部分圖像有像素級(jí)的標(biāo)注信號(hào)(圖2c)。在該類型下主要包括:

半監(jiān)督標(biāo)簽,即屬于同域的另一部分圖像沒(méi)有任何標(biāo)簽

特定域的標(biāo)簽,即另一部分圖像屬于另一個(gè)域,其沒(méi)有任何標(biāo)注

部分密集標(biāo)簽,即屬于同域的另一部分圖像有檢測(cè)框級(jí)別的弱標(biāo)注

帶噪監(jiān)督信號(hào):即有像素級(jí)別的標(biāo)注,但是這些標(biāo)注并不一定全部準(zhǔn)確(圖 2d)。

根據(jù)這些分類,再結(jié)合不同的任務(wù)類型,整理出來(lái)了如圖 1 所示的分類表,也標(biāo)注了不同任務(wù)不同標(biāo)簽類型下已有的代表性工作和待開(kāi)發(fā)的領(lǐng)域。

0f7359e2-01ec-11ed-ba43-dac502259ad0.jpg

▲圖2. 每一種弱監(jiān)督信號(hào)的示意圖。第一列為完全密集監(jiān)督信號(hào)的例子。針對(duì)第二個(gè)問(wèn)題,本綜述結(jié)合不同弱監(jiān)督信號(hào)之間的關(guān)聯(lián)以及對(duì) 170 余篇論文進(jìn)行歸納提煉后,總結(jié)出了四種通用的啟發(fā)式先驗(yàn):

cross-label constraint,即跨標(biāo)簽約束:弱標(biāo)簽與密集標(biāo)簽之間具有一些約束關(guān)系,如給定圖像的類別標(biāo)簽,我們可以知道圖中必有至少一個(gè)像素屬于該類別。

cross-pixel similarity,即跨像素相似性:具有諸如顏色,紋理,高層次特征相似性的像素點(diǎn)很可能是同類像素或者同對(duì)象像素。

cross-view consistency,即跨視圖一致性:同一張圖的不同的視角具有強(qiáng)關(guān)聯(lián)性/預(yù)測(cè)一致性。

cross-image relation,即跨圖像關(guān)系:不同圖像中屬于同一類別的實(shí)例具有相同的語(yǔ)義關(guān)系。

通過(guò)下列表1的代表性方法的核心做法歸納中可以看到,在各種監(jiān)督信號(hào)/各種任務(wù)下,這四種先驗(yàn)貫穿每一種任務(wù)設(shè)定,證明了本綜述總結(jié)的啟發(fā)式先驗(yàn)具有通用性。

0f8436ea-01ec-11ed-ba43-dac502259ad0.jpg

▲表1. 多種弱監(jiān)督信號(hào)下的圖像分割代表性工作。

0f9e4602-01ec-11ed-ba43-dac502259ad0.jpg

▲表2. 統(tǒng)一的數(shù)學(xué)描述。本綜述幾乎對(duì)各章節(jié)部分(即某種監(jiān)督信號(hào)下的某個(gè)任務(wù))都總結(jié)了一個(gè)具有概括性的流程圖,便于研究人員明確當(dāng)前已有工作的入手點(diǎn)與研究路線,如圖 3 所示。

0fb95604-01ec-11ed-ba43-dac502259ad0.jpg

▲圖3. 部分論文圖示預(yù)覽

總結(jié)

本綜述對(duì)現(xiàn)有不完全監(jiān)督下的圖像分割方法進(jìn)行了歸納總結(jié),同時(shí)也分析了未來(lái)的潛在研究方向,包括:

結(jié)合文本監(jiān)督的零樣本圖像分割。 多模態(tài)技術(shù)是未來(lái)的主流方向,也更貼近人的認(rèn)知系統(tǒng)。從文本中獲得一定的語(yǔ)義信息可以更好的幫助新類別的識(shí)別與分割,利于零樣本任務(wù)的發(fā)展。

利用 Transformer 特性的不完全監(jiān)督圖像分割方法。 當(dāng)前大部分方法還是基于卷積神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)的,爆火的 Transformer 在不完全監(jiān)督下的圖像分割領(lǐng)域目前還沒(méi)有被探索,許多 Transformer 特性可能對(duì)該任務(wù)具有更有力的優(yōu)勢(shì)。

還未開(kāi)拓的利用其他不完全監(jiān)督信號(hào)的方案。 如圖 1 所示,這里依然有很多方向還沒(méi)有被探索,如帶噪監(jiān)督信號(hào)下的實(shí)例分割等,研究者可以發(fā)掘更多合理的任務(wù)設(shè)置,充分利用現(xiàn)有的具有多種標(biāo)注類型的數(shù)據(jù)集。

原文標(biāo)題:綜述|上海交大&華為:非完全監(jiān)督下基于深度學(xué)習(xí)的圖像分割方法

文章出處:【微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 像素
    +關(guān)注

    關(guān)注

    1

    文章

    202

    瀏覽量

    18533
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46348

    瀏覽量

    236509
  • 圖像分割算法
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    6303

原文標(biāo)題:綜述|上海交大&華為:非完全監(jiān)督下基于深度學(xué)習(xí)的圖像分割方法

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    4G5G手機(jī)信號(hào)放大器:從到強(qiáng),為數(shù)字生活加速

    深圳特信屏蔽器|4G5G手機(jī)信號(hào)放大器:從到強(qiáng),為數(shù)字生活加速
    的頭像 發(fā)表于 09-11 16:18 ?321次閱讀

    深圳特信屏蔽器 2G手機(jī)信號(hào)放大器:從鄉(xiāng)村到城市,信號(hào)不再

    深圳特信屏蔽器|2G手機(jī)信號(hào)放大器:從鄉(xiāng)村到城市,信號(hào)不再
    的頭像 發(fā)表于 08-05 09:03 ?411次閱讀

    電機(jī)磁時(shí)的電流大小關(guān)系?

    電機(jī)的相電流按矢量選擇分為勵(lì)磁電流和轉(zhuǎn)矩電流,勵(lì)磁電流用于產(chǎn)生磁場(chǎng),轉(zhuǎn)矩電流用于提供扭矩。 在電機(jī)磁時(shí),即到達(dá)恒功率區(qū)時(shí)刻,電機(jī)的勵(lì)磁電流開(kāi)始減小,這是因?yàn)橐?b class='flag-5'>弱磁,但是轉(zhuǎn)矩電流會(huì)增大,這是因?yàn)橐?/div>
    發(fā)表于 07-13 13:09

    三星加強(qiáng)半導(dǎo)體封裝技術(shù)聯(lián)盟,以縮小與臺(tái)積電差距

    據(jù)最新報(bào)道,三星電子正積極加強(qiáng)其在半導(dǎo)體封裝技術(shù)領(lǐng)域的聯(lián)盟建設(shè),旨在縮小與全球半導(dǎo)體制造巨頭臺(tái)積電之間的技術(shù)差距。為實(shí)現(xiàn)這一目標(biāo),三星預(yù)計(jì)將在今年進(jìn)一步擴(kuò)大其2.5D和3D MDI(多芯片集成)聯(lián)盟,計(jì)劃新增十名成員。
    的頭像 發(fā)表于 06-11 09:32 ?455次閱讀

    什么是電機(jī)的磁?電機(jī)磁的可能原因有哪些?

    在電機(jī)運(yùn)行的過(guò)程中,我們有時(shí)會(huì)遇到電機(jī)磁的情況。電機(jī)磁,簡(jiǎn)而言之,即電機(jī)在運(yùn)行時(shí)輸出功率下降,不足以滿足正常使用需求的現(xiàn)象。這一現(xiàn)象可能由多種原因引起,對(duì)電機(jī)的性能和運(yùn)行穩(wěn)定性產(chǎn)生不良影響。本文將詳細(xì)探討電機(jī)的磁現(xiàn)象及其可
    的頭像 發(fā)表于 06-04 16:15 ?3080次閱讀

    商湯科技采購(gòu)40000顆英偉達(dá)芯片,縮小中美算力差距

    徐冰認(rèn)為,國(guó)產(chǎn)芯片崛起以及算力商品化帶來(lái)的投資價(jià)值,使中美算力差距有望逐步縮小。只要中國(guó)持續(xù)在算力研發(fā)上投入資金及資源,便能拉近與美國(guó)的算力差距
    的頭像 發(fā)表于 05-28 11:25 ?876次閱讀

    4G手機(jī)信號(hào)放大器:解決信號(hào)區(qū),提升移動(dòng)網(wǎng)絡(luò)

    深圳特信電子|4G手機(jī)信號(hào)放大器:解決信號(hào)區(qū),提升移動(dòng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-06 08:58 ?1352次閱讀

    三星顯示CEO:中韓OLED顯示器企業(yè)技術(shù)差距僅1年

    三星Display社長(zhǎng)崔周善表示:“與中國(guó)顯示器企業(yè)的技術(shù)差距縮小到1年或1年半。為了維持技術(shù)超差距,有必要聚集人才,提高研發(fā)的效率?!?/div>
    的頭像 發(fā)表于 03-08 14:54 ?963次閱讀

    縮短連續(xù)傳導(dǎo)模式與過(guò)渡模式功率因數(shù)校正器之間差距

    電子發(fā)燒友網(wǎng)站提供《縮短連續(xù)傳導(dǎo)模式與過(guò)渡模式功率因數(shù)校正器之間差距.pdf》資料免費(fèi)下載
    發(fā)表于 02-28 10:06 ?0次下載

    Meta發(fā)布新型無(wú)監(jiān)督視頻預(yù)測(cè)模型“V-JEPA”

    Meta,這家社交媒體和科技巨頭,近日宣布推出一種新型的無(wú)監(jiān)督視頻預(yù)測(cè)模型,名為“V-JEPA”。這一模型在視頻處理領(lǐng)域引起了廣泛關(guān)注,因?yàn)樗ㄟ^(guò)抽象性預(yù)測(cè)生成視頻中缺失或模糊的部分來(lái)進(jìn)行學(xué)習(xí),提供了一種全新的視頻處理方法。
    的頭像 發(fā)表于 02-19 11:19 ?864次閱讀

    在TC3XX系列中,safety manual中寫(xiě)著DTSCLIM和PMS-DTSLIM之間差距大于9攝氏度,為什么?

    在TC3XX系列中,safety manual中寫(xiě)著DTSCLIM和PMS-DTSLIM之間差距大于9攝氏度,認(rèn)為此時(shí)是異常的,要觸發(fā)alarm。請(qǐng)問(wèn)為什么要設(shè)計(jì)成這樣,這個(gè)閾值為啥是9攝氏度
    發(fā)表于 01-22 06:36

    基于神經(jīng)輻射場(chǎng)的自監(jiān)督多相機(jī)占用預(yù)測(cè)

    本研究提出了一種自監(jiān)督的多攝相機(jī)3D占據(jù)預(yù)測(cè)方法,名為OccNeRF。該方法旨在解決無(wú)界場(chǎng)景的建模問(wèn)題。
    的頭像 發(fā)表于 01-02 14:53 ?371次閱讀
    基于神經(jīng)輻射場(chǎng)的自<b class='flag-5'>監(jiān)督</b>多相機(jī)占用<b class='flag-5'>預(yù)測(cè)</b>

    韓荷簽署“半導(dǎo)體同盟”協(xié)議,致力于縮小技術(shù)差距

    這份官方聲明中詳細(xì)列舉了兩國(guó)將如何攜手縮小技術(shù)差距以及共同應(yīng)對(duì)供應(yīng)鏈風(fēng)險(xiǎn)。其中包括,通過(guò)定期的經(jīng)濟(jì)安全對(duì)話來(lái)加強(qiáng)外交領(lǐng)域的合作;同時(shí)兩國(guó)商務(wù)部門(mén)也會(huì)設(shè)立對(duì)話機(jī)制,就芯片政策達(dá)成共識(shí),并簽署供應(yīng)鏈合作諒解備忘錄。
    的頭像 發(fā)表于 12-15 10:01 ?326次閱讀

    伯恩斯坦分析師:特斯拉和比亞迪之間的估值差距不合理

    伯恩斯坦公司的分析師Toni Sacconaghi和Eunice Lee表示,考慮到特斯拉和比亞迪的銷售額、純電動(dòng)汽車銷售及利潤(rùn)相似,很難彌補(bǔ)特斯拉(市值約7300億美元)和比亞迪(市值約840億美元)之間的市值差距。
    的頭像 發(fā)表于 11-30 09:39 ?506次閱讀

    電機(jī)磁后功率怎么計(jì)算?

    關(guān)于電機(jī)進(jìn)行磁后,其功率是如何計(jì)算的,目前有臺(tái)電機(jī)額定30KW.400V,1465rpm,53A,對(duì)其進(jìn)行磁后實(shí)際運(yùn)行頻率為22HZ,電流23A,但是其實(shí)際輸出功率才4.5左右,請(qǐng)問(wèn)磁后電機(jī)功率該怎么去計(jì)算,或者各項(xiàng)參數(shù)
    發(fā)表于 11-21 06:32