0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

標(biāo)注神器!AAAI'24最新:第一個(gè)交互式3D目標(biāo)檢測(cè)器!

3D視覺(jué)工坊 ? 來(lái)源:3D視覺(jué)工坊 ? 2024-01-16 16:08 ? 次閱讀

1. 寫(xiě)在前面

在LiDAR場(chǎng)景中標(biāo)注3D目標(biāo)非常繁瑣,今天筆者為大家推薦一篇加速3D標(biāo)注的最新工作iDet3D。這個(gè)交互式的標(biāo)注算法支持2D界面,可以以最少的交互來(lái)標(biāo)注每個(gè)場(chǎng)景中的整個(gè)目標(biāo)。

下面一起來(lái)閱讀一下這項(xiàng)工作~

2. 摘要

對(duì)LiDAR場(chǎng)景中的多個(gè)三維物體進(jìn)行精確標(biāo)注是一項(xiàng)費(fèi)力且具有挑戰(zhàn)性的工作。盡管先前的一些研究試圖利用半自動(dòng)方法來(lái)進(jìn)行具有成本效益的邊界框標(biāo)注,但這些方法在有效地處理大量多類對(duì)象方面具有局限性。為了有效加速3D標(biāo)注流水線,我們提出了一種高效的交互式3D目標(biāo)檢測(cè)器iDet3D。iDet3D支持用戶友好的2D界面,可以減輕探索3D空間提供點(diǎn)擊交互的認(rèn)知負(fù)擔(dān),使用戶能夠以最少的交互來(lái)標(biāo)注每個(gè)場(chǎng)景中的整個(gè)物體。考慮到三維點(diǎn)云的稀疏性,我們?cè)O(shè)計(jì)了負(fù)點(diǎn)擊模擬( negative click simulation,NCS ),通過(guò)減少假陽(yáng)性預(yù)測(cè)來(lái)提高精度。此外,iDet3D結(jié)合了兩種點(diǎn)擊傳播技術(shù),以充分利用用戶交互:( 1 )密集點(diǎn)擊引導(dǎo)( DCG ),用于在整個(gè)網(wǎng)絡(luò)中保存用戶提供的信息;( 2 )空間點(diǎn)擊傳播( SCP ),用于根據(jù)用戶指定的對(duì)象檢測(cè)同一類的其他實(shí)例。通過(guò)我們的大量實(shí)驗(yàn),我們發(fā)現(xiàn)我們的方法可以在少量的點(diǎn)擊中構(gòu)建精確的注釋,這表明了我們的方法作為三維物體檢測(cè)的有效注釋工具的實(shí)用性。

3. 效果展示

iDet3D中點(diǎn)擊編碼的可視化示例:(a) 輸入點(diǎn)云和用戶點(diǎn)擊(紅色箭頭)。(b) 在目標(biāo)對(duì)象上突出顯示相應(yīng)的基于距離編碼的用戶交互。

e7d40fcc-b3fa-11ee-8b88-92fbcf53809c.jpg

看一下具體標(biāo)注過(guò)程:( a ) 給定輸入點(diǎn)云。( b ) 提供對(duì)行人的正向點(diǎn)擊(紅色圓圈),iDet3D在一次點(diǎn)擊中檢測(cè)到場(chǎng)景中多個(gè)不同類別的物體。( c )在第2次迭代中,通過(guò)增加一個(gè)負(fù)點(diǎn)擊(藍(lán)色圓圈),可以一次性過(guò)濾掉假陽(yáng)性預(yù)測(cè)。( d )真值。在幾次迭代內(nèi),就可以獲得高質(zhì)量的標(biāo)注結(jié)果。

e7e4360e-b3fa-11ee-8b88-92fbcf53809c.jpg

4. 具體原理是什么?

考慮到3D點(diǎn)云的稀疏性質(zhì),iDet3D設(shè)計(jì)了負(fù)點(diǎn)擊模擬 (NCS),通過(guò)減少誤報(bào)預(yù)測(cè)來(lái)提高準(zhǔn)確性。還結(jié)合了兩種點(diǎn)擊傳播技術(shù)來(lái)充分利用用戶交互:(1) 密集點(diǎn)擊引導(dǎo) (DCG),用于在整個(gè)網(wǎng)絡(luò)中保留用戶提供的信息;(2) 空間點(diǎn)擊傳播 (SCP),用于檢測(cè)其他實(shí)例。

iDet3D的訓(xùn)練流程。給定用戶對(duì)目標(biāo)對(duì)象的點(diǎn)擊,將點(diǎn)擊轉(zhuǎn)化為點(diǎn)擊編碼。( a )密集點(diǎn)擊引導(dǎo)( DCG )在輸入端和中間層將編碼融合到骨干網(wǎng)架構(gòu)中。( b )負(fù)點(diǎn)擊模擬( Negative Click Simulation,NCS )通過(guò)選擇具有高前景分?jǐn)?shù)的具有挑戰(zhàn)性的背景點(diǎn)來(lái)隨機(jī)模擬可能的負(fù)點(diǎn)。( c )后續(xù)的空間點(diǎn)擊傳播( Spatial Click Propagation,SCP )模塊根據(jù)特征嵌入之間的相似性,有效地傳播用戶點(diǎn)擊來(lái)檢測(cè)同一類的其他對(duì)象。

e7f4843c-b3fa-11ee-8b88-92fbcf53809c.jpg

利用空間點(diǎn)擊傳播( SCP )模塊生成關(guān)聯(lián)圖的實(shí)例:( a )點(diǎn)擊關(guān)于N個(gè)輸入點(diǎn)的汽車對(duì)象(紅色箭頭)上的編碼E。( b )對(duì)N′個(gè)降采樣點(diǎn)(經(jīng)過(guò)降采樣層從N點(diǎn)降至N′點(diǎn))點(diǎn)擊編碼E′。( c )由SCP生成的點(diǎn)擊相關(guān)圖M和( d )與真實(shí)3D邊界框覆蓋的可視化。注意,與點(diǎn)擊同一類的點(diǎn)在輸出的相關(guān)圖中被突出顯示。

e809e390-b3fa-11ee-8b88-92fbcf53809c.jpg

5. 和其他SOTA方法對(duì)比如何?

baseline和iDet3D在KITTI val集上的定量結(jié)果。

e8134278-b3fa-11ee-8b88-92fbcf53809c.jpg

nuScenes數(shù)據(jù)集的基線和iDet3D ( IA-SSD Backbone)的定量結(jié)果。

e826575a-b3fa-11ee-8b88-92fbcf53809c.jpg

6. 總結(jié)

這篇文章提出了第一個(gè)交互式3D目標(biāo)檢測(cè)器iDet3D,能夠在幾次點(diǎn)擊中檢測(cè)出大量的多類物體。iDet3D設(shè)計(jì)了NCS來(lái)過(guò)濾通過(guò)負(fù)點(diǎn)擊產(chǎn)生的假陽(yáng)性預(yù)測(cè),以及兩個(gè)點(diǎn)擊傳播模塊( DCG和SCP)來(lái)為用戶提供指導(dǎo)。但是在這項(xiàng)工作中,iDet3D僅對(duì)單幀圖像進(jìn)行分析,忽略了連續(xù)幀之間的互補(bǔ)信息。未來(lái)作者將考慮處理多個(gè)連續(xù)幀之間需要對(duì)齊的點(diǎn)嵌入,進(jìn)一步改進(jìn)iDet3D。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    856

    瀏覽量

    47600
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2843

    瀏覽量

    107202
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1154

    瀏覽量

    20820

原文標(biāo)題:標(biāo)注神器!AAAI'24最新:第一個(gè)交互式3D目標(biāo)檢測(cè)器!

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    智能座艙的人車交互大戰(zhàn),3D交互將成為勝負(fù)手?

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)交互式3D的出現(xiàn)原本是為了解決網(wǎng)絡(luò)購(gòu)物過(guò)程中,消費(fèi)者對(duì)商品了解的信息偏差。通過(guò)對(duì)產(chǎn)品模型進(jìn)行3D建模,消費(fèi)者可以對(duì)其進(jìn)行拆解、旋轉(zhuǎn)、移動(dòng)等操作,這就是交互式
    的頭像 發(fā)表于 12-02 01:07 ?1913次閱讀

    基于GAC模型實(shí)現(xiàn)交互式圖像分割的改進(jìn)算法

    ,逐次進(jìn)行單個(gè)目標(biāo)的分割,最終實(shí)現(xiàn)了對(duì)3個(gè)病變細(xì)胞的準(zhǔn)確分割。   針對(duì)交互式圖像分割方法的重要問(wèn)題——如何更精確地選取“
    發(fā)表于 09-19 09:19

    如何在交互式人臉檢測(cè)演示中將Web瀏覽流用作目標(biāo)輸入?

    無(wú)法將 Web 瀏覽流用作交互式人臉檢測(cè)演示的目標(biāo)輸入。
    發(fā)表于 08-15 06:02

    英偉達(dá)再出新研究成果 可以渲染合成交互式3D環(huán)境的AI技術(shù)

    據(jù)透露,英偉達(dá)最新研發(fā)的這項(xiàng)成果,是可以渲染合成交互式3D環(huán)境的AI技術(shù)。在創(chuàng)建逼真的3D環(huán)境時(shí),英偉達(dá)研發(fā)團(tuán)隊(duì)不再使用傳統(tǒng)的圖形技術(shù),而是使用神經(jīng)網(wǎng)絡(luò) ,特別是“生成模型”,通過(guò)來(lái)自如YouTube等來(lái)源的真實(shí)視頻,進(jìn)行模型訓(xùn)
    發(fā)表于 12-12 09:22 ?940次閱讀

    自動(dòng)駕駛檢測(cè)器可同時(shí)實(shí)現(xiàn)3D檢測(cè)精讀和速度的提升

    3月19日,阿里巴巴達(dá)摩院宣布近日有論文入選計(jì)算機(jī)視覺(jué)頂會(huì)CVPR 2020。論文提出個(gè)通用、高性能的自動(dòng)駕駛檢測(cè)器,可兼顧3D物體的
    的頭像 發(fā)表于 03-20 13:40 ?2517次閱讀

    陶瓷3D打印指南: 3D Ceram快速陶瓷成型

    陶瓷3D打印已經(jīng)研究了近二十年(幾乎與AM直存在)并且從開(kāi)始就表現(xiàn)出很大的潛力,但最近才開(kāi)始出現(xiàn)陶瓷3D打印實(shí)用和商業(yè)應(yīng)用。在這個(gè)交互式
    的頭像 發(fā)表于 12-26 12:46 ?1367次閱讀

    如何處理orcad與Cadence Allegro的交互式操作

    第一方的網(wǎng)表,Allegro導(dǎo)入的是第一方網(wǎng)表,輸出的具體方法見(jiàn)第3.35問(wèn); ??Orcad軟件需要勾選以下選項(xiàng),才可以實(shí)現(xiàn)交互式的操作,執(zhí)行Options→Preference選項(xiàng),選擇
    的頭像 發(fā)表于 11-17 11:11 ?1.1w次閱讀
    如何處理orcad與Cadence Allegro的<b class='flag-5'>交互式</b>操作

    港大&amp;amp;騰訊提出DiffusionDet:第一個(gè)用于目標(biāo)檢測(cè)的擴(kuò)散模型

    近日,來(lái)自香港大學(xué)的羅平團(tuán)隊(duì)、騰訊 AI Lab 的研究者聯(lián)合提出種新框架 DiffusionDet,將擴(kuò)散模型應(yīng)用于目標(biāo)檢測(cè)。據(jù)了解,還沒(méi)有研究可以成功地將擴(kuò)散模型應(yīng)用于目標(biāo)
    的頭像 發(fā)表于 11-22 15:35 ?1797次閱讀

    Pair標(biāo)注神器推出醫(yī)學(xué)影像智能交互式分割itSeg

    本次Pair軟件V2.7版本迎來(lái)全新升級(jí),重磅推出了智能交互式分割標(biāo)注功能——Intelligent Interactive Segmentation (itSeg),僅需用戶提供少量涂鴉標(biāo)記即可實(shí)現(xiàn)解剖結(jié)構(gòu)的精細(xì)分割
    的頭像 發(fā)表于 12-01 13:55 ?1161次閱讀

    智能座艙的人車交互大戰(zhàn),3D交互將成為勝負(fù)手?

    電子發(fā)燒友網(wǎng)報(bào)道(文/ 吳子鵬 )交互式3D的出現(xiàn)原本是為了解決網(wǎng)絡(luò)購(gòu)物過(guò)程中,消費(fèi)者對(duì)商品了解的信息偏差。通過(guò)對(duì)產(chǎn)品模型進(jìn)行3D建模,消費(fèi)者可以對(duì)其進(jìn)行拆解、旋轉(zhuǎn)、移動(dòng)等操作,這就是交互式
    的頭像 發(fā)表于 12-02 07:10 ?752次閱讀

    介紹個(gè)開(kāi)源的制作交互式BOM的AD插件!

    介紹個(gè)開(kāi)源的制作交互式BOM的AD插件!
    的頭像 發(fā)表于 01-10 14:15 ?6009次閱讀
    介紹<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>開(kāi)源的制作<b class='flag-5'>交互式</b>BOM的AD插件!

    工業(yè)儀器3D交互式產(chǎn)品展示的亮點(diǎn)

    在現(xiàn)代工業(yè)生產(chǎn)中,工業(yè)儀器起著重要的作用。如何推銷展示這些復(fù)雜龐大的工業(yè)儀器效果更好? 3D交互式產(chǎn)品展示 就是個(gè)不錯(cuò)的方法,廣州華銳互動(dòng)利用3D
    的頭像 發(fā)表于 05-18 15:11 ?445次閱讀

    基于BEV的視覺(jué)3D目標(biāo)檢測(cè)器

    根據(jù)我們的實(shí)驗(yàn)分析,我們認(rèn)為實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵在于提升檢測(cè)器在 BEV 空間和 2D 空間的適應(yīng)性。這種適應(yīng)性是針對(duì) query 而言的,即對(duì)于不同的 query,檢測(cè)器要能以不同的方
    發(fā)表于 09-16 10:09 ?673次閱讀
    基于BEV的視覺(jué)<b class='flag-5'>3D</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)器</b>

    CCV 2023 | SparseBEV:高性能、全稀疏的純視覺(jué)3D目標(biāo)檢測(cè)器

    本文介紹在3D 目標(biāo)檢測(cè)領(lǐng)域的新工作:SparseBEV。我們所處的 3D 世界是稀疏的,因此稀疏 3D
    的頭像 發(fā)表于 09-19 10:00 ?892次閱讀
    CCV 2023 | SparseBEV:高性能、全稀疏的純視覺(jué)<b class='flag-5'>3D</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)器</b>

    如何搞定自動(dòng)駕駛3D目標(biāo)檢測(cè)!

    可用于自動(dòng)駕駛場(chǎng)景下基于圖像的3D目標(biāo)檢測(cè)的數(shù)據(jù)集總結(jié)。其中些數(shù)據(jù)集包括多個(gè)任務(wù),這里只報(bào)告了3D檢測(cè)
    發(fā)表于 01-05 10:43 ?514次閱讀
    如何搞定自動(dòng)駕駛<b class='flag-5'>3D</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>!