0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么樣的點可以稱為三維點云中的關(guān)鍵點呢?

3D視覺工坊 ? 來源:3D視覺工坊 ? 作者:秦嶺北麓小丹童 ? 2022-11-22 09:46 ? 次閱讀

0.筆者個人體會:

這個工作來自于香港科技大學和香港城市大學。我們知道,隨著三維傳感器以及相關(guān)掃描技術(shù)的進步,三維點云已經(jīng)成為三維視覺領(lǐng)域內(nèi)一項十分重要的數(shù)據(jù)形式。并且隨著深度學習技術(shù)的發(fā)展,許多經(jīng)典的點云深度學習處理方法被提出來。但是,現(xiàn)有的大多數(shù)方法都關(guān)注于點云的特征描述子學習。并且,在稠密的點云數(shù)據(jù)幀中,如果對所有點云都進行處理,將會帶來巨大的計算和內(nèi)存壓力。

針對這種問題,提取部分具有代表性的關(guān)鍵點則成為一種自然而且有效的策略。但是,什么樣的點可以稱為三維點云中的關(guān)鍵點呢?這個問題仍然是一個開放的、沒有明確答案的問題。 本工作受D2-Net啟發(fā),提出了一種新的三維點云關(guān)鍵點定義方式,將其與三維點的特征描述子關(guān)聯(lián)起來,有效的回答了什么是三維點云中的關(guān)鍵點,并驗證了該方法檢測到的關(guān)鍵點的可重復(fù)性。

但是,本方法的不足也十分明顯。正是由于它將關(guān)鍵點的檢測定義在三維點云點特征上,因此,在檢測關(guān)鍵點時,需要對輸入點云的所有點都提取相應(yīng)的點特征。這樣的話,即使此方法檢測到的關(guān)鍵點可以有效用于后續(xù)任務(wù),但此方法本身仍需處理完整點云中的所有點,并不能在關(guān)鍵點提取階段就有效的降低計算和內(nèi)存壓力。

1、論文相關(guān)內(nèi)容介紹:

論文標題:? D3Feat: Joint Learning of Dense Detection and Description of 3D Local Features

摘要:

成功的點云配準通常取決于通過有區(qū)分性的3D局部特征魯棒地建立稀疏匹配。盡管基于學習的3D特征描述子發(fā)展迅速,但很少有人關(guān)注3D特征檢測器的學習,更不用說兩個任務(wù)的聯(lián)合學習。

在本文中,我們將3D全卷積網(wǎng)絡(luò)用于 3D點云,并提出了一種新穎實用的學習機制,可以稠密預(yù)測每個3D點的檢測分數(shù)和描述特征。特別是,我們提出了一種關(guān)鍵點選擇策略,該策略克服了3D點云的固有密度變化,并進一步提出了一種由訓(xùn)練期間的動態(tài)特征匹配結(jié)果引導(dǎo)的自監(jiān)督檢測器損失。

最后,我們的方法在3DMatch和KITTI數(shù)據(jù)集上進行了評估,在室內(nèi)和室外場景中都取得了最先進的結(jié)果,并在ETH數(shù)據(jù)集上顯示了其強大的泛化能力。在實際使用中,結(jié)果表明,通過采用可靠的特征檢測器,采樣較少數(shù)量的特征就足以實現(xiàn)準確和快速的點云對齊。

主要貢獻:

1.我們利用基于KPConv的全卷積網(wǎng)絡(luò),并采用聯(lián)合學習框架進行3D局部特征檢測和描述,無需構(gòu)建對偶結(jié)構(gòu),從而可以進行快速推理。

2. 我們提出了一種新的密度不變關(guān)鍵點選擇策略,這是獲得3D點云可重復(fù)性高的關(guān)鍵點的關(guān)鍵。 3. 我們提出了一種自監(jiān)督檢測器損失,它在訓(xùn)練期間從動態(tài)特征匹配結(jié)果中獲取有意義的引導(dǎo),從而保證了緊密耦合的描述子和檢測器的收斂。

方法介紹:

D2-Net是一種最近提出的一種2D 圖像匹配方法,受其啟發(fā),我們沒有為關(guān)鍵點檢測和描述訓(xùn)練單獨的網(wǎng)絡(luò),而是設(shè)計了一個具有雙重作用的單個神經(jīng)網(wǎng)絡(luò):稠密特征描述符和關(guān)鍵點檢測器。

然而,由于點云的不規(guī)則性和不同的稀疏性,將D2-Net的思想應(yīng)用于3D領(lǐng)域并非易事。在下方法,我們將首先描述對不規(guī)則 3D點云進行特征描述子提取和和關(guān)鍵點檢測的基本步驟,然后解釋我們的方法在3D領(lǐng)域中處理稀疏性變化的策略。

65efa5a0-69f2-11ed-8abf-dac502259ad0.png

Fig1:(左)D3Feat的網(wǎng)絡(luò)架構(gòu)。每個塊表示一個使用KPConv代替圖像卷積的ResNet塊。除了最后一層之外的所有層都使用Batch Normalization和ReLU。(右)關(guān)鍵點檢測。在稠密點特征提取之后,我們通過應(yīng)用顯著性分數(shù)和通道最大分數(shù)來計算關(guān)鍵點檢測分數(shù)。

一、稠密特征描述子提取

為了解決不規(guī)則點的卷積問題并更好地捕獲局部幾何信息,KPConv方法被提出來,它使用帶卷積權(quán)重的核點來模擬二維卷積中的核像素,然后在原始點云上定義卷積操作。我們采用KPConv作為我們的骨干網(wǎng)絡(luò)來執(zhí)行稠密特征提取操作。下面我們先簡單回顧一下KPConv的方法。 以矩陣形式表示給定的一組點662b244a-69f2-11ed-8abf-dac502259ad0.png和一組特征663860c4-69f2-11ed-8abf-dac502259ad0.png,令xi和fi分別表示中的第i個點及其在6643704a-69f2-11ed-8abf-dac502259ad0.png中相應(yīng)的特征。定義在核g上的x點的卷積為 66529c5a-69f2-11ed-8abf-dac502259ad0.png 其中66668d5a-69f2-11ed-8abf-dac502259ad0.png是x點的半徑鄰域,xi是該鄰域的支撐點。核函數(shù)定義為 66739dd8-69f2-11ed-8abf-dac502259ad0.png 其中 是核點66885caa-69f2-11ed-8abf-dac502259ad0.png和支持點之間的相關(guān)性函數(shù),669ac8cc-69f2-11ed-8abf-dac502259ad0.png是核點66885caa-69f2-11ed-8abf-dac502259ad0.png 的權(quán)重矩陣,K是核點的個數(shù)。

我們建議讀者參考KPConv原始論文了解更多詳細信息。 KPConv的原始公式不是對點云密度不變的,因此,我們在以上公式中添加了一個密度歸一化項,它總結(jié)了x附近的支持點的數(shù)量,以確保卷積是稀疏不變的的: 66c09372-69f2-11ed-8abf-dac502259ad0.png

基于歸一化核點卷積,我們采用帶有跨層連接和殘差塊的類似UNet的結(jié)構(gòu)來構(gòu)建全卷積網(wǎng)絡(luò),如圖1(左)所示。 與僅支持稀疏特征描述子的基于塊的方法不同,我們的網(wǎng)絡(luò)能夠在完卷積設(shè)置下執(zhí)行稠密的特征描述子提取。我們網(wǎng)絡(luò)的輸出是二維矩陣66d16b0c-69f2-11ed-8abf-dac502259ad0.png形式的稠密特征圖,其中c是特征向量的維度。點的描述子記為66df9de4-69f2-11ed-8abf-dac502259ad0.png66f3f0aa-69f2-11ed-8abf-dac502259ad0.png 其中67044a9a-69f2-11ed-8abf-dac502259ad0.png表示二維矩陣的第i行,特征描述子被L2歸一化到單位長度。

二、稠密關(guān)鍵點檢測

D2-Net在特征圖的空間和通道維度上的局部最大值,并使用softmax來評估像素的局部最大值以檢測二維圖像關(guān)鍵點。由于圖像的規(guī)則結(jié)構(gòu),他們的方法只是選擇相鄰像素作為鄰域。為了將他們的方法擴展到 3D,這種策略可能會被半徑鄰域所取代,以處理點云的非均勻采樣設(shè)置。

但是,半徑鄰域中的相鄰點的數(shù)量可能會有很大差異。在這種情況下,如果我們簡單地使用softmax來評估空間維度上的局部最大值,那么點較少的局部區(qū)域本來就會有更高的分數(shù)。為了解決這個問題,我們提出了一個密度不變的顯著性分數(shù)來評估某個點與其局部鄰域相比的顯著性。給定稠密特征圖66d16b0c-69f2-11ed-8abf-dac502259ad0.png,我們認為為3D響應(yīng) 671f92a0-69f2-11ed-8abf-dac502259ad0.png的集合: 67341838-69f2-11ed-8abf-dac502259ad0.png 其中67489cd6-69f2-11ed-8abf-dac502259ad0.png表示二維矩陣的第 k 列。點為關(guān)鍵點的原則是 675aa85e-69f2-11ed-8abf-dac502259ad0.png 其中677195aa-69f2-11ed-8abf-dac502259ad0.png是xi的半徑鄰域。這表示 首先選擇最顯著的通道,然后通過它是否是該特定響應(yīng)圖678248aa-69f2-11ed-8abf-dac502259ad0.png上其空間局部鄰域的最大值來驗證。在訓(xùn)練期間,我們通過應(yīng)用兩個分數(shù)來使上述過程可微以使其可訓(xùn)練,如圖 1(右)所示。

1.密度不變顯著性得分:

該分數(shù)旨在評估一個點與其局部鄰域中的其他點相比的顯著性。在 D2-Net中,評估局部最大值的分數(shù)定義為xi 6792040c-69f2-11ed-8abf-dac502259ad0.png 然而,這個公式對于稀疏性不是不變的。因為分數(shù)是通過總和歸一化的,這使得稀疏區(qū)域固有的比稠密區(qū)域具有更高的分數(shù)。

因此,我們設(shè)計了一個密度不變的顯著性分數(shù),如下所示: 67a401ca-69f2-11ed-8abf-dac502259ad0.png 在這個公式中,一個點的顯著性分數(shù)被計算為其特征與其局部鄰域的平均特征之間的差異。因此,它測量了中心點相對于局部區(qū)域中支持點的相對顯著性。此外,使用平均響應(yīng)代替總和可以防止分數(shù)受到鄰域中點數(shù)的影響。

2.通道最大得分:

該分數(shù)旨在為每個點挑選最顯著的通道: 67aecaf6-69f2-11ed-8abf-dac502259ad0.png 最后,將兩個分數(shù)都考慮到最終的關(guān)鍵點檢測得分: 67bed5ae-69f2-11ed-8abf-dac502259ad0.png 因此,在獲得輸入點云的關(guān)鍵點得分圖后,我們選擇得分最高的點作為關(guān)鍵點。

三、聯(lián)合優(yōu)化特征描述子提取器和關(guān)鍵點檢測器

設(shè)計合適的監(jiān)督信號是聯(lián)合優(yōu)化特征描述子提取器和關(guān)鍵點檢測器的關(guān)鍵。在本節(jié)中,我們將首先描述描述子的度量學習損失,然后從自監(jiān)督的角度設(shè)計檢測器損失。

1.特征描述子提取損失函數(shù)

為了優(yōu)化特征描述子提取網(wǎng)絡(luò),許多工作嘗試使用度量學習策略,如對比損失和三元組損失。我們這里將使用對比損失,因為從我們的實驗中可以發(fā)現(xiàn)它可以提供更好的收斂性能。至于采樣策略,我們采用的是hardest in batch策略,使網(wǎng)絡(luò)專注于最難的點對。 給定一對部分重疊的點云碎片P和Q,以及一個包括n對對應(yīng)3D點的集合。假設(shè)67d343cc-69f2-11ed-8abf-dac502259ad0.png是一個對應(yīng)對,對應(yīng)的兩點的描述子記為67e52c40-69f2-11ed-8abf-dac502259ad0.png67f5d522-69f2-11ed-8abf-dac502259ad0.png,得分記為6801616c-69f2-11ed-8abf-dac502259ad0.png68126836-69f2-11ed-8abf-dac502259ad0.png,然后將正樣本對之間的距離定義為它們的描述子之間的歐幾里得距離,即 682098e8-69f2-11ed-8abf-dac502259ad0.png 負樣本對之間的距離被定義為: 682d5038-69f2-11ed-8abf-dac502259ad0.png 其中R是安全半徑,6845ef26-69f2-11ed-8abf-dac502259ad0.png是位于真實對應(yīng)安全半徑之外的最難負樣本。對比損失定義為 68567dfa-69f2-11ed-8abf-dac502259ad0.png 其中686d1574-69f2-11ed-8abf-dac502259ad0.png是正對的邊界,687de818-69f2-11ed-8abf-dac502259ad0.png是負對的邊界。

2.關(guān)鍵點檢測器損失函數(shù)

為了優(yōu)化關(guān)鍵點檢測器網(wǎng)絡(luò),我們尋求一種損失公式,鼓勵容易匹配的對應(yīng)點比難以匹配的對應(yīng)點具有更高的關(guān)鍵點檢測分數(shù)。D2-Net提出了對三元組邊界損失的擴展,以聯(lián)合優(yōu)化特征描述子提取和關(guān)鍵點檢測器: 688db252-69f2-11ed-8abf-dac502259ad0.png

其中M是三元組邊界。然而,這個損失并沒有為分數(shù)項提供明確的引導(dǎo),并且這個原始損失公式并不能保證在我們的方法收斂。

因此,我們設(shè)計了一個損失項來明確引導(dǎo)分數(shù)的梯度。從自監(jiān)督的角度來看,我們使用on-the-fly特征匹配結(jié)果來評估每個對應(yīng)點的判別性,這將引導(dǎo)每個關(guān)鍵點的得分的梯度傳播。

如果對應(yīng)點在當前描述子提取網(wǎng)絡(luò)下可以匹配,我們希望其得分更高,反之亦然。具體來說,我們將關(guān)鍵點檢測器損失定義為 68c67cd6-69f2-11ed-8abf-dac502259ad0.png 直觀地說,如果68d6be0c-69f2-11ed-8abf-dac502259ad0.png,則表明該對應(yīng)點可以使用最近鄰搜索正確匹配,并且損失項將鼓勵對應(yīng)的兩點獲得的分數(shù)68e8c8ea-69f2-11ed-8abf-dac502259ad0.png68fcd164-69f2-11ed-8abf-dac502259ad0.png更高。相反,如果690cfa44-69f2-11ed-8abf-dac502259ad0.png ,則對應(yīng)點的描述子不足以使它們建立對應(yīng)關(guān)系,因此損失將鼓勵降低其得分。








審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    854

    瀏覽量

    47598
  • ETH
    ETH
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    3474
  • 卷積網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    0

    文章

    42

    瀏覽量

    2145

原文標題:什么樣的點可以稱為三維點云的關(guān)鍵點?

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    基于深度的關(guān)鍵匹配算法實現(xiàn)單步多人絕對三維姿態(tài)

    對于二信息,我們采用與 OpenPose 相同的表示方式。關(guān)鍵熱度圖(Heatmaps)表示關(guān)鍵位于某個像素的概率,
    的頭像 發(fā)表于 09-02 17:03 ?4856次閱讀

    基于深度學習的三維云配準方法

    基于深度學習的三維云配準方法成為研究的主流,并隨之誕生了DeepVCP、DGR、Predator等著名的方法。
    發(fā)表于 11-29 11:41 ?1692次閱讀

    起點,經(jīng)過,終點,三點xyz,畫三維圓弧。

    大家好!已知,起點,經(jīng)過,終點,三點xyz,畫三維圓弧。在三維圖片框里面畫。該如何實現(xiàn)?甚至三維
    發(fā)表于 07-17 21:33

    如何運用LabVIEW中的三維控件

    如何運用LabVIEW中的三維控件?我想將excel中的數(shù)據(jù)在LabVIEW中顯示出來,顯現(xiàn)出三維定點的效果
    發(fā)表于 05-15 16:28

    三維快速建模技術(shù)與三維掃描建模的應(yīng)用

    `三維快速建模技術(shù)與三維掃描建模的應(yīng)用隨著數(shù)字化測量的發(fā)展,三維激光掃描儀能夠快速地以多角度、高效、高精度方式獲取物體的表面三維數(shù)據(jù),可以
    發(fā)表于 08-07 11:14

    想問下如果知道一個物體的三維集,labview有沒有哪個部件,能夠用給出的集繪制成三維圖,類似3dmax的效果

    想問下如果知道一個物體的三維集,labview有沒有哪個部件,能夠用給出的集繪制成三維圖,類似3dmax的效果如題
    發(fā)表于 07-02 18:26

    視頻運動捕獲系統(tǒng)中多標記三維跟蹤算法

    針對視頻運動參數(shù)捕獲系統(tǒng)中標記無法被正確匹配及跟蹤的問題,提出一種多目標三維立體跟蹤算法。該算法通過二三維卡爾曼濾波預(yù)測來標記的位置
    發(fā)表于 04-08 09:00 ?21次下載

    港中文和商湯研究員提出高效的三維云目標檢測?新框架

    與二圖像中會相互遮擋的物體不同,三維云中的物體都是天然分離的,使得三維目標內(nèi)部各個部分的相對位置可以
    的頭像 發(fā)表于 08-02 14:18 ?3443次閱讀
    港中文和商湯研究員提出高效的<b class='flag-5'>三維</b><b class='flag-5'>點</b>云目標檢測?新框架

    便攜式三維掃描儀反光標記

    便攜式三維掃描儀反光標記 手持式三維激光掃描儀激光反光標記可以定制:3mm、3.5mm、4mm、5mm、6mm、8mm、10mm、12m
    發(fā)表于 04-10 11:43 ?3375次閱讀

    計算機視覺:三維云數(shù)據(jù)處理學習內(nèi)容總結(jié)

    三維計算視覺研究內(nèi)容包括: 1)三維匹配:兩幀或者多幀云數(shù)據(jù)之間的匹配,因為激光掃描光束受物體遮擋的原因,不可能通過一次掃描完成對整個物體的三維
    的頭像 發(fā)表于 11-27 10:32 ?4751次閱讀

    通過多模態(tài)特征融合來設(shè)計三維云分類模型

    針對云數(shù)據(jù)本身信息量不足導(dǎo)致現(xiàn)有三維云分類方法分類精度較低的問題,結(jié)合多模態(tài)特征融合,設(shè)計一種三維云分類模型。通過引入投影圖對
    發(fā)表于 03-11 14:09 ?3次下載
    通過多模態(tài)特征融合來設(shè)計<b class='flag-5'>三維</b><b class='flag-5'>點</b>云分類模型

    基于深度學習的三維云語義分割研究分析

    近年來,深度傳感器和三維激光掃描儀的普及推動了三維云處理方法的快速發(fā)展。云語義分割作為理解三維場景的
    發(fā)表于 04-01 14:48 ?16次下載
    基于深度學習的<b class='flag-5'>三維</b><b class='flag-5'>點</b>云語義分割研究分析

    云的概念以及與三維圖像的關(guān)系

    逆向工程設(shè)備都將物體采樣成云)。和二圖像相比,三維圖像借助第個維度的信息,可以實現(xiàn)天然的物體——背景解耦。
    的頭像 發(fā)表于 08-17 09:18 ?7051次閱讀
    <b class='flag-5'>點</b>云的概念以及與<b class='flag-5'>三維</b>圖像的關(guān)系

    三維云數(shù)據(jù)的兩種結(jié)構(gòu)Kdtree和Octree

    三維云數(shù)據(jù)用于表征目標表面的海量集合,但是各個離散之間并沒有拓撲關(guān)系,一般通過建立云的空間索引來實現(xiàn)基于鄰域關(guān)系的快速查找。在
    的頭像 發(fā)表于 03-14 10:57 ?7135次閱讀

    一文詳解云及三維圖像處理技術(shù)

    云與三維圖像的關(guān)系:三維圖像是一種特殊的信息表達形式,其特征是表達的空間中個維度的數(shù)據(jù),表現(xiàn)形式包括:深度圖(以灰度表達物體與相機的距離),幾何模型(由CAD軟件建立),
    的頭像 發(fā)表于 03-31 16:07 ?2793次閱讀