0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Point-NN: 即插即用,無需訓(xùn)練的非參數(shù)點云分析網(wǎng)絡(luò)!

3D視覺工坊 ? 來源:CVHub ? 2023-03-28 11:22 ? 次閱讀

導(dǎo)讀

論文提出了一個用于三維點云分析的非參數(shù)網(wǎng)絡(luò),Point-NN,它由純不可學(xué)習(xí)的組件組成:最遠點采樣(FPS)、k近鄰(k-NN)和三角函數(shù)以及池化操作。令人驚訝的是,它在各種3D任務(wù)上表現(xiàn)得很好,不需要任何參數(shù)或訓(xùn)練,甚至超過了現(xiàn)有的完全訓(xùn)練的模型。從這個基本的非參數(shù)模型出發(fā),論文提出了兩個擴展。首先,Point-NN可以作為一個基礎(chǔ)架構(gòu)框架,通過在上面插入線性層來構(gòu)建參數(shù)化網(wǎng)絡(luò)Point-PN。由于具有優(yōu)越的非參數(shù)基礎(chǔ),所構(gòu)建出的Point-PN僅用少量可學(xué)習(xí)參數(shù)表現(xiàn)出高性能-效率的權(quán)衡。其次,Point-NN可以被視為已經(jīng)訓(xùn)練過的三維模型的即插即用模塊。Point-NN捕獲互補的幾何知識,為不同的3D benchmarks來增強現(xiàn)有的方法,而無需再訓(xùn)練。研究者希望該工作可以為社區(qū)用非參數(shù)方法理解三維點云提供一個線索。

動機

從PointNet++起,包括最遠點采樣(FPS)、k近鄰(k-NN)和池化操作在內(nèi),所有可學(xué)習(xí)模塊背后的非參數(shù)框架幾乎保持相同。很少有研究去探索它們的療效,論文提出了一個問題:

僅使用非參數(shù)組件,能否實現(xiàn)較高的三維點云分析性能?

貢獻

7b3a394a-cd0a-11ed-bfe3-dac502259ad0.png

The Pipeline of Non-Parametric Networks

論文提出了一個非參數(shù)網(wǎng)絡(luò),稱為PointNN,如上圖所示,PointNN由一個用于3D特征提取的非參數(shù)編碼器和一個用于特定任務(wù)識別的point-memory bank組成。該多階段編碼器應(yīng)用FPS、kNN、三角函數(shù)和池化操作來逐步聚合局部幾何圖形,為點云生成一個高維的全局向量。論文只采用簡單的三角函數(shù)來揭示每個池化階段的局部空間模式,而沒有可學(xué)習(xí)的算子。然后,多階段編碼器提取到的訓(xùn)練集特征,將其緩存作為point-memory bank。對于測試點云,bank通過樸素的特征相似度匹配輸出特定于任務(wù)的預(yù)測,從而驗證了編碼器的識別能力。

7b60d9ce-cd0a-11ed-bfe3-dac502259ad0.png

Two Applications of Point-NN

論文建議重新審視三維點云網(wǎng)絡(luò)中的不可學(xué)習(xí)組件,并首次開發(fā)一種非參數(shù)方法Point-NN進行三維點云分析

以Point-NN為基本框架,通過在Point-NN的每個階段插入線性層,引入了其 parameter-efficient 的變體 Point-PN(上圖a),它在沒有先進算子的情況下具有優(yōu)越的性能

作為一個即插即用的模塊,PointNN可以在推理過程中直接提升各種3D任務(wù)中的現(xiàn)成的訓(xùn)練過的模型(上圖b)

方法

Non-Parametric Networks

論文提出了Point-NN,一個純粹由不可學(xué)習(xí)的基本組件組成的網(wǎng)絡(luò),以及簡單的三角函數(shù)的三維坐標(biāo)編碼。Point-NN由一個Non-Parametric Encoder(NPEnc)和一個Point-Memory Bank(PoM)組成。給定一個用于形狀分類的輸入點云 ,NPEnc提取其高維全局特征 ,PoM通過相似度匹配產(chǎn)生分類結(jié)果:

7b82575c-cd0a-11ed-bfe3-dac502259ad0.png

Non-Parametric Encoder

7b9c786c-cd0a-11ed-bfe3-dac502259ad0.png

Non-Parametric Encoder of Point-NN

如上圖所示,非參數(shù)編碼器首先將輸入點云進行Raw-point Embedding得到局部特征,再經(jīng)過4階段的Local Geometry Aggregation逐步聚合局部特征得到全局特征。

Raw-point Embedding

論文參考Transformer中的positional encoding,對于輸入點云的一個點,利用三角函數(shù)將它嵌入到一個 維向量中:

7bb69eb8-cd0a-11ed-bfe3-dac502259ad0.png

其中,表示三個軸的embedding,表示初始化的特征維度。以 為例,對于通道索引

7bc5fdae-cd0a-11ed-bfe3-dac502259ad0.png

其中,α,β分別控制了其大小和波長。由于三角函數(shù)的固有性質(zhì),變換后的向量可以很好地編碼不同點之間的相對位置信息,并捕獲三維形狀的細(xì)粒度結(jié)構(gòu)變化。

Local Geometry Aggregation

基于embedding,論文采用四階段網(wǎng)絡(luò)結(jié)構(gòu)分層聚合空間局部特征。論文使用三角函數(shù)PosE(·)來提取局部特征,取代傳統(tǒng)最近鄰點局部特征提取算法,對于每個中心點 和其鄰域 :

Feature Expansion.論文首先地將鄰居特征 與中心特征沿特征維數(shù)concat來進行特征擴張:

7bd5ef8e-cd0a-11ed-bfe3-dac502259ad0.png

Geometry Extraction.接著,論文通過相對位置編碼來得到每個 的權(quán)重,然后用均值和標(biāo)準(zhǔn)差對它們的坐標(biāo)進行歸一化,記為,通過下面的公式得到加權(quán)后的K鄰域特征,該區(qū)域的局部幾何形狀就可以被隱式地編碼到特征中,而不需要任何可學(xué)習(xí)的參數(shù)。

7beba7de-cd0a-11ed-bfe3-dac502259ad0.png

Feature Aggregation。最后,同時利用最大池和平均池來進行局部特征聚合::

7c01d694-cd0a-11ed-bfe3-dac502259ad0.png

在4個Local Geometry Aggregation之后,再應(yīng)用這兩個池化操作來得到點云的全局特征

Point-Memory Bank

7c127184-cd0a-11ed-bfe3-dac502259ad0.png

Point-Memory Bank of Point-NN

Point-NN沒有使用傳統(tǒng)的可學(xué)習(xí)分類頭,而是采用了一個point-memory bank。如上圖所示,首先由Non-ParametricEncoder以無訓(xùn)練的方式構(gòu)造bank,然后在推理過程中通過相似度匹配輸出預(yù)測。

Memory Construction

point memory由一個feature memory 和一個label memory 。以圖像分類任務(wù)為例,假設(shè)給定的訓(xùn)練集包含K個類別的N個點云,。通過上述非參數(shù)編碼器得到的N個全局特征進行編碼,同時將它們的ground-truth標(biāo)簽轉(zhuǎn)換為一個one-hot編碼。然后分別將兩者沿著樣本維度concat,緩存為兩個矩陣:

7c5e2872-cd0a-11ed-bfe3-dac502259ad0.png

其中,,

Similarity-based Prediction.

對于測試點云,利用非參數(shù)編碼器來提取其全局特征,然后通過上一步構(gòu)造的bank進行兩個矩陣乘法來完成分類。

計算測試點云全局特征 與feature memory 之間的余弦相似度:

7c6c159a-cd0a-11ed-bfe3-dac502259ad0.png

將label memory 中的one-hot標(biāo)簽與 進行加權(quán):

7c7bcc74-cd0a-11ed-bfe3-dac502259ad0.png

在 中,越相似的feature memory對最終分類logits的貢獻越大,反之亦然。通過這種基于相似性的標(biāo)簽集成, point-memory bank可以在不經(jīng)過任何訓(xùn)練的情況下自適應(yīng)地區(qū)分不同的點云實例。

Starting from Point-NN

在本節(jié)中將介紹兩個很有前途的Point-NN應(yīng)用,它充分釋放了非參數(shù)組件在三維點云分析中的潛力。

As Architectural Frameworks

7c8c8f28-cd0a-11ed-bfe3-dac502259ad0.png

The Pipeline of Point-PN

7ca76140-cd0a-11ed-bfe3-dac502259ad0.png

表1 Step-by-step Construction of Point-PN

Point-NN可以擴展到可學(xué)習(xí)的參數(shù)網(wǎng)絡(luò)(Point-PN),不需要添加復(fù)雜的算子或太多的參數(shù)。只需要簡單地通過在編碼器的每個階段插入線性層來構(gòu)造參數(shù)微分。使用圖中A~E處的線性層的性能增益如表1所示:

首先用可學(xué)習(xí)分類器替換point-memory bank(上圖A位置),這個輕量級的版本在ModelNet40上就實現(xiàn)了90.3%的分類準(zhǔn)確率,只有0.3M的參數(shù)

為了更好地提取多尺度層次結(jié)構(gòu),在編碼器的每個stage(上圖C, D, E位置)都添加了簡單的線性層。Point-PN在0.8M參數(shù)下達到了競爭性的93.8%的精度。

As Plug-and-play Modules

Point-NN可以在不進行額外re-training的情況下增強已經(jīng)訓(xùn)練過的三維模型。

分類任務(wù)

7cb82bc4-cd0a-11ed-bfe3-dac502259ad0.png

Complementary Characteristics of Point-NN

對于shape分類任務(wù),論文直接通過線性插值融合Point-NN和現(xiàn)成模型的分類結(jié)果。這種巧妙的設(shè)計將兩種類型的知識進行集成:來自Point-NN的low-level結(jié)構(gòu)信號和來自訓(xùn)練網(wǎng)絡(luò)的high-level語義信號。

如上圖所示,通過Point-NN提取的點云特征在清晰的三維結(jié)構(gòu)周圍產(chǎn)生了較高的響應(yīng)值,例如,飛機的翼尖、椅子的腿和燈桿。相比之下,訓(xùn)練過的PointNet++更注重具有語義豐富的3D結(jié)構(gòu),這些結(jié)構(gòu)包括飛機的主體、椅子的底部和燈罩

7ccc83a8-cd0a-11ed-bfe3-dac502259ad0.png

Why Do Trigonometric Functions Work?

如上圖所示,對于輸入點云,論文將其低頻和高頻幾何進行可視化,并與Point-NN的特征響應(yīng)進行比較,其中較深的顏色表示更高的響應(yīng)。如圖所示,Point-NN可以聚焦于點云急劇變化的高頻三維結(jié)構(gòu)。

分割、檢測任務(wù)

論文直接采用已經(jīng)訓(xùn)練過的模型的編碼器來提取點云特征,只將所提的point-memory bank在上面進行即插即用。利用相似度匹配和傳統(tǒng)的可學(xué)習(xí)分類頭之間的互補知識實現(xiàn)性能的改進。

實驗

Point-NN

Shape Classification

7ce24d64-cd0a-11ed-bfe3-dac502259ad0.png

表2 Shape Classification on the Real-world ScanObjectNN

7cfaf40e-cd0a-11ed-bfe3-dac502259ad0.png

表3 Shape Classification on Synthetic ModelNet40

如表2、表3所示,Point-NN對真實世界和合成點云都獲得了良好的分類精度,表明了沒有任何參數(shù)的Point-NN有效性和通用性。

Few-shot Classification

7d12b2ce-cd0a-11ed-bfe3-dac502259ad0.png

表5 Few-shot Classification on ModelNet40

如表5所示,與現(xiàn)有的訓(xùn)練模型相比,Point-NN的few-shot性能顯著超過了第二好的方法。這是由于訓(xùn)練樣本有限,具有可學(xué)習(xí)參數(shù)的傳統(tǒng)網(wǎng)絡(luò)嚴(yán)重存在過擬合問題。

Part Segmentation

7d2a597e-cd0a-11ed-bfe3-dac502259ad0.png

表4 Part Segmentation on ShapeNetPart

如表4所示,70.4% mIoU表明非參數(shù)網(wǎng)絡(luò)Point-NN拓張的分割網(wǎng)絡(luò),也可以產(chǎn)生執(zhí)行良好的點級特征,并捕獲鑒別特征的細(xì)粒度空間理解。

3D Object Detection

7d548fb4-cd0a-11ed-bfe3-dac502259ad0.png

表6 3D Object Detection on ScanNetV2

將Point-NN作為非參數(shù)分類頭,配合兩種流行的三維檢測器VoteNet和3DETR-m提取類別無關(guān)的3D region proposals.如表6所示,不經(jīng)過歸一化處理的點坐標(biāo)可以大大提高Point-NN的AP分?jǐn)?shù),保留了原始場景中更多物體三維位置的位置線索。

Ablation Study

7d66eed4-cd0a-11ed-bfe3-dac502259ad0.png

表7 Ablation Study of Non-Parametric Encoder

Point-PN

Shape Classification

如表2、表3所示,Point-PN在現(xiàn)實世界和合成的三維識別方面都取得了有競爭的結(jié)果。在ScanObjectNN上,與12.6M的大模型PointMLP相比,參數(shù)少16×,推理速度快6×,精度超過1.9%

Part Segmentation

對于表4中的點向分割任務(wù),Point-PN也取得了具有競爭力的性能,mIoU為86.6%。與CurveNet相比,具有簡單局部幾何聚合的Point-PN可以節(jié)省28小時的訓(xùn)練時間,推理速度快6×。

Ablation Study

如圖1所示,論文提出了如何從Point-NN逐步構(gòu)造Point-PN,可以觀察到“1+2”(Geometry Extraction step前面加一層線性層,后面加兩層)的 Point-PN表現(xiàn)最好,而更容易學(xué)習(xí)的層,“2+2”會損害性能

Plug-and-play

Shape Classification

7d7a3d0e-cd0a-11ed-bfe3-dac502259ad0.png

Plug-and-play for Shape Classification

如上圖所示,Point-NN有效地提高了現(xiàn)有的方法的性能,如PointNet和PointMLP的準(zhǔn)確率提高了2.0%

Segmentation and Detection

7d896ab8-cd0a-11ed-bfe3-dac502259ad0.png

Plug-and-play for Part Segmentation and 3D Object Detection

如上圖所示,Point-NN對于分割和檢測網(wǎng)絡(luò)具有通用的增強能力。

總結(jié)

論文重新討論了現(xiàn)有三維模型中的不可學(xué)習(xí)組件,并提出了 Point-NN,一個用于三維點云分析的純非參數(shù)網(wǎng)絡(luò)。沒有任何參數(shù)或訓(xùn)練, Point-NN在各種三維任務(wù)上取得了良好的準(zhǔn)確性。從Point-NN開始,論文提出了它的兩個很有前途的應(yīng)用程序:針對PointPN的架構(gòu)框架和用于提高性能的即插即用模塊。大量的實驗已經(jīng)證明了其有效性和意義。在未來的工作中,研究者將重點探索更先進的非參數(shù)模型,具有更廣泛的三維點云分析應(yīng)用場景。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    855

    瀏覽量

    47600
  • 三維
    +關(guān)注

    關(guān)注

    1

    文章

    486

    瀏覽量

    28911
  • 三維模型
    +關(guān)注

    關(guān)注

    0

    文章

    47

    瀏覽量

    13076

原文標(biāo)題:CVPR 2023 | Point-NN: 即插即用,無需訓(xùn)練的非參數(shù)點云分析網(wǎng)絡(luò)!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    即插即用的串口轉(zhuǎn)WIFI模塊

    `真正即插即用的串口轉(zhuǎn)WIFI模塊 UART03模塊是一款創(chuàng)新的UART---WIFI的嵌入式無線模塊,借助該無線模塊,使得傳統(tǒng)的串口設(shè)備在不經(jīng)過任何更改情況下便可輕松接入無線網(wǎng)絡(luò),使用戶串口數(shù)據(jù)到
    發(fā)表于 07-01 15:09

    即插即用和熱插拔的區(qū)別

    關(guān)系。即插即用是要重啟機器才能認(rèn)出來的熱插拔立刻就能認(rèn)出來 支持即插即用是一種使您可以快速簡易安裝某硬件設(shè)備而無需安裝設(shè)備驅(qū)動程序或重新配置系統(tǒng)的標(biāo)準(zhǔn)。即插即用需要硬件和軟件兩方面支
    發(fā)表于 10-23 10:26

    LabView的IMAQ中如何調(diào)用即插即用攝像頭

    本帖最后由 Konzen 于 2013-8-13 09:03 編輯 以前用的CCD是即插即用(即Windows系統(tǒng)的驅(qū)動程序即可驅(qū)動)的,用IMAQ可以直接調(diào)用,現(xiàn)在換了個廠商自己開發(fā)的驅(qū)動程序的CCD,求各位大神告知怎么用Labview調(diào)用?。?/div>
    發(fā)表于 08-12 09:31

    ————即插即用無需組網(wǎng)協(xié)議wifi模塊————

    即插即用wifi模塊,無需寫組網(wǎng)協(xié)議,多種接口。 Wifi模塊 EC32L13 EC19DEC32L13模塊的規(guī)格————特點;功耗低,尺寸小,穩(wěn)定l2.4GHz IEEE 802.11b/g/nl
    發(fā)表于 03-25 15:48

    即插即用移動電源管理芯片

    即插即用移動電源管理芯片
    發(fā)表于 11-25 10:35

    使用Streamline分析在Linux上運行的Arm NN機器學(xué)習(xí)應(yīng)用程序

    討論的示例是在 Arm 上運行 ML 推理的 Linux 應(yīng)用程序。我們之前已經(jīng)在 MNIST 數(shù)據(jù)集上訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò) 來識別手寫數(shù)字。使用 Arm NN 和 Streamline,我們希望了解我們
    發(fā)表于 08-11 15:46

    索引即插即用主板REV000

    描述索引即插即用主板REV000該板旨在控制索引拾取和放置,以及大多數(shù)(如果不是全部)愛好者拾取和放置構(gòu)建。其目的是創(chuàng)建一個通用控制器,對于任何需要其 PnP 控制器的人來說,這將是一個可行且可靠
    發(fā)表于 08-12 07:52

    PCI與即插即用

    PCI與即插即用 即插即用 是從英文“Plug and Play”翻譯過來的,縮寫為 PnP 。即插即用功能只有在同時具備了符合以下4個條件時才可以:即插即
    發(fā)表于 12-09 13:51 ?2104次閱讀

    什么是即插即用

    什么是即插即用              支持即插即用是一種使您可以快速簡易安裝某硬件設(shè)備而無需安裝設(shè)備驅(qū)動程序或重新
    發(fā)表于 12-28 11:17 ?2156次閱讀

    Helieon(TM)LED照明模塊即插即用

    Helieon(TM)LED照明模塊即插即用 摘要:Bridgelux與MolexIncorporated今日發(fā)布了首個針對LED照明技術(shù)的快速大規(guī)模市場應(yīng)用而設(shè)計和定價的LED照
    發(fā)表于 03-29 09:22 ?656次閱讀

    詳細(xì)剖析OPC和即插即用技術(shù)

    要介紹OPC和即插即用技術(shù),重點對OPC實際應(yīng)用標(biāo)準(zhǔn)的發(fā)展、技術(shù)、特點及適用范圍與接口應(yīng)用作分折說明。
    的頭像 發(fā)表于 01-26 15:18 ?5954次閱讀
    詳細(xì)剖析OPC和<b class='flag-5'>即插即用</b>技術(shù)

    索引即插即用主板REV001

    電子發(fā)燒友網(wǎng)站提供《索引即插即用主板REV001.zip》資料免費下載
    發(fā)表于 07-18 17:09 ?3次下載
    索引<b class='flag-5'>即插即用</b>主板REV001

    索引即插即用主板REV000

    電子發(fā)燒友網(wǎng)站提供《索引即插即用主板REV000.zip》資料免費下載
    發(fā)表于 07-27 11:27 ?4次下載
    索引<b class='flag-5'>即插即用</b>主板REV000

    電源系統(tǒng)設(shè)計:完全“即插即用

    電源系統(tǒng)設(shè)計:完全“即插即用
    發(fā)表于 11-07 08:07 ?1次下載
    電源系統(tǒng)設(shè)計:<b class='flag-5'>非</b>完全“<b class='flag-5'>即插即用</b>”

    0參數(shù)量+0訓(xùn)練,3D點分析方法Point-NN刷新多項SOTA

    首先,我們可以通過插入簡單的線性層,來構(gòu)建 Point-NN參數(shù)網(wǎng)絡(luò),Point-PN。由于 Point-NN 具有強大的
    的頭像 發(fā)表于 07-19 16:29 ?579次閱讀
    0<b class='flag-5'>參數(shù)</b>量+0<b class='flag-5'>訓(xùn)練</b>,3D點<b class='flag-5'>云</b><b class='flag-5'>分析</b>方法<b class='flag-5'>Point-NN</b>刷新多項SOTA