0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是SLAM?基于3D高斯輻射場的SLAM優(yōu)勢分析

3D視覺工坊 ? 來源:3D視覺工坊 ? 2024-04-01 12:44 ? 次閱讀

什么是SLAM?

SLAM,即同時定位與地圖構(gòu)建技術(shù),SLAM可以讓機器人、無人機和其他自動化系統(tǒng)能夠在未知環(huán)境中同時進行自我定位和環(huán)境映射。

為什么是NeRF-Based SLAM?

傳統(tǒng)CG將輸入圖像重新投影再融合到新的視圖攝像機中,利用幾何結(jié)構(gòu)來進行重投影。在很多情況下,傳統(tǒng)CG方法重建地圖都能有相當(dāng)好的效果,但是對于地圖上的未知區(qū)域,進行三維重建恢復(fù)就有些困難了。

深度學(xué)習(xí)很早就在應(yīng)用在重建方面。Volumetric 表達由Soft3D提出,隨后與Volumetric ray-marching 相結(jié)合的深度學(xué)習(xí)技術(shù)出現(xiàn),這是一種基于連續(xù)可微密度場的Geometry(幾何)表示方法。

神經(jīng)輻射場引入了Importance Sampling(重要性采樣)和Positional Encoding(位置編碼),使得三維重建的質(zhì)量得到顯著提升;同時NeRF神經(jīng)渲染算法大大減少了傳統(tǒng)三維重建中生成的偽影,在大多數(shù)情況下效果都比傳統(tǒng)算法好。目前重建圖像質(zhì)量最好的是Mip-NeRF360。

此外,將SLAM技術(shù)融入到深度學(xué)習(xí)中,更容易使得所有算法能夠統(tǒng)一到一個框架中,方便不同算法之間的數(shù)據(jù)傳輸和通信,方便了上下游兄弟部門的協(xié)同合作。比如建好的地圖可以用于語義標(biāo)注,從而接到BEV感知中訓(xùn)練,又或者可以生成 Occupancy 網(wǎng)格,交給規(guī)控部門去做路徑的規(guī)劃和智能體的控制。

為什么是Gaussian-Based SLAM?

基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過可微分渲染捕獲稠密的光度信息,具有高保真度。但是用Implicit Neural Representation(隱式神經(jīng)表達)對場景建模導(dǎo)致了許多問題:

query過程(可以理解為射線渲染)需要大量的采樣,渲染方法成本很高

用了大型多層MLP,運算量大,占用內(nèi)存高

不容易編輯

不能顯式地對空間幾何建模

導(dǎo)致“遺忘”問題

SLAM技術(shù)通常部署在機器人身上,性能尤為關(guān)鍵。后續(xù)出現(xiàn)了一系列解決NeRF重建效果和性能的論文,基于3D高斯輻射場的SLAM有以下好處:

快速渲染和豐富的優(yōu)化:Gaussian Splatting可以以高達400 FPS的速度渲染,使其比隱式表達更快地可視化和優(yōu)化。

有明確空間范圍的建圖:現(xiàn)有地圖的空間邊界可以通過在之前觀察到的部分場景中添加高斯函數(shù)來控制。給定一個新的圖像幀,我們可以通過渲染剪影識別場景的哪些部分是新內(nèi)容(在地圖的空間邊界之外)。這對于Tracking任務(wù)很重要,因為我們只想將已經(jīng)建好圖的部分與新圖像幀進行比較。隱式表達就不行了,因為在對未知區(qū)域建圖優(yōu)化的時候,全局的優(yōu)化會影響到神經(jīng)網(wǎng)絡(luò)。

顯式地圖:我們可以通過添加更多的Gaussian函數(shù)來任意地增加地圖容量。而且這種顯式的表達讓我們可以編輯場景中的某些部分,同時仍然允許真實的渲染。隱式方法不能輕易地增加其容量或編輯其所表示的場景。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    210

    文章

    27989

    瀏覽量

    205535
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4575

    瀏覽量

    92335
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    411

    瀏覽量

    31738
  • MLP
    MLP
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    4199

原文標(biāo)題:3DGS為什么會成為三維重建的下一個風(fēng)口?

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    從算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我們在[第 1 部分]中所討論的,SLAM 是指在無地圖區(qū)域中估計機器人車輛的位置,同時逐步繪制該區(qū)域地圖的過程。根據(jù)使用的主要技術(shù),SLAM 算法可分為三種
    的頭像 發(fā)表于 10-02 16:39 ?182次閱讀
    從算法角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    裸眼3D筆記本電腦——先進的光裸眼3D技術(shù)

    效果的用戶,這款筆記本電腦都能滿足你的需求。 一、卓越的3D模型設(shè)計能力 英倫科技裸眼3D筆記本電腦采用最新的光裸眼3D技術(shù),使用戶無需佩戴3D
    的頭像 發(fā)表于 07-16 10:04 ?378次閱讀

    什么是光裸眼3D?

    裸眼3D技術(shù),是一種無需任何輔助設(shè)備(如3D眼鏡或頭顯)即可產(chǎn)生真實三維效果的技術(shù)。它通過特殊的顯示設(shè)備,精確控制光線的方向和強度,使觀察者在不同的角度都能看到清晰、連續(xù)的立體圖像。這種技術(shù)的核心在于模擬人眼對真實世界的觀察
    的頭像 發(fā)表于 05-27 14:21 ?828次閱讀
    什么是光<b class='flag-5'>場</b>裸眼<b class='flag-5'>3D</b>?

    銀牛微電子:集3D視覺感知、AI及SLAM為一體的3D空間計算芯

    有限責(zé)任公司研發(fā)副總裁周凡在論壇上介紹了“集3D視覺感知、AI及SLAM為一體的3D空間計算芯片NU4500”。 ? 合肥銀牛微電子有限責(zé)任公司研發(fā)副總裁周凡 ? 銀牛微電子是一家專注3D
    的頭像 發(fā)表于 05-17 10:18 ?744次閱讀
    銀牛微電子:集<b class='flag-5'>3D</b>視覺感知、AI及<b class='flag-5'>SLAM</b>為一體的<b class='flag-5'>3D</b>空間計算芯

    深度解析深度學(xué)習(xí)下的語義SLAM

    隨著深度學(xué)習(xí)技術(shù)的興起,計算機視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進展,例如目標(biāo)的檢測、識別和分類等領(lǐng)域。近年來,研究人員開始在視覺SLAM算法中引入深度學(xué)習(xí)技術(shù),使得深度學(xué)習(xí)SLAM系統(tǒng)獲得了迅速發(fā)展,并且比傳統(tǒng)算法展現(xiàn)出更高的精度和更強的環(huán)境適應(yīng)性。
    發(fā)表于 04-23 17:18 ?1150次閱讀
    深度解析深度學(xué)習(xí)下的語義<b class='flag-5'>SLAM</b>

    工程實踐中VINS與ORB-SLAM的優(yōu)劣分析

    ORB-SLAM是一種基于特征的單目視覺SLAM系統(tǒng),廣泛用于實時三維地圖構(gòu)建和機器人定位。該系統(tǒng)使用ORB特征進行高效的視覺識別和地圖重建,支持關(guān)鍵幀技術(shù)和回環(huán)檢測來優(yōu)化地圖的準(zhǔn)確性。
    的頭像 發(fā)表于 04-08 10:17 ?2402次閱讀
    工程實踐中VINS與ORB-<b class='flag-5'>SLAM</b>的優(yōu)劣<b class='flag-5'>分析</b>

    什么是SLAMSLAM算法涉及的4要素

    SLAM技術(shù)可以應(yīng)用在無人駕駛汽車、無人機、機器人、虛擬現(xiàn)實等領(lǐng)域中,為這些領(lǐng)域的發(fā)展提供了支持。SLAM技術(shù)的發(fā)展已經(jīng)逐漸從單純的定位和地圖構(gòu)建轉(zhuǎn)向了基于場景理解的功能。
    發(fā)表于 04-04 11:50 ?1991次閱讀

    行易道(Autoroad)發(fā)布了全球領(lǐng)先的4D成像雷達360°環(huán)視SLAM系統(tǒng)

    2024年CES展會前,行易道(Autoroad)發(fā)布了全球領(lǐng)先的4D成像雷達360°環(huán)視SLAM系統(tǒng)。
    的頭像 發(fā)表于 03-26 17:06 ?563次閱讀

    從基本原理到應(yīng)用的SLAM技術(shù)深度解析

    LSD-SLAM 即 Large-Scale Direct SLAM,兼容單目相機和雙目相機。LSD-SLAM是一種基于光流跟蹤的直接法SLAM,但是實現(xiàn)了半稠密建圖,建圖規(guī)模大,可以
    發(fā)表于 02-26 09:41 ?8670次閱讀
    從基本原理到應(yīng)用的<b class='flag-5'>SLAM</b>技術(shù)深度解析

    基于NeRF/Gaussian的全新SLAM算法

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發(fā)表于 01-26 10:48 ?571次閱讀
    基于NeRF/Gaussian的全新<b class='flag-5'>SLAM</b>算法

    3D視覺的三大優(yōu)勢

    康耐視的In-Sight 3D-L4000憑借突破性的3D視覺技術(shù)、無斑點藍色激光照明系統(tǒng)和小巧外形重新定義了3D視覺解決方案。本文將深入探討其三大優(yōu)勢,為工廠工程師提供快速、準(zhǔn)確且經(jīng)
    的頭像 發(fā)表于 12-07 10:53 ?1107次閱讀
    <b class='flag-5'>3D</b>視覺的三大<b class='flag-5'>優(yōu)勢</b>

    基于視覺SLAM的研究現(xiàn)狀

    目前視覺SLAM系統(tǒng)可以在微型個人計算機(PC)和嵌入式設(shè)備中運行,甚至可以在智能手機等移動設(shè)備中運行(Klein和Murray,2009)。與室內(nèi)或室外移動機器人不同,自動駕駛車輛具有更復(fù)雜的參數(shù),尤其是當(dāng)車輛在城市環(huán)境中自動駕駛時。
    發(fā)表于 12-04 09:22 ?952次閱讀
    基于視覺<b class='flag-5'>SLAM</b>的研究現(xiàn)狀

    什么是激光雷達3D SLAM技術(shù)?

    什么是激光雷達3DSLAM?在了解這個概念之前,我們首先需要弄懂什么是“SLAM”。SLAM,英文是SimultaneousLocalizationandMapping,意思是即時定位與建圖。通俗
    的頭像 發(fā)表于 11-25 08:23 ?1471次閱讀
    什么是激光雷達<b class='flag-5'>3D</b> <b class='flag-5'>SLAM</b>技術(shù)?

    中強光智能3D激光SLAM無人叉車技術(shù)特點詳解

    中強光智能自主研發(fā)的3D激光SLAM無人叉車KSRB1425由智能3D激光導(dǎo)航出發(fā),結(jié)合視覺及多項感知融合技術(shù),搭配先進的演算能力,實現(xiàn)智能化精準(zhǔn)運動
    的頭像 發(fā)表于 11-10 15:59 ?784次閱讀

    探討目前主流3D激光SLAM算法方案

     激光SLAM局部定位精度高但全局定位能力差且對環(huán)境特征不敏感,而視覺SLAM全局定位能力好但局部定位相對激光雷達較差,兩者融合可以提高SLAM系統(tǒng)的精度和魯棒性。
    發(fā)表于 10-23 11:01 ?1242次閱讀
    探討目前主流<b class='flag-5'>3D</b>激光<b class='flag-5'>SLAM</b>算法方案