0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于BlockNeRF的大場(chǎng)景規(guī)?;窠?jīng)視圖合成

3D視覺工坊 ? 來源:CVPR 2022 ? 作者:CVPR 2022 ? 2022-10-19 15:15 ? 次閱讀

作者:Matthew Tancik, Vincent Casser, Xinchen Yan, Sabeek Pradhan, Ben Mildenhall, Pratul P. Srinivasan, Jonathan T. Barron, Henrik Kretzschmar

我們提出了 Block-NeRF,一種神經(jīng)輻射場(chǎng)的變體,可以表示大規(guī)模的場(chǎng)景。具體來說,我們發(fā)現(xiàn),當(dāng)使用 NeRF 渲染跨越多個(gè)街區(qū)的城市規(guī)模場(chǎng)景時(shí),將場(chǎng)景分解為單獨(dú)訓(xùn)練的子 NeRF 至關(guān)重要。這種分解將渲染時(shí)間與場(chǎng)景大小分離,使渲染能夠擴(kuò)展到任意大的場(chǎng)景,并允許對(duì)環(huán)境進(jìn)行逐塊更新。我們采用了幾項(xiàng)架構(gòu)更改,以使 NeRF 對(duì)在不同環(huán)境條件下數(shù)月捕獲的數(shù)據(jù)具有魯棒性。我們?yōu)槊總€(gè)單獨(dú)的 NeRF 添加了外觀嵌入、可學(xué)習(xí)的位姿細(xì)化和可控曝光,并引入了校準(zhǔn)相鄰 NeRF 之間外觀的程序,以便它們可以無縫組合。我們從 280 萬張圖像中構(gòu)建了一個(gè) Block-NeRF 網(wǎng)格,以創(chuàng)建迄今為止最大的神經(jīng)場(chǎng)景表示,能夠渲染舊金山的整個(gè)社區(qū)。

主要貢獻(xiàn)

為了在大場(chǎng)景中應(yīng)用神經(jīng)輻射場(chǎng)(NeRF)模型,文章提出將大型場(chǎng)景分解為相互重疊的子場(chǎng)景 (block),每一個(gè)子場(chǎng)景分別訓(xùn)練,在推理時(shí)動(dòng)態(tài)結(jié)合相鄰 Block-NeRF 的渲染視圖。 文章在 mip-NeRF 的基礎(chǔ)上增加了外觀嵌入、曝光嵌入和位姿細(xì)化,以解決訓(xùn)練數(shù)據(jù)橫跨數(shù)月而導(dǎo)致的環(huán)境變化和位姿誤差。 為了保證相鄰 Block-NeRF 的無縫合成,文章提出了在推理時(shí)迭代優(yōu)化這些 Block-NeRF 的輸入外觀嵌入以校準(zhǔn)它們的渲染結(jié)果。

方法概述

神經(jīng)輻射場(chǎng) (NeRF)是使用神經(jīng)網(wǎng)絡(luò)擬合輻射場(chǎng),用于視圖渲染的方法。然而,傳統(tǒng)的 NeRF 很難被直接擴(kuò)展到大場(chǎng)景應(yīng)用。這是因?yàn)閿M合大場(chǎng)景所需的神經(jīng)網(wǎng)絡(luò)也會(huì)很大,這會(huì)導(dǎo)致訓(xùn)練和推理渲染變得很困難。本文提出將大的場(chǎng)景劃分為數(shù)個(gè)相互重合的小場(chǎng)景 (block)。如下圖所示的丁字路口被劃分為三個(gè)小場(chǎng)景(黃圈),針對(duì)每一個(gè)小場(chǎng)景單獨(dú)訓(xùn)練一個(gè) Block-NeRF。推理時(shí)合并覆蓋目標(biāo)視圖范圍的 Block-NeRF 渲染生成最終的視圖。

mip-NeRF 拓展文章基于 mip-NeRF,但是由于訓(xùn)練視圖在長(zhǎng)達(dá)數(shù)月的時(shí)間內(nèi)采集,不可避免地出現(xiàn)場(chǎng)景光照不同、相機(jī)曝光不同、視圖位姿存在誤差等問題。為了解決這些問題,文章在 mip-NeRF 的基礎(chǔ)上增加了外觀嵌入和曝光作為神經(jīng)網(wǎng)絡(luò)的輸入(如下圖所示,其中 fσ 和 fc 分別為預(yù)測(cè)密度 σ 和顏色 RGB 的神經(jīng)網(wǎng)絡(luò),x 為場(chǎng)景中的三維坐標(biāo)點(diǎn),d 表示視角)。

訓(xùn)練時(shí)使用生成式潛碼優(yōu)化的方法學(xué)習(xí)外觀嵌入,消除天氣光照等原因的影響。曝光則直接可以讀取采集記錄,只需對(duì)其進(jìn)行正弦位置編碼即可。 與此同時(shí),訓(xùn)練視圖的采集跨越了多個(gè)駕駛段,這些駕駛軌跡之間不可避免地存在位姿誤差。Block-NeRF 訓(xùn)練時(shí)還同時(shí)優(yōu)化每一個(gè)駕駛段的位姿偏移以降低位姿誤差帶來的影響。 街道視圖中存在汽車、行人等瞬時(shí)物體,然而場(chǎng)景渲染通常只關(guān)注建筑、街道等靜態(tài)結(jié)構(gòu)。文章于是使用語(yǔ)義分割網(wǎng)絡(luò)對(duì)訓(xùn)練視圖中的動(dòng)態(tài)物體進(jìn)行掩蔽,這樣神經(jīng)輻射場(chǎng)就不會(huì)學(xué)習(xí)這些動(dòng)態(tài)物體,而是只關(guān)注靜態(tài)場(chǎng)景結(jié)構(gòu)。 有時(shí)目標(biāo)視圖的相鄰 Block-NeRF 可能距離上很近,但并不在目標(biāo)視圖的視野之內(nèi),文章在傳統(tǒng) NeRF 的兩個(gè)神經(jīng)網(wǎng)絡(luò) fσ 和 fc 之外,還增加了一個(gè)預(yù)測(cè)能見度的網(wǎng)絡(luò) fv。給定三維坐標(biāo) x 和視角 d , fv 預(yù)測(cè)該點(diǎn)在給定視角下的能見度。合成多個(gè) Block-NeRF 的渲染時(shí),能見度低于閾值的渲染不會(huì)被用于最終的合成。訓(xùn)練時(shí)能見度可以由相應(yīng)點(diǎn)的透光率作為監(jiān)督目標(biāo)。

Block-NeRF 融合為提高渲染效率,渲染目標(biāo)視圖時(shí)文章僅融合: 中心點(diǎn)在閾值半徑內(nèi) 且平均能見值高于閾值的 Block-NeRFs 滿足這兩個(gè)條件的 Block-NeRFs 以反距離加權(quán)的方式融合渲染視圖。這里的距離選擇相機(jī)到 Block-NeRFs 的二維空間距離。這樣的融合方法既保證了渲染真實(shí)度又能夠滿足時(shí)空一致性。 為了保證不同視角下渲染的天氣、光線等外觀的一致性,文章還在推理時(shí)引入了外觀嵌入迭代優(yōu)化。給定一個(gè) Block-NeRF 的外觀嵌入,文章在鎖定神經(jīng)網(wǎng)絡(luò)權(quán)重不變的基礎(chǔ)上,優(yōu)化相鄰 Block-NeRFs 的外觀嵌入,最大化其渲染視圖的一致性。

實(shí)驗(yàn)結(jié)果

文章采集并開源了兩個(gè)數(shù)據(jù)集:San Francisco Alamo Square Dataset 和 San Francisco Mission Bay Dataset,分布包含280萬和1.2萬圖片。Alamo Square Dataset覆蓋大約 0.5km2 ,采集自3個(gè)月周期內(nèi),包括不同光線條件和天氣的數(shù)據(jù)。Mission Bay Dataset 涵蓋的地理范圍遠(yuǎn)遠(yuǎn)小于 Alamo Square Dataset,主要被用來與 NeRF做比較。 Table 2 顯示 Block-NeRF 相較于NeRF 渲染效果更好。并且 block 數(shù)量越多越好。即便是保持神經(jīng)網(wǎng)絡(luò)總參數(shù)量不變,Block-NeRF 仍然優(yōu)于 NeRF 并且推理速度在不考慮并行計(jì)算的前提下也大大提高。

Table 1 和 Figure 7 分別定量和定性地顯示外觀嵌入、曝光輸入以及位姿優(yōu)化都對(duì)提高渲染效果有幫助。

Figure 6 顯示推理時(shí)外觀嵌入優(yōu)化可以將渲染從白天場(chǎng)景轉(zhuǎn)換成黑夜場(chǎng)景,從而更好地與基準(zhǔn) Block-NeRF 匹配,增強(qiáng)渲染地時(shí)空一致性。

總結(jié)

本文提出了Block-NeRF,采用 divide-and-conquer 的方法使用多個(gè) Block-NeRFs 學(xué)習(xí)大型場(chǎng)景的不同分塊,最終將這些Block-NeRFs 的渲染合成目標(biāo)視圖。這樣的方法使得利用 NeRF 模型渲染城市規(guī)模的場(chǎng)景成為了可能。 此外 Block-NeRF 還在 mip-NeRF 的基礎(chǔ)上,引入了外觀嵌入優(yōu)化、曝光輸入和位姿細(xì)化等擴(kuò)展,以解決訓(xùn)練數(shù)據(jù)橫跨數(shù)月而導(dǎo)致的環(huán)境變化和位姿誤差。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:BlockNeRF: 大場(chǎng)景規(guī)?;窠?jīng)視圖合成(CVPR 2022)

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    何勉:第一性原理和精益敏捷的規(guī)?;?/b>實(shí)施

    徑及其案例單個(gè)小團(tuán)隊(duì)層面和局部環(huán)節(jié)的實(shí)施不能帶來真正的價(jià)值交付,那這就提出了規(guī)模化的需求。面對(duì)這樣的需求我們來考慮怎么樣做,下面我會(huì)分享一些例子,其中有華為、平安的,也有創(chuàng)業(yè)公司。這些例子面對(duì)的場(chǎng)景
    發(fā)表于 01-26 10:10

    無線射頻識(shí)別技術(shù)在規(guī)模化奶牛場(chǎng)中有哪些應(yīng)用?

    什么是無線射頻識(shí)別技術(shù)(RFID)?無線射頻識(shí)別技術(shù)在規(guī)?;?/b>奶牛場(chǎng)中有哪些應(yīng)用?RFID在奶牛場(chǎng)應(yīng)用中暴露的問題有哪些?
    發(fā)表于 05-20 06:44

    規(guī)?;?/b>FTTH建設(shè)下的ODN質(zhì)量探討

    在三網(wǎng)融合及光進(jìn)銅退的大背景下,國(guó)內(nèi)的FTTH已經(jīng)進(jìn)入了大規(guī)模部署階段,本內(nèi)容討論了規(guī)模化FTTH建設(shè)下的ODN質(zhì)量探討
    發(fā)表于 12-12 14:14 ?1111次閱讀
    <b class='flag-5'>規(guī)?;?/b>FTTH建設(shè)下的ODN質(zhì)量探討

    阿里攜手物聯(lián)網(wǎng)合作伙伴成立ICA,推動(dòng)IoT產(chǎn)業(yè)規(guī)?;?/b>

    ICA聯(lián)盟高辨識(shí)度的特征,是基于阿里巴巴經(jīng)濟(jì)體以及合作伙伴的豐富商業(yè)場(chǎng)景,實(shí)現(xiàn)標(biāo)準(zhǔn)與產(chǎn)業(yè)緊密結(jié)合,并推動(dòng)IoT產(chǎn)業(yè)規(guī)?;?/b>。
    的頭像 發(fā)表于 05-04 11:43 ?5628次閱讀
    阿里攜手物聯(lián)網(wǎng)合作伙伴成立ICA,推動(dòng)IoT產(chǎn)業(yè)<b class='flag-5'>規(guī)?;?/b>

    光儲(chǔ)規(guī)?;?/b>在中、美、德、日四國(guó)當(dāng)中有什么應(yīng)用?

    國(guó)外政策和開放市場(chǎng)下的光儲(chǔ)規(guī)?;?/b>應(yīng)用激勵(lì)來自于三個(gè)方面,一是政策支持力度加大,分布式能源和可再生能源規(guī)模化發(fā)展,光伏系統(tǒng)規(guī)?;?/b>應(yīng)用顯現(xiàn);二是光伏系統(tǒng)成本下降,上網(wǎng)補(bǔ)貼支持減弱;三是電力市場(chǎng)逐步開放
    發(fā)表于 08-08 11:22 ?1225次閱讀

    神經(jīng)模態(tài)芯片發(fā)展的方向

    神經(jīng)模態(tài)芯片的發(fā)展方向首先是規(guī)?;?/b>,即擴(kuò)大神經(jīng)元的規(guī)模,這也是Intel和IBM等大廠主要押注的方向。
    的頭像 發(fā)表于 08-09 18:48 ?2612次閱讀

    商用服務(wù)機(jī)器人還需要多長(zhǎng)的時(shí)間來規(guī)?;?/b>應(yīng)用

    雖然未來總是充滿不確定,但核心技術(shù)突破是商用服務(wù)機(jī)器人規(guī)?;?/b>發(fā)展的必經(jīng)之路。
    發(fā)表于 01-13 08:36 ?1233次閱讀

    5G技術(shù)在面向智能電網(wǎng)的規(guī)模化應(yīng)用探討

    通知指出在面向智能電網(wǎng)的5G新技術(shù)規(guī)?;?/b>應(yīng)用方面,將基于5G新型網(wǎng)絡(luò)架構(gòu)及智能電網(wǎng)場(chǎng)景,開展5G端到端網(wǎng)絡(luò)切片及資源調(diào)度系統(tǒng)研發(fā),研發(fā)網(wǎng)絡(luò)關(guān)鍵設(shè)備和原型系統(tǒng),提供融合5G技術(shù)的智能電網(wǎng)整體解決方案。
    發(fā)表于 03-16 09:54 ?851次閱讀

    自動(dòng)駕駛產(chǎn)業(yè)路徑浮現(xiàn),高級(jí)無人駕駛規(guī)?;?/b>商用仍待時(shí)日

    不知從什么時(shí)候開始,談到自動(dòng)駕駛商業(yè),越來越多的企業(yè)開始側(cè)重于場(chǎng)景。特別是低速封閉場(chǎng)景、特定園區(qū)以及高速公路等場(chǎng)景,由于相較于城市道路路況更簡(jiǎn)單,成了很多企業(yè)布局高級(jí)別自動(dòng)駕駛的主要
    發(fā)表于 08-27 13:47 ?500次閱讀

    華為鴻蒙有望下月規(guī)模化推送_流暢度和動(dòng)畫效果大有提升

    前,華為 HarmonyOS 的官方微博已經(jīng)正式開通。華為鴻蒙有望在下月進(jìn)行規(guī)模化推送。
    的頭像 發(fā)表于 05-07 14:56 ?2659次閱讀

    華為鴻蒙有望下月規(guī)?;?/b>推送:流暢度非常絲滑

    最快在6月份華為鴻蒙系統(tǒng)有望正式開始規(guī)?;?/b>推送。
    的頭像 發(fā)表于 05-07 17:27 ?2623次閱讀

    機(jī)器人為何難以實(shí)現(xiàn)規(guī)?;?/b>場(chǎng)景落地

    一半海水一半火焰,在千億級(jí)規(guī)模的市場(chǎng)需求與極低的市場(chǎng)滲透率之間,是機(jī)器人廠商們深刻認(rèn)識(shí)到的規(guī)模化場(chǎng)景落地問題。
    的頭像 發(fā)表于 07-07 17:50 ?2275次閱讀

    后摩智能與新石器無人車合作加速無人配送車的規(guī)模化應(yīng)用

    8月底,后摩智能與新石器無人車簽署戰(zhàn)略合作協(xié)議,雙方將面向無人配送車的落地場(chǎng)景,就聯(lián)合研發(fā)、項(xiàng)目共建、市場(chǎng)拓展、供應(yīng)鏈重塑等方面展開深入合作,充分發(fā)揮各自優(yōu)勢(shì),共同推動(dòng)無人車產(chǎn)業(yè)鏈的國(guó)產(chǎn)進(jìn)程,加速無人配送車的規(guī)?;?/b>應(yīng)用。
    發(fā)表于 09-02 16:54 ?1076次閱讀

    Block nerf:可縮放的大型場(chǎng)景神經(jīng)視圖合成

    為了在大場(chǎng)景中應(yīng)用神經(jīng)輻射場(chǎng)(NeRF)模型,文章提出將大型場(chǎng)景分解為相互重疊的子場(chǎng)景 (block),每一個(gè)子場(chǎng)景分別訓(xùn)練,在推理時(shí)動(dòng)態(tài)結(jié)
    的頭像 發(fā)表于 10-19 15:15 ?1412次閱讀

    蜂巢能源智造方法論:“規(guī)?;?/b>+數(shù)智”角力TWh時(shí)代競(jìng)爭(zhēng)

    進(jìn)入規(guī)?;?/b>制造時(shí)代,電池行業(yè)的科技屬性逐漸回歸到制造屬性。頭部鋰電廠商技術(shù)趨同趨勢(shì)下,競(jìng)爭(zhēng)核心將體現(xiàn)在企業(yè)的制造能力上。
    的頭像 發(fā)表于 05-08 11:42 ?806次閱讀