0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

北京大學(xué)提出Repaint123:紋理質(zhì)量、多視角一致性新SOTA!

CVer ? 來源:量子位(QbitAI) ? 2024-01-08 16:13 ? 次閱讀

只需兩分鐘,玩轉(zhuǎn)圖片轉(zhuǎn)3D!

還是高紋理質(zhì)量、多視角高一致性的那種。

3d6cab32-ade4-11ee-8b88-92fbcf53809c.gif

不管是什么物種,輸入時(shí)的單視圖圖像還是這樣?jì)饍旱模?/p>

3d830f76-ade4-11ee-8b88-92fbcf53809c.png

兩分鐘后,3D版大功告成:

3d8d682c-ade4-11ee-8b88-92fbcf53809c.gif

△上,Repaint123(NeRF);下,Repaint123(GS)

新方法名為Repaint123,核心思想是將2D擴(kuò)散模型的強(qiáng)大圖像生成能力與再繪策略的紋理對(duì)齊能力相結(jié)合,來生成高質(zhì)量、多視角一致的圖像。

此外,該研究還引入了針對(duì)重疊區(qū)域的可見性感知自適應(yīng)再繪強(qiáng)度的方法。

Repaint123一舉解決了此前方法多視角偏差大、紋理退化、生成慢等問題。

3da395b6-ade4-11ee-8b88-92fbcf53809c.png

目前項(xiàng)目代碼還未在GitHub公布,就有100+人趕來標(biāo)星碼住:

3da9aca8-ade4-11ee-8b88-92fbcf53809c.png

Repaint123長(zhǎng)啥樣?

之前,將圖像轉(zhuǎn)換為3D的方法通常采用Score Distillation Sampling (SDS)。盡管該方法的結(jié)果令人印象深刻,但存在一些問題,如多視角不一致、過度飽和、過度平滑的紋理以及生成速度緩慢。

3db18fae-ade4-11ee-8b88-92fbcf53809c.gif

△從上至下:輸入,Zero123-XL,Magic123,Dream gaussian

為了解決這些問題,來自北京大學(xué)、鵬城實(shí)驗(yàn)室、新加坡國(guó)立大學(xué)、武漢大學(xué)的研究人員提出了Repaint123。

3e851694-ade4-11ee-8b88-92fbcf53809c.png

總的來說,Repaint123有這幾點(diǎn)貢獻(xiàn):

(1)Repaint123通過綜合考慮圖像到3D生成的可控重繪過程,能夠生成高質(zhì)量的圖片序列,并確保這些圖片在多個(gè)視角下保持一致。

(2)Repaint123提出了一個(gè)簡(jiǎn)單的單視圖3D生成的基準(zhǔn)方法。

在粗模階段,它利用Zero123作為3D先驗(yàn),并結(jié)合SDS損失函數(shù),通過優(yōu)化Gaussian Splatting幾何,快速生成粗糙的3D模型(僅需1分鐘)。

在細(xì)模階段,它采用Stable Diffusion作為2D先驗(yàn),并結(jié)合均方誤差(MSE)損失函數(shù),通過快速細(xì)化網(wǎng)格紋理,生成高質(zhì)量的3D模型(同樣只需1分鐘)。

(3)大量的實(shí)驗(yàn)證明了Repaint123方法的有效性。它能夠在短短2分鐘內(nèi),從單張圖像中生成與2D生成質(zhì)量相匹配的高質(zhì)量3D內(nèi)容。

?

3e894bd8-ade4-11ee-8b88-92fbcf53809c.png

?

△實(shí)現(xiàn)3D一致且高質(zhì)量的單視角3D快速生成

下面來看具體方法。

Repaint123專注于優(yōu)化mesh細(xì)化階段,其主要改進(jìn)方向涵蓋兩個(gè)方面:生成具有多視角一致性的高質(zhì)量圖像序列以及實(shí)現(xiàn)快速而高質(zhì)量的3D重建。

1、生成具有多視角一致性的高質(zhì)量圖像序列

生成具有多視角一致性的高質(zhì)量圖像序列分為以下三個(gè)部分:

3e8e6fa0-ade4-11ee-8b88-92fbcf53809c.png

△多視角一致的圖像生成流程

DDIM反演

為了保留在粗模階段生成的3D一致的低頻紋理信息,作者采用了DDIM反演將圖像反演到確定的潛在空間,為后續(xù)的去噪過程奠定基礎(chǔ),生成忠實(shí)一致的圖像。

可控去噪

為了在去噪階段控制幾何一致性和長(zhǎng)程紋理一致性,作者引入了ControlNet,使用粗模渲染的深度圖作為幾何先驗(yàn),同時(shí)注入?yún)⒖紙D的Attention特征進(jìn)行紋理遷移。

此外,為了執(zhí)行無分類器引導(dǎo)以提升圖像質(zhì)量,論文使用CLIP將參考圖編碼為圖像提示,用于指導(dǎo)去噪網(wǎng)絡(luò)。

重繪

漸進(jìn)式重繪遮擋和重疊部分為了確保圖像序列中相鄰圖像的重疊區(qū)域在像素級(jí)別對(duì)齊,作者采用了漸進(jìn)式局部重繪的策略。

在保持重疊區(qū)域不變的同時(shí),生成和諧一致的相鄰區(qū)域,并從參考視角逐步延伸到360°。

然而,如下圖所示,作者發(fā)現(xiàn)重疊區(qū)域同樣需要進(jìn)行細(xì)化,因?yàn)樵谡晻r(shí)之前斜視的區(qū)域的可視分辨率變大,需要補(bǔ)充更多的高頻信息。

另外,細(xì)化強(qiáng)度等于1-cosθ*,其中θ*為之前所有相機(jī)視角與所視表面法向量夾角θ的最大值,從而自適應(yīng)地重繪重疊區(qū)域。

3e92e94a-ade4-11ee-8b88-92fbcf53809c.png

△相機(jī)視角與細(xì)化強(qiáng)度的關(guān)系

為了選擇適當(dāng)?shù)募?xì)化強(qiáng)度,以在提高質(zhì)量的同時(shí)保證忠實(shí)度,作者借鑒了投影定理和圖像超分的思想,提出了一種簡(jiǎn)單而直接的可見性感知的重繪策略來細(xì)化重疊區(qū)域。

2、快速且高質(zhì)量的3D重建

正如下圖所展示的,作者在進(jìn)行快速且高質(zhì)量的3D重建過程中,采用了兩階段方法。

3e9e61ee-ade4-11ee-8b88-92fbcf53809c.png

△Repaint123兩階段單視角3D生成框架

首先,他們利用Gaussian Splatting表示來快速生成合理的幾何結(jié)構(gòu)和粗糙的紋理。

同時(shí),借助之前生成的多視角一致的高質(zhì)量圖像序列,作者能夠使用簡(jiǎn)單的均方誤差(MSE)損失進(jìn)行快速的3D紋理重建。

一致性、質(zhì)量和速度最優(yōu)

研究人員對(duì)多個(gè)單視圖生成任務(wù)的方法進(jìn)行了比較。

3ea2ed04-ade4-11ee-8b88-92fbcf53809c.png

△單視圖3D生成可視化比較

在RealFusion15和Test-alpha數(shù)據(jù)集上,Repaint123取得了在一致性、質(zhì)量和速度三個(gè)方面最領(lǐng)先的效果。

3ea7db98-ade4-11ee-8b88-92fbcf53809c.png

同時(shí),作者也對(duì)論文使用的每個(gè)模塊的有效性以及視角轉(zhuǎn)動(dòng)增量進(jìn)行了消融實(shí)驗(yàn):

3eac0592-ade4-11ee-8b88-92fbcf53809c.png

3eb48456-ade4-11ee-8b88-92fbcf53809c.png

并且發(fā)現(xiàn),視角間隔為60度時(shí),性能達(dá)到峰值,但視角間隔過大會(huì)減少重疊區(qū)域,增加多面問題的可能性,所以40度可作為最佳視角間隔。

3eb9b188-ade4-11ee-8b88-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2843

    瀏覽量

    107202
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1078

    瀏覽量

    40355
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3073

    瀏覽量

    48587

原文標(biāo)題:1張圖2分鐘轉(zhuǎn)3D!北京大學(xué)提出Repaint123:紋理質(zhì)量、多視角一致性新SOTA!

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    異構(gòu)計(jì)算下緩存一致性的重要

    在眾多回復(fù)中,李博杰同學(xué)的回答被認(rèn)為質(zhì)量最高。他首先將緩存一致性分為兩個(gè)主要場(chǎng)景:是主機(jī)內(nèi)CPU與設(shè)備間的一致性;二是跨主機(jī)的一致性
    的頭像 發(fā)表于 10-24 17:00 ?106次閱讀
    異構(gòu)計(jì)算下緩存<b class='flag-5'>一致性</b>的重要<b class='flag-5'>性</b>

    RISC-V AI技術(shù)正式納入北京大學(xué)研究生課程

    希姆計(jì)算與北京大學(xué)達(dá)成SOC課程合作2024年10月14日,希姆計(jì)算的范福杰博士走進(jìn)北京大學(xué)集成電路學(xué)院的研究生課堂,為同學(xué)們講授了節(jié)生動(dòng)的《現(xiàn)代SoC芯片架構(gòu)設(shè)計(jì)實(shí)驗(yàn)課程》。RISC-V走進(jìn)北大
    的頭像 發(fā)表于 10-18 08:09 ?236次閱讀
    RISC-V AI技術(shù)正式納入<b class='flag-5'>北京大學(xué)</b>研究生課程

    級(jí)聯(lián)一致性和移相器校準(zhǔn)應(yīng)用手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《級(jí)聯(lián)一致性和移相器校準(zhǔn)應(yīng)用手冊(cè).pdf》資料免費(fèi)下載
    發(fā)表于 08-29 10:48 ?0次下載
    級(jí)聯(lián)<b class='flag-5'>一致性</b>和移相器校準(zhǔn)應(yīng)用手冊(cè)

    LIN一致性測(cè)試規(guī)范2.1

    電子發(fā)燒友網(wǎng)站提供《LIN一致性測(cè)試規(guī)范2.1.pdf》資料免費(fèi)下載
    發(fā)表于 08-15 17:14 ?3次下載

    引領(lǐng)高校原生人才新生態(tài) 北京大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心正式成立

    6月22日,北京大學(xué)與華為技術(shù)有限公司在北京簽署合作協(xié)議,“北京大學(xué) 鯤鵬昇騰科教創(chuàng)新卓越中心”(以下簡(jiǎn)稱“卓越中心”)正式成立揭牌。雙方將圍繞卓越中心著力推動(dòng)科研平臺(tái)建設(shè),基于鯤鵬昇騰技術(shù)路線,在
    的頭像 發(fā)表于 06-25 16:23 ?350次閱讀
    引領(lǐng)高校原生人才新生態(tài) <b class='flag-5'>北京大學(xué)</b>鯤鵬昇騰科教創(chuàng)新卓越中心正式成立

    潤(rùn)石科技董事長(zhǎng)參加北京大學(xué)集成電路學(xué)院“未名·芯”論壇

    2024年5月5日,在紀(jì)念五四運(yùn)動(dòng)105周年,也是北京大學(xué)建校126周年之際,潤(rùn)石科技董事長(zhǎng)張明先生受北京大學(xué)集成電路學(xué)院校友返校、共敘情誼活動(dòng)邀請(qǐng)
    的頭像 發(fā)表于 05-11 14:06 ?870次閱讀

    北京大學(xué)-知存科技存算體聯(lián)合實(shí)驗(yàn)室揭牌,開啟知存科技產(chǎn)學(xué)研融合戰(zhàn)略新升級(jí)

    、知存科技首席科學(xué)家郭昕婕博士及企業(yè)研發(fā)相關(guān)負(fù)責(zé)人參加了現(xiàn)場(chǎng)揭牌儀式。面向模態(tài)大模型時(shí)代產(chǎn)業(yè)發(fā)展新需求,雙方將攜手踏上探索存算體技術(shù)前沿發(fā)展和應(yīng)用的新征程。 ? ? 北京大學(xué)集成電路學(xué)院院長(zhǎng)蔡
    的頭像 發(fā)表于 05-07 19:31 ?1315次閱讀
    <b class='flag-5'>北京大學(xué)</b>-知存科技存算<b class='flag-5'>一</b>體聯(lián)合實(shí)驗(yàn)室揭牌,開啟知存科技產(chǎn)學(xué)研融合戰(zhàn)略新升級(jí)

    北京大學(xué)高性能計(jì)算綜合能力競(jìng)賽圓滿結(jié)束

    22名。第北京大學(xué)高性能計(jì)算綜合能力競(jìng)賽面向全國(guó)高校在校同學(xué),致力于激發(fā)同學(xué)們的創(chuàng)新意識(shí),培養(yǎng)運(yùn)用高性能計(jì)算技術(shù)解決復(fù)雜問題的能力,以全新的科技視角去探索前沿
    的頭像 發(fā)表于 04-14 08:34 ?577次閱讀
    <b class='flag-5'>北京大學(xué)</b>高性能計(jì)算綜合能力競(jìng)賽圓滿結(jié)束

     QSFP一致性測(cè)試的專業(yè)測(cè)試設(shè)備

    QSFP一致性測(cè)試是確保QSFP光模塊性能穩(wěn)定、可靠的關(guān)鍵環(huán)節(jié),對(duì)于保障通信系統(tǒng)的正常運(yùn)行具有重要意義。QSFP(Quad Small Form-factor Pluggable)光模塊是種高密度
    的頭像 發(fā)表于 03-14 10:40 ?491次閱讀
     QSFP<b class='flag-5'>一致性</b>測(cè)試的專業(yè)測(cè)試設(shè)備

    深入理解數(shù)據(jù)備份的關(guān)鍵原則:應(yīng)用一致性與崩潰一致性的區(qū)別

    深入理解數(shù)據(jù)備份的關(guān)鍵原則:應(yīng)用一致性與崩潰一致性的區(qū)別 在數(shù)字化時(shí)代,數(shù)據(jù)備份成為了企業(yè)信息安全的核心環(huán)節(jié)。但在備份過程中,兩個(gè)關(guān)鍵概念——應(yīng)用一致性和崩潰一致性,常常被誤解或混淆。
    的頭像 發(fā)表于 03-11 11:29 ?768次閱讀
    深入理解數(shù)據(jù)備份的關(guān)鍵原則:應(yīng)用<b class='flag-5'>一致性</b>與崩潰<b class='flag-5'>一致性</b>的區(qū)別

    DDR一致性測(cè)試的操作步驟

    DDR一致性測(cè)試的操作步驟? DDR(雙數(shù)據(jù)率)一致性測(cè)試是對(duì)DDR內(nèi)存模塊進(jìn)行測(cè)試以確保其性能和可靠。在進(jìn)行DDR一致性測(cè)試時(shí),需要遵循
    的頭像 發(fā)表于 02-01 16:24 ?1224次閱讀

    MM32F0140 FlexCAN一致性測(cè)試 (2)

    MM32F0140 FlexCAN一致性測(cè)試 (2)
    的頭像 發(fā)表于 11-10 18:23 ?604次閱讀
    MM32F0140 FlexCAN<b class='flag-5'>一致性</b>測(cè)試 (2)

    MM32F0140 FlexCAN一致性測(cè)試(1)

    MM32F0140 FlexCAN一致性測(cè)試 (1)
    的頭像 發(fā)表于 11-10 17:50 ?572次閱讀
    MM32F0140 FlexCAN<b class='flag-5'>一致性</b>測(cè)試(1)

    什么是鋰離子電池不一致性?如何提高鋰離子電池的一致性?

    什么是鋰離子電池不一致性?鋰離子電池不穩(wěn)定的原因?如何提高鋰離子電池的一致性? 鋰離子電池不一致性是指同批次或不同批次的鋰離子電池在性能上出現(xiàn)不
    的頭像 發(fā)表于 11-10 14:49 ?1551次閱讀

    分布式系統(tǒng)中常見的一致性模型

    什么是一致性模型? 在分布式系統(tǒng)中,C(一致性) 和 A(可用)始終存在矛盾。若想保證可用,就必須通過復(fù)制、分片等方式冗余存儲(chǔ)。而旦進(jìn)
    的頭像 發(fā)表于 11-10 11:33 ?792次閱讀
    分布式系統(tǒng)中常見的<b class='flag-5'>一致性</b>模型