0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于單幀圖像,云從科技3D人體技術(shù)創(chuàng)造最新世界紀(jì)錄

電子工程師 ? 來(lái)源:lp ? 2019-03-21 09:25 ? 次閱讀

3 月 19 日,根據(jù)官方消息,云從科技基于單幀圖像的 3D 人體重建技術(shù)同時(shí)在 Human3.6M、Surreal 和 UP-3D 三大數(shù)據(jù)集上創(chuàng)造了最新的世界紀(jì)錄,將原有最低誤差記錄大幅降低 30%。

Human3.6M 數(shù)據(jù)集上對(duì)比

Surreal 數(shù)據(jù)集上對(duì)比

UP-3D 數(shù)據(jù)集上對(duì)比

3D 重建領(lǐng)域通常以誤差(Error)作為衡量算法能力的主要指標(biāo),誤差就是生成模型與實(shí)際圖像的差別。一般來(lái)說(shuō),誤差越低,精度越高,意味著技術(shù)的性能越好。

云從稱(chēng),其 3D 人體重建技術(shù)全身精度誤差(Surface Error)在 Surreal 上從 75.4 毫米降低到 52.7 毫米,關(guān)節(jié)精度誤差(3D Joint Error)從 55.8 毫米降低到 40.1 毫米,Human3.6M 上的關(guān)節(jié)精度誤差(3D Joint Error)從 59.9 毫米降低到 46.7 毫米,技術(shù)的執(zhí)行速度從之前的上百毫秒降低到僅需 5 毫秒。

與傳統(tǒng)關(guān)鍵點(diǎn)檢測(cè)、3D 重建的區(qū)別是什么?

傳統(tǒng)的人體關(guān)鍵點(diǎn)檢測(cè)技術(shù)往往以 2D 的人體骨骼關(guān)節(jié)點(diǎn)檢測(cè)形式出現(xiàn),即通過(guò)技術(shù)預(yù)測(cè) RGB 圖像中人體的十幾個(gè)關(guān)節(jié)點(diǎn)的坐標(biāo),一方面結(jié)果非常稀疏,將人體大為簡(jiǎn)化成骨骼的形式,另一方面結(jié)果往往只包含二維平面上的坐標(biāo)預(yù)測(cè),不能還原深度信息,因此無(wú)法體現(xiàn)縱深的感覺(jué)。

而基于單幀圖像的 3D 重建技術(shù)不僅能輸出骨骼關(guān)節(jié)點(diǎn)信息,更能同時(shí)預(yù)測(cè)大量的人體表面關(guān)鍵點(diǎn)信息,預(yù)測(cè)結(jié)果更加豐富,而且每個(gè)點(diǎn)的坐標(biāo)都是 3D 的,能夠體現(xiàn)不同軀干的縱深信息。

3D 關(guān)鍵點(diǎn)檢測(cè)

傳統(tǒng) 3D 重建技術(shù)大多需要連續(xù)的圖像序列或是多視角的圖像,在硬件設(shè)備上一般需要采用雙目攝像機(jī)或者結(jié)構(gòu)光攝像機(jī)等設(shè)備,因此在手機(jī)等便攜設(shè)備上往往難以實(shí)現(xiàn);另一方面,專(zhuān)用設(shè)備還會(huì)增加部署成本,增加大規(guī)模普及 3D 重建技術(shù)的難度。

上述突破是如何實(shí)現(xiàn)的?

據(jù)悉,該論文對(duì)人體具有豐富多樣的姿態(tài)和穿著的特點(diǎn),提出了一套全新的基于人體 3D 縱深預(yù)測(cè)的 3D 信息表征方式。通過(guò)對(duì)三原色圖像(RGB,不含深度信息)的分析,預(yù)測(cè)人體的 3D 形態(tài)和姿勢(shì),并用 6 萬(wàn)多個(gè)點(diǎn)完整描繪人體,從而在人體重建技術(shù)上取得速度與精度的雙突破,呈現(xiàn)出來(lái)的模型更精細(xì),幀率高達(dá)到 200fps,原本由于受實(shí)時(shí)顯示限制而無(wú)法實(shí)現(xiàn)的應(yīng)用可以一一實(shí)現(xiàn)。

不過(guò),基于單幀圖像的 3D 重建技術(shù)對(duì)原始圖像的需求放松的同時(shí),對(duì)背后的技術(shù)提出了更難的挑戰(zhàn):技術(shù)需要從單幀圖像中推理出人體或人臉的 3D 形態(tài),并通過(guò)光學(xué)透視、陰影疊加等基本光學(xué)原則準(zhǔn)確預(yù)測(cè)出各個(gè)關(guān)鍵點(diǎn)在 3D 空間的位置和朝向,從而得到人體的姿態(tài)或表情信息。

可探索的技術(shù)應(yīng)用方向

人體姿態(tài)和服飾復(fù)雜多樣,精度提升意味著對(duì)復(fù)雜場(chǎng)景的適應(yīng)性更好,模型更接近真實(shí)的情況。如《阿凡達(dá)》、《阿麗塔》、漫威系列等電影中,都需要專(zhuān)用特效設(shè)備與面部貼點(diǎn)來(lái)完成精細(xì)的人像采集,基于單幀圖像的 3D 人體 / 人臉重建技術(shù),意味著可能顛覆電影視頻的拍攝制作,同時(shí)降低工業(yè)級(jí) 3D 動(dòng)畫(huà)合成的門(mén)檻。

由于對(duì)輸入圖像的要求低,使 3D 重建技術(shù)將可以利用普通光學(xué)攝像頭作為感知設(shè)備。例如,該技術(shù)將會(huì)使美顏 App 無(wú)需結(jié)構(gòu)光攝像頭也能具備高精準(zhǔn)度的瘦身與動(dòng)畫(huà)合成功能。

目前,這項(xiàng)技術(shù)可通過(guò)重要人員影像重建、醫(yī)療仿真肢體打印、虛擬試衣、美顏化妝、表情姿態(tài)動(dòng)畫(huà)合成等應(yīng)用場(chǎng)景在大型商場(chǎng)、直播平臺(tái)、美顏軟件、影視特效制作等行業(yè)普及。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2844

    瀏覽量

    107212
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1199

    瀏覽量

    24595
  • 云從科技
    +關(guān)注

    關(guān)注

    1

    文章

    67

    瀏覽量

    9656

原文標(biāo)題:云從科技3D人體重建技術(shù)刷新3項(xiàng)紀(jì)錄!僅憑照片即可生成精細(xì)模型

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    隆基綠能刷新光伏晶硅組件效率世界紀(jì)錄

    近日,隆基綠能宣布了一項(xiàng)重大突破。據(jù)國(guó)際權(quán)威認(rèn)證機(jī)構(gòu)——德國(guó)弗勞霍夫太陽(yáng)電池研究所最新發(fā)布的認(rèn)證報(bào)告顯示,隆基綠能自主研發(fā)的HPBC 2.0組件效率達(dá)到了驚人的25.4%,成功打破了晶硅組件效率的世界紀(jì)錄
    的頭像 發(fā)表于 10-23 17:40 ?354次閱讀

    天合光能n型TOPCon太陽(yáng)電池效率達(dá)到25.9%

    今日,位于天合光能的光伏科學(xué)與技術(shù)全國(guó)重點(diǎn)實(shí)驗(yàn)室宣布,其自主研發(fā)的高效N型i-TOPCon電池,經(jīng)德國(guó)哈梅林太陽(yáng)能研究所(ISFH)下屬的檢測(cè)實(shí)驗(yàn)室認(rèn)證,最高電池效率達(dá)到25.9%,創(chuàng)造了大面積產(chǎn)業(yè)化n型單晶硅TOPCon電池效率新的
    的頭像 發(fā)表于 10-21 09:11 ?250次閱讀

    裸眼3D筆記本電腦——先進(jìn)的光場(chǎng)裸眼3D技術(shù)

    效果的用戶(hù),這款筆記本電腦都能滿(mǎn)足你的需求。 一、卓越的3D模型設(shè)計(jì)能力 英倫科技裸眼3D筆記本電腦采用最新的光場(chǎng)裸眼3D技術(shù),使用戶(hù)無(wú)需佩戴3D
    的頭像 發(fā)表于 07-16 10:04 ?398次閱讀

    VIVERSE 推行實(shí)時(shí)3D渲染: 探索Polygon Streaming技術(shù)力量與應(yīng)用

    Streaming 3D 串流技術(shù)。 Polygon Streaming 3D 串流技術(shù),支持高保真3D模型分享與協(xié)作,跨平臺(tái)兼容,可以提
    的頭像 發(fā)表于 05-31 15:49 ?2237次閱讀
    VIVERSE 推行實(shí)時(shí)<b class='flag-5'>3D</b>渲染: 探索Polygon Streaming<b class='flag-5'>技術(shù)</b>力量與應(yīng)用

    什么是光場(chǎng)裸眼3D?

    光場(chǎng)裸眼3D技術(shù),是一種無(wú)需任何輔助設(shè)備(如3D眼鏡或頭顯)即可產(chǎn)生真實(shí)三維效果的技術(shù)。它通過(guò)特殊的顯示設(shè)備,精確控制光線的方向和強(qiáng)度,使觀察者在不同的角度都能看到清晰、連續(xù)的立體
    的頭像 發(fā)表于 05-27 14:21 ?856次閱讀
    什么是光場(chǎng)裸眼<b class='flag-5'>3D</b>?

    740.6W!天合光能打破N型i-TOPCon組件輸出功率世界紀(jì)錄

    近日,天合光能光伏科學(xué)與技術(shù)全國(guó)重點(diǎn)實(shí)驗(yàn)室宣布, 其自主研發(fā)的210+N型i-TOPCon光伏組件,經(jīng)權(quán)威第三方檢測(cè)認(rèn)證機(jī)構(gòu)TüV南德認(rèn)證,最高輸出功率達(dá)740.6W,創(chuàng)造了新的世界紀(jì)錄! 這也是天
    的頭像 發(fā)表于 04-23 09:28 ?664次閱讀

    多尺度浸入式3D打印策略,用于人體組織和器官的精準(zhǔn)制造

    生物3D打印技術(shù)被認(rèn)為是實(shí)現(xiàn)復(fù)雜人體組織和器官構(gòu)建的最有前景的技術(shù)方案之一。近年來(lái),浸入式墨水書(shū)寫(xiě)技術(shù)作為生物
    的頭像 發(fā)表于 04-20 11:43 ?855次閱讀

    NVIDIA路徑優(yōu)化引擎創(chuàng)下23項(xiàng)世界紀(jì)錄

    NVIDIA cuOpt 不僅在過(guò)去三年中所有的大型路徑規(guī)劃基準(zhǔn)測(cè)試中均名列榜首,還創(chuàng)下了二十多項(xiàng)世界紀(jì)錄。這意味著該路徑優(yōu)化引擎能夠使各行各業(yè)采取節(jié)約成本的高效措施。
    的頭像 發(fā)表于 03-21 09:47 ?329次閱讀

    ROG助力i9-14900KS達(dá)到9117.75 MHz,創(chuàng)下四項(xiàng)世界紀(jì)錄

    近日,據(jù) ROG 玩家國(guó)度官方微博透露,ROG MAXIMUS Z790 APEX ENCORE 助力 i9-14900KS 刷新至 9117.75 MHz,創(chuàng)造四項(xiàng)世界紀(jì)錄(CPU 頻率、SUPERPI 1M、PIFAST、PYPRIME 32B)。
    的頭像 發(fā)表于 03-15 11:40 ?592次閱讀

    基于深度學(xué)習(xí)的方法在處理3D點(diǎn)進(jìn)行缺陷分類(lèi)應(yīng)用

    背景部分介紹了3D點(diǎn)應(yīng)用領(lǐng)域中公開(kāi)可訪問(wèn)的數(shù)據(jù)集的重要性,這些數(shù)據(jù)集對(duì)于分析和比較各種模型至關(guān)重要。研究人員專(zhuān)門(mén)設(shè)計(jì)了各種數(shù)據(jù)集,包括用于3D形狀分類(lèi)、3D物體檢測(cè)和
    的頭像 發(fā)表于 02-22 16:16 ?906次閱讀
    基于深度學(xué)習(xí)的方法在處理<b class='flag-5'>3D</b>點(diǎn)<b class='flag-5'>云</b>進(jìn)行缺陷分類(lèi)應(yīng)用

    Adobe提出DMV3D3D生成只需30秒!讓文本、圖像都動(dòng)起來(lái)的新方法!

    因此,本文研究者的目標(biāo)是實(shí)現(xiàn)快速、逼真和通用的 3D 生成。為此,他們提出了 DMV3D。DMV3D 是一種全新的階段的全類(lèi)別擴(kuò)散模型,能直接根據(jù)模型文字或單張圖片的輸入,生成
    的頭像 發(fā)表于 01-30 16:20 ?759次閱讀
    Adobe提出DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>生成只需30秒!讓文本、<b class='flag-5'>圖像</b>都動(dòng)起來(lái)的新方法!

    基于3D點(diǎn)的多任務(wù)模型在板端實(shí)現(xiàn)高效部署

    對(duì)于自動(dòng)駕駛應(yīng)用來(lái)說(shuō),3D 場(chǎng)景感知至關(guān)重要。3D點(diǎn)數(shù)據(jù)就是具有3D特征的數(shù)據(jù)。一方面,3D 點(diǎn)
    的頭像 發(fā)表于 12-28 16:35 ?1280次閱讀
    基于<b class='flag-5'>3D</b>點(diǎn)<b class='flag-5'>云</b>的多任務(wù)模型在板端實(shí)現(xiàn)高效部署

    3D人體生成模型HumanGaussian實(shí)現(xiàn)原理

    3D 生成領(lǐng)域,根據(jù)文本提示創(chuàng)建高質(zhì)量的 3D 人體外觀和幾何形狀對(duì)虛擬試穿、沉浸式遠(yuǎn)程呈現(xiàn)等應(yīng)用有深遠(yuǎn)的意義。傳統(tǒng)方法需要經(jīng)歷一系列人工制作的過(guò)程,如 3D
    的頭像 發(fā)表于 12-20 16:37 ?1422次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>人體</b>生成模型HumanGaussian實(shí)現(xiàn)原理

    使用Python2D圖像進(jìn)行3D重建過(guò)程詳解

    有許多不同的方法和算法可用于2D圖像執(zhí)行3D重建。選擇的方法取決于諸如輸入圖像的質(zhì)量、攝像機(jī)校準(zhǔn)信息的可用性以及重建的期望準(zhǔn)確性和速度等因
    的頭像 發(fā)表于 12-05 14:07 ?2564次閱讀
    使用Python<b class='flag-5'>從</b>2<b class='flag-5'>D</b><b class='flag-5'>圖像</b>進(jìn)行<b class='flag-5'>3D</b>重建過(guò)程詳解

    基于深度學(xué)習(xí)的3D點(diǎn)實(shí)例分割方法

    3D實(shí)例分割(3DIS)是3D領(lǐng)域深度學(xué)習(xí)的核心問(wèn)題。給定由點(diǎn)云表示的 3D 場(chǎng)景,我們尋求為每個(gè)點(diǎn)分配語(yǔ)義類(lèi)和唯一的實(shí)例標(biāo)簽。 3DIS
    發(fā)表于 11-13 10:34 ?1970次閱讀
    基于深度學(xué)習(xí)的<b class='flag-5'>3D</b>點(diǎn)<b class='flag-5'>云</b>實(shí)例分割方法