0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟運(yùn)用深度學(xué)習(xí)技術(shù)構(gòu)建多模態(tài)3D肖像模型,成就逼真虛擬肖像

微云疏影 ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2024-04-24 15:24 ? 次閱讀

據(jù)美國(guó)商標(biāo)與專利局近日發(fā)布的信息,微軟已獲新型專利,利用深度學(xué)習(xí)構(gòu)建真實(shí)感十足的多模態(tài) 3D 面部模擬肖像。

此項(xiàng)專利名為《多模態(tài)三維面部建模及追蹤,制作栩栩如生的虛擬肖像》。其系統(tǒng)包括處理器和存儲(chǔ)器系統(tǒng),前者負(fù)責(zé)收集初始數(shù)據(jù)(即面部初始模樣)以及多元數(shù)據(jù)信號(hào)(例如用戶聲波等音頻數(shù)據(jù)),再將兩者整合并進(jìn)行擬合處理。

3D 面部建模與追蹤技術(shù)通過(guò)捕捉用戶面部特征,建立 3D 頂點(diǎn),并對(duì)中性面部頂點(diǎn)進(jìn)行變形,以呈現(xiàn)出數(shù)字面部模型的各種表情。

此外,該系統(tǒng)運(yùn)用深度學(xué)習(xí)技術(shù)設(shè)計(jì)虛擬肖像,可模擬用戶面部表情,用戶亦可進(jìn)行微調(diào),使之更具個(gè)性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6541

    瀏覽量

    103826
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7408

    瀏覽量

    163422
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5442

    瀏覽量

    120800
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    利用OpenVINO部署Qwen2模態(tài)模型

    模態(tài)模型的核心思想是將不同媒體數(shù)據(jù)(如文本、圖像、音頻和視頻等)進(jìn)行融合,通過(guò)學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián),實(shí)現(xiàn)更加智能化的信息處理。簡(jiǎn)單來(lái)說(shuō)
    的頭像 發(fā)表于 10-18 09:39 ?161次閱讀

    發(fā)掘3D文件格式的無(wú)限潛力:打造沉浸式虛擬世界

    在當(dāng)今數(shù)字化時(shí)代,3D技術(shù)的應(yīng)用范圍日益廣泛,涵蓋電影后期制作、產(chǎn)品原型設(shè)計(jì)、虛擬現(xiàn)實(shí)(VR)、增強(qiáng)現(xiàn)實(shí)(AR)、游戲等眾多領(lǐng)域。而3D文件格式作為
    的頭像 發(fā)表于 09-26 18:14 ?1404次閱讀
    發(fā)掘<b class='flag-5'>3D</b>文件格式的無(wú)限潛力:打造沉浸式<b class='flag-5'>虛擬</b>世界

    裸眼3D筆記本電腦——先進(jìn)的光場(chǎng)裸眼3D技術(shù)

    隨著科技的不斷進(jìn)步,裸眼3D技術(shù)已經(jīng)不再是科幻電影中的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無(wú)論你是專業(yè)的3D
    的頭像 發(fā)表于 07-16 10:04 ?394次閱讀

    VR虛擬空間中的3D 技術(shù)

    空間中塑造3D模型 索尼在CES 2024上展示了其最新的具有“空間內(nèi)容創(chuàng)建”功能的MR頭顯,讓用戶在佩戴頭顯的同時(shí)也能編輯和塑造3D模型。用戶可以使用左右兩個(gè)不同形狀的控制器同時(shí)操縱
    的頭像 發(fā)表于 04-29 09:36 ?1472次閱讀
    VR<b class='flag-5'>虛擬</b>空間中的<b class='flag-5'>3D</b> <b class='flag-5'>技術(shù)</b>

    ad19中3d模型不顯示?

    封裝庫(kù)導(dǎo)入3d模型不顯示,但導(dǎo)入3d模型后的封裝庫(kù)生成pcb文件時(shí)顯示3d模型,這是什么原因?qū)е?/div>
    發(fā)表于 04-24 13:41

    包含具有多種類型信息的3D模型

    、安全和高效的建筑系統(tǒng),讓居住者能夠擁有可持續(xù)、彈性舒適且符合人體工程學(xué)的建筑。建筑信息模型 (BIM) 是建筑工程師在建筑物和其他結(jié)構(gòu)設(shè)計(jì)中使用的一種3D建模過(guò)程。BIM軟件提供了一個(gè)基于模型
    發(fā)表于 03-28 17:18

    谷歌推出模態(tài)VLOGGER AI

    谷歌最新推出的VLOGGER AI技術(shù)引起了廣泛關(guān)注,這項(xiàng)創(chuàng)新的模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來(lái)并“說(shuō)話”。用戶只需提供一張人物
    的頭像 發(fā)表于 03-22 10:45 ?728次閱讀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨(dú)特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成
    的頭像 發(fā)表于 03-22 10:30 ?715次閱讀

    谷歌發(fā)布VLOGGER AI模型,實(shí)現(xiàn)肖像朗讀音頻內(nèi)容

    具體來(lái)說(shuō),VLOGGER AI 采用一種適應(yīng)虛擬肖像模態(tài) Diffusion 模型,通過(guò) MENTOR 數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練,涵蓋了超80萬(wàn)個(gè)
    的頭像 發(fā)表于 03-19 14:27 ?697次閱讀

    CASAIM沙盤模型3D打印的優(yōu)勢(shì)和應(yīng)用

    隨著3D打印技術(shù)的不斷發(fā)展,沙盤模型3D打印已經(jīng)成為建筑行業(yè)中的一項(xiàng)創(chuàng)新應(yīng)用。這種技術(shù)能夠?qū)⒃O(shè)計(jì)師的創(chuàng)意以實(shí)體形式呈現(xiàn),為建筑項(xiàng)目的溝通和展
    的頭像 發(fā)表于 12-19 16:44 ?501次閱讀
    CASAIM沙盤<b class='flag-5'>模型</b><b class='flag-5'>3D</b>打印的優(yōu)勢(shì)和應(yīng)用

    模型+模態(tài)3種實(shí)現(xiàn)方法

    我們知道,預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就, 然而其明顯的劣勢(shì)是不支持其他模態(tài)(包括圖像、語(yǔ)音、視頻模態(tài))的輸入和輸出,那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息,讓其變得更強(qiáng)
    的頭像 發(fā)表于 12-13 13:55 ?1547次閱讀
    大<b class='flag-5'>模型</b>+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的<b class='flag-5'>3</b>種實(shí)現(xiàn)方法

    阿迪達(dá)斯與 Covision Media 使用 AI 和 NVIDIA RTX 創(chuàng)建逼真3D 內(nèi)容

    Covision 的基于 AI 的 3D 技術(shù)可幫助企業(yè)掃描數(shù)千種產(chǎn)品,為網(wǎng)站和移動(dòng)應(yīng)用創(chuàng)建逼真3D 圖像、視頻和 AR 體驗(yàn)。 將實(shí)體產(chǎn)品掃描成
    的頭像 發(fā)表于 11-28 18:45 ?589次閱讀
    阿迪達(dá)斯與 Covision Media 使用 AI 和 NVIDIA RTX 創(chuàng)建<b class='flag-5'>逼真</b>的 <b class='flag-5'>3D</b> 內(nèi)容

    基于深度學(xué)習(xí)3D點(diǎn)云實(shí)例分割方法

    3D實(shí)例分割(3DIS)是3D領(lǐng)域深度學(xué)習(xí)的核心問(wèn)題。給定由點(diǎn)云表示的 3D 場(chǎng)景,我們尋求為每
    發(fā)表于 11-13 10:34 ?1959次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的<b class='flag-5'>3D</b>點(diǎn)云實(shí)例分割方法

    探究編輯模態(tài)大語(yǔ)言模型的可行性

    不同于單模態(tài)模型編輯,模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點(diǎn)依然從單
    發(fā)表于 11-09 14:53 ?451次閱讀
    探究編輯<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大語(yǔ)言<b class='flag-5'>模型</b>的可行性

    北大&amp;華為提出:模態(tài)基礎(chǔ)大模型的高效微調(diào)

    深度學(xué)習(xí)的大模型時(shí)代已經(jīng)來(lái)臨,越來(lái)越多的大規(guī)模預(yù)訓(xùn)練模型在文本、視覺(jué)和模態(tài)領(lǐng)域展示出杰出的生成
    的頭像 發(fā)表于 11-08 16:20 ?710次閱讀
    北大&amp;華為提出:<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>基礎(chǔ)大<b class='flag-5'>模型</b>的高效微調(diào)