0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人體圖像合成制作可信和逼真的人類圖像

工程師鄧生 ? 來源:搜狐網(wǎng) ? 作者:陳根 ? 2020-12-14 11:17 ? 次閱讀

技術(shù)和算法的開發(fā)和精進(jìn)讓AI換臉、AI克隆都成了可實(shí)現(xiàn)的事情。近日,上海科技大學(xué)團(tuán)隊(duì)的一項(xiàng)新研究,再一擴(kuò)展了這一領(lǐng)域,其開發(fā)建立了人體圖像合成——人體圖像合成的目的是制作可信和逼真的人類圖像,包括運(yùn)動(dòng)模擬、外觀傳遞和新視圖合成等。

這意味著,模型一旦經(jīng)過訓(xùn)練,就可以用來處理所有這些任務(wù)。只要一張照片、一段視頻,就能讓特朗普跟著明星偶像“唱、跳、Rap”。

研究團(tuán)隊(duì)先是采集了30個(gè)研究對象的數(shù)據(jù),他們的體型、身高各不相同。每個(gè)研究對象穿著不同的衣服,完成一套指定動(dòng)作和一套隨機(jī)動(dòng)作?;诖耍⒘艘粋€(gè)具有多種樣式、不同人物穿不同衣服的數(shù)據(jù)集,稱為Impersonator(iPER)數(shù)據(jù)集。

隨后,研究人員使用三維人體網(wǎng)格恢復(fù)模塊,以分離姿勢和形狀。值得一提的是,現(xiàn)有任務(wù)特定方法主要利用二維關(guān)鍵點(diǎn)、對人體結(jié)構(gòu)進(jìn)行估計(jì)。但是,它們只表示位置信息沒有能力描述人的個(gè)性化形狀和肢體旋轉(zhuǎn)模型。

而三維人體網(wǎng)格不僅可以對關(guān)節(jié)的位置和旋轉(zhuǎn)進(jìn)行建模,還可以對關(guān)節(jié)的位置和旋轉(zhuǎn)進(jìn)行建模描述個(gè)性化的體型。

為了保存源信息,如紋理、樣式、顏色和人臉標(biāo)識(shí),研究人員還提出了一種注意型液化GAN。比如,通過降噪卷積自動(dòng)編碼器提取特朗普的身體特征,然后經(jīng)過GAN不斷地訓(xùn)練學(xué)習(xí)、微調(diào)、監(jiān)督、轉(zhuǎn)化,將低分辨率的模型轉(zhuǎn)變成高分辨率的模型,使輸出來的視頻圖像清晰。

人體圖像合成一經(jīng)開發(fā),將在角色動(dòng)畫、角色再現(xiàn)、虛擬服裝試穿、電影或游戲制作等方面展示其巨大的潛在應(yīng)用前景。當(dāng)然,技術(shù)的使用永遠(yuǎn)需要合理的規(guī)制,“以假亂真”一旦泛濫,將對市場造成難以恢復(fù)的危害。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人體
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    11403
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1078

    瀏覽量

    40345
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29359

    瀏覽量

    267640
  • 合成
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    13761
收藏 人收藏

    評論

    相關(guān)推薦

    圖像檢測和圖像識(shí)別的原理、方法及應(yīng)用場景

    圖像檢測和圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要概念,它們在許多應(yīng)用場景中發(fā)揮著關(guān)鍵作用。 1. 定義 1.1 圖像檢測 圖像檢測(Object Detection)是指在
    的頭像 發(fā)表于 07-16 11:19 ?2289次閱讀

    圖像識(shí)別算法的核心技術(shù)是什么

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要研究方向,其目標(biāo)是使計(jì)算機(jī)能夠像人類一樣理解和識(shí)別圖像中的內(nèi)容。圖像識(shí)別算法的核心技術(shù)包括以下幾個(gè)方面: 特征提取 特征提取是
    的頭像 發(fā)表于 07-16 11:02 ?449次閱讀

    圖像識(shí)別技術(shù)的原理是什么

    圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)對圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計(jì)算機(jī)識(shí)別和理解圖像中的對象、場景和活動(dòng)。 圖像預(yù)處理 圖像
    的頭像 發(fā)表于 07-16 10:46 ?716次閱讀

    計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系

    數(shù)據(jù)的過程。計(jì)算機(jī)視覺的目標(biāo)是使計(jì)算機(jī)能夠像人類一樣“看到”和理解圖像或視頻內(nèi)容。 1.2 圖像處理 圖像處理,也稱為數(shù)字圖像處理,是應(yīng)用數(shù)
    的頭像 發(fā)表于 07-09 09:16 ?947次閱讀

    如何利用CNN實(shí)現(xiàn)圖像識(shí)別

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中一種特別適用于圖像識(shí)別任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過模擬人類視覺系統(tǒng)的處理方式,利用卷積、池化等操作,自動(dòng)提取圖像中的特征,進(jìn)而實(shí)現(xiàn)高效的圖像識(shí)別。本
    的頭像 發(fā)表于 07-03 16:16 ?785次閱讀

    深入理解渲染引擎:打造逼真圖像的關(guān)鍵

    在數(shù)字世界中,圖像渲染是創(chuàng)造逼真視覺效果的核心技術(shù)。渲染引擎,作為這一過程中的關(guān)鍵組件,負(fù)責(zé)將二維或三維的模型、紋理、光照等數(shù)據(jù)轉(zhuǎn)化為人們?nèi)庋劭梢姷亩S圖像。本文將深入探討渲染引擎的工作原理及其在打
    的頭像 發(fā)表于 06-29 08:28 ?234次閱讀
    深入理解渲染引擎:打造<b class='flag-5'>逼真</b><b class='flag-5'>圖像</b>的關(guān)鍵

    麻省理工與Adobe新技術(shù)DMD提升圖像生成速度

    2023年3月27日,據(jù)傳,新型文生圖算法雖然使得圖像生成無比逼真,但奈何運(yùn)行速度較慢。近期,美國麻省理工學(xué)院聯(lián)合Adobe推出新型DMD方法,僅略微犧牲圖像質(zhì)量就大幅度提高圖像生成效
    的頭像 發(fā)表于 03-27 14:17 ?435次閱讀

    圖像放大后,圖像中心顯示在 ,圖像框中心,

    大家好,視覺 顯示 相機(jī)圖像時(shí),點(diǎn)擊 放大工具放大后,如何將大圖像的中心 對準(zhǔn)圖像顯示框的中心,,
    發(fā)表于 01-24 15:49

    機(jī)器視覺中采集的圖像太暗時(shí)要如何增強(qiáng)圖像亮度?

    Q圖像太暗時(shí)要如何增強(qiáng)圖像亮度?A:通俗來講,普遍認(rèn)為圖像亮度就是圖像的明暗度。我們知道一幅8bit的黑白圖像是有256個(gè)灰階的?;译A數(shù)值越
    的頭像 發(fā)表于 12-15 08:36 ?744次閱讀
    機(jī)器視覺中采集的<b class='flag-5'>圖像</b>太暗時(shí)要如何增強(qiáng)<b class='flag-5'>圖像</b>亮度?

    FPGA圖像處理方法

    圖像在采集和傳輸?shù)倪^程中,通常會(huì)產(chǎn)生噪聲,使圖像質(zhì)量降低,影響后續(xù)處理。因此須對圖像進(jìn)行一些圖像濾波、圖像增強(qiáng)等預(yù)處理。為改善
    的頭像 發(fā)表于 12-02 13:15 ?961次閱讀

    阿迪達(dá)斯與 Covision Media 使用 AI 和 NVIDIA RTX 創(chuàng)建逼真的 3D 內(nèi)容

    Covision 的基于 AI 的 3D 技術(shù)可幫助企業(yè)掃描數(shù)千種產(chǎn)品,為網(wǎng)站和移動(dòng)應(yīng)用創(chuàng)建逼真的 3D 圖像、視頻和 AR 體驗(yàn)。 將實(shí)體產(chǎn)品掃描成 3D 模型是一項(xiàng)十分耗時(shí)的工作。企業(yè)通常
    的頭像 發(fā)表于 11-28 18:45 ?584次閱讀
    阿迪達(dá)斯與 Covision Media 使用 AI 和 NVIDIA RTX 創(chuàng)建<b class='flag-5'>逼真的</b> 3D 內(nèi)容

    香港大學(xué)最新提出!實(shí)現(xiàn)超現(xiàn)實(shí)的人類圖像生成:HyperHuman

    最后,為了進(jìn)一步提高視覺質(zhì)量,我們提出了一種結(jié)構(gòu)引導(dǎo)細(xì)化器來組合預(yù)測條件,以更詳細(xì)地生成更高分辨率。大量的實(shí)驗(yàn)表明,我們的框架具有最先進(jìn)的性能,可以在不同的場景下生成超逼真的人類圖像。
    的頭像 發(fā)表于 11-27 16:03 ?678次閱讀
    香港大學(xué)最新提出!實(shí)現(xiàn)超現(xiàn)實(shí)<b class='flag-5'>的人類</b><b class='flag-5'>圖像</b>生成:HyperHuman

    CVPR2023 RobustNeRF: 從單張圖像生成3D形狀

    在通常使用的nerf數(shù)據(jù)中,一個(gè)場景往往無法從同一視角捕捉多幅圖像,這使得數(shù)學(xué)建模干擾物變得困難。更具體地說,雖然視角相關(guān)效應(yīng)(View-Dependent)是使NeRF看起來逼真的因素,但模型如何區(qū)分干擾物和視角相關(guān)效果呢?
    的頭像 發(fā)表于 11-09 16:35 ?827次閱讀
    CVPR2023 RobustNeRF: 從單張<b class='flag-5'>圖像</b>生成3D形狀

    機(jī)器視覺之圖像增強(qiáng)和圖像處理

    一、圖像處理技術(shù)概述1.定義對原始獲取圖像進(jìn)行一系列的運(yùn)算處理,稱為圖像處理。圖像處理是機(jī)器視覺技術(shù)的方法基礎(chǔ),包括圖像增強(qiáng)、邊緣提取、
    的頭像 發(fā)表于 10-26 08:07 ?863次閱讀
    機(jī)器視覺之<b class='flag-5'>圖像</b>增強(qiáng)和<b class='flag-5'>圖像</b>處理

    機(jī)器視覺之圖像增強(qiáng)和圖像處理

    對原始獲取圖像進(jìn)行一系列的運(yùn)算處理,稱為圖像處理。圖像處理是機(jī)器視覺技術(shù)的方法基礎(chǔ),包括圖像增強(qiáng)、邊緣提取、圖像分割、形態(tài)學(xué)處理、
    發(fā)表于 10-23 10:43 ?465次閱讀
    機(jī)器視覺之<b class='flag-5'>圖像</b>增強(qiáng)和<b class='flag-5'>圖像</b>處理