0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

揭秘英偉達(dá)人工智能視頻慢動(dòng)作技術(shù)

454398 ? 來(lái)源:cfan ? 作者:cfan ? 2020-09-08 13:50 ? 次閱讀

英偉達(dá)曾經(jīng)發(fā)布過(guò)一段視頻,演示了通過(guò)人工智能如何將一段普通視頻轉(zhuǎn)化為平滑自然的慢動(dòng)作視頻,效果就像是電影上展示的慢動(dòng)作特效,觀眾可以清楚看到一系列連續(xù)的慢動(dòng)作。那么這個(gè)特效是怎樣實(shí)現(xiàn)的呢?就讓我們一探其背后的技術(shù)支撐。

慢動(dòng)作,沒(méi)你相像的那么簡(jiǎn)單

相信大家在各種影視作品中都看到過(guò)慢動(dòng)作特效,比如在剛剛結(jié)束的世界杯就有許多球員進(jìn)球,射門(mén),身體接觸的慢動(dòng)作回放,通過(guò)VAR逐幀回看,這些慢動(dòng)作可以清晰看到一瞬間發(fā)生的事情(圖1)。

對(duì)于電影里的慢動(dòng)作特效,實(shí)際上是借助設(shè)備進(jìn)行高速攝影,比如拍攝速度達(dá)到50幀/秒、100幀/秒甚至更高,然后在回放時(shí)候仍然選擇24幀/秒常規(guī)速度播放,這就相當(dāng)于把實(shí)際1秒鐘拍攝的圖像用2秒多到4秒多時(shí)間回放,從而實(shí)現(xiàn)慢動(dòng)作效果。

當(dāng)然對(duì)于普通用戶來(lái)說(shuō),我們沒(méi)有高速攝影設(shè)備,那么怎么實(shí)現(xiàn)慢動(dòng)作效果?英偉達(dá)近日推出基于cuDNN 加速的PyTorch 深度學(xué)習(xí)框架實(shí)現(xiàn)任意視頻慢動(dòng)作,通過(guò)這個(gè)這個(gè)人工智能框架,結(jié)合NVIDIA Tesla V100 GPU強(qiáng)大處理能力,它可以將任意一段視頻拉長(zhǎng),從而實(shí)現(xiàn)類(lèi)似電影特效里的慢動(dòng)作(圖2)。

圖2 英偉達(dá)演示網(wǎng)球拍擊打有顏色的墨水瞬間

視頻拉長(zhǎng)的背后——人工智能慢動(dòng)作技術(shù)

通過(guò)上面介紹我們知道,常規(guī)的慢動(dòng)作是將高速攝影的視頻低速播放實(shí)現(xiàn)。那么對(duì)于普通的視頻(已經(jīng)是低速攝影成品了),英偉達(dá)又是怎樣實(shí)現(xiàn)慢動(dòng)作效果的呢?

慢動(dòng)作的核心是將原來(lái)的視頻拉長(zhǎng)而實(shí)現(xiàn)慢速效果,但是如果將普通的視頻直接使用低速效果播放,實(shí)際效果則會(huì)變?yōu)榭D、幀與幀之間動(dòng)作變得不連貫。因此將普通的視頻拉長(zhǎng)后還要實(shí)現(xiàn)平滑的慢動(dòng)作效果,此時(shí)就需要對(duì)視頻物體進(jìn)行定位和補(bǔ)幀。

比如一段汽車(chē)漂移的視頻,如果要實(shí)現(xiàn)漂移的慢動(dòng)作演示,我們首先需要對(duì)視頻中的汽車(chē)進(jìn)行定位,只有對(duì)汽車(chē)進(jìn)行準(zhǔn)確定位后,比如精確定位汽車(chē)每一秒的漂移位置,這樣才可以對(duì)汽車(chē)后續(xù)整個(gè)漂移動(dòng)作進(jìn)行全程的展示(圖3)。

圖3 漂移汽車(chē)

實(shí)現(xiàn)對(duì)展示物體的定位后,因?yàn)檎故镜氖锹齽?dòng)作效果,我們還需要對(duì)視頻進(jìn)行補(bǔ)幀。因?yàn)樵瓉?lái)視頻本身就是低速攝影拍攝的,現(xiàn)在將視頻拉長(zhǎng)后,為了讓拉長(zhǎng)的視頻不出現(xiàn)卡頓(掉幀),此時(shí)就需要進(jìn)行精確的補(bǔ)幀,使得視頻拉長(zhǎng)后播放仍然非常順滑(圖4)。

圖4 英偉達(dá)展示舞蹈演員跳舞的慢動(dòng)作視頻

這樣通過(guò)視頻定位和補(bǔ)幀,英偉達(dá)的人工智能框架技術(shù)就實(shí)現(xiàn)將任意視頻慢動(dòng)作化。那么這樣的效果是怎樣實(shí)現(xiàn)?

英偉達(dá)的這項(xiàng)技術(shù)是借助NVIDIA Tesla V100 GPU強(qiáng)大視頻處理能力+人工智能學(xué)習(xí)框架實(shí)現(xiàn)的。英偉達(dá)搭建好人工智能學(xué)習(xí)框架后,通過(guò)預(yù)先準(zhǔn)備的約1.1萬(wàn)段的視頻素材作為數(shù)據(jù)源給人工智能進(jìn)行學(xué)習(xí),讓它從這些視頻素材中學(xué)習(xí)定位和補(bǔ)幀。比如上述跳舞視頻,人工智能技術(shù)可以對(duì)視頻中的舞者進(jìn)行定位,并且可以對(duì)舞者每一幀動(dòng)作進(jìn)行學(xué)習(xí),知道下一幀的人物是怎樣的狀態(tài)顯示。這樣通過(guò)一定的算法和學(xué)習(xí)模型,并且通過(guò)人工智能的深度學(xué)習(xí)和自我學(xué)習(xí),這個(gè)人工智能框架就可以對(duì)其他視頻進(jìn)行同樣的定位和分解,從而通過(guò)完美的定位和補(bǔ)幀技術(shù),實(shí)現(xiàn)將普通視頻慢動(dòng)作化(圖5)。

圖5 英偉達(dá)展示人從高空跳下壓破氣球瞬間慢動(dòng)作

當(dāng)然不僅僅是視頻慢動(dòng)作,借助新的訓(xùn)練方式,讓人工智能可以從已有的圖像中,生成新的圖像,甚至可以利用不同的人像,生成新的肖像。比如類(lèi)似影片中的換臉特效。英偉達(dá)的人工智能框架可以精準(zhǔn)的實(shí)現(xiàn)人物從一個(gè)人臉無(wú)縫轉(zhuǎn)換到另一個(gè)人臉的特效(圖6)。

圖6 英偉達(dá)展示變臉特效

慢動(dòng)作,帶給我們生活更多樂(lè)趣

通過(guò)上面的展示,我們見(jiàn)識(shí)到了英偉達(dá)人工智能框架在視頻處理方面的強(qiáng)大功能。這個(gè)技術(shù)的出現(xiàn)可以給我們生活帶來(lái)很多的樂(lè)趣。

隨著手機(jī)的普及,我們使用手機(jī)來(lái)拍攝短視頻,對(duì)于那些稍縱即逝的畫(huà)面,我們總想看清楚整個(gè)過(guò)程。比如喜歡跳廣場(chǎng)舞的老媽?zhuān)瑢?duì)于隊(duì)友,教練的快舞節(jié)奏總是看不清楚整個(gè)動(dòng)作,現(xiàn)在只要使用手機(jī)拍攝,然后借助英偉達(dá)這個(gè)技術(shù)轉(zhuǎn)化,舞者再快的動(dòng)作都可以變慢,讓老媽仔細(xì)看清楚每個(gè)舞蹈的動(dòng)作。

比如英偉達(dá)的變臉技術(shù)則可以讓我們?cè)偈謾C(jī)上制作出更多的搞笑視頻,比如將舍友變成可愛(ài)的貓咪,然后通過(guò)微信、朋友圈和好友共享。當(dāng)然這些技術(shù)也可以讓我們視頻處理變得更為簡(jiǎn)單,比如剪輯鋼琴老師彈琴動(dòng)作,方便我們學(xué)習(xí)指法,剪輯球員射門(mén)視頻,讓我們慢慢享受射門(mén)樂(lè)趣!

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4639

    瀏覽量

    128480
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46399

    瀏覽量

    236622
  • VaR
    VaR
    +關(guān)注

    關(guān)注

    0

    文章

    38

    瀏覽量

    11305
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3686

    瀏覽量

    90526
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5442

    瀏覽量

    120800
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人工智能是什么?

    ` 人工智能是什么?什么是人工智能?人工智能是未來(lái)發(fā)展的必然趨勢(shì)嗎?以后人工智能技術(shù)真的能達(dá)到電影里機(jī)器人的智能水平嗎?如果
    發(fā)表于 09-16 15:40

    人工智能技術(shù)—AI

      人工智能技術(shù)的概念從出來(lái)到現(xiàn)在已經(jīng)有很多年的歷史了,其實(shí)所謂的人工智能技術(shù)本身就是一種模擬人類(lèi)大腦的思考方式的一種技術(shù),它的英文簡(jiǎn)稱(chēng)是AI技術(shù),在西方國(guó)家,
    發(fā)表于 10-21 12:03

    人工智能傳感技術(shù)

    人工智能傳感技術(shù),希望有興趣的人共享
    發(fā)表于 06-03 09:03

    百度人工智能大神離職,人工智能的出路在哪?

    發(fā)展規(guī)劃,加快新材料、人工智能、集成電路、生物制藥、第五代移動(dòng)通信等技術(shù)研發(fā)和轉(zhuǎn)化”,這是“人工智能”首次出現(xiàn)在***工作報(bào)告中。兩會(huì)上,百度CEO李彥宏、小米董事長(zhǎng)雷軍、吉利控股集團(tuán)董事長(zhǎng)李書(shū)福等來(lái)自
    發(fā)表于 03-23 17:00

    急求Arduino物聯(lián)網(wǎng)人工智能視頻。。。。。

    急求Arduino物聯(lián)網(wǎng)人工智能視頻。。。。。
    發(fā)表于 01-26 14:38

    人工智能就業(yè)前景

    據(jù)相關(guān)招聘機(jī)構(gòu)數(shù)據(jù)顯示,2018年AI領(lǐng)域仍然是大部分資深技術(shù)人才轉(zhuǎn)崗的首選目標(biāo),在人才最緊缺的前十大職位中,時(shí)下最火的大數(shù)據(jù)、人工智能、算法類(lèi)崗位占據(jù)半壁江山。據(jù)調(diào)查指出,2017年技術(shù)研發(fā)類(lèi)崗位
    發(fā)表于 03-29 15:46

    電銷(xiāo)機(jī)器人成為2018人工智能最熱產(chǎn)業(yè)之一

    會(huì)給我們的生活帶來(lái)什么?1、智能醫(yī)療人工智能走進(jìn)醫(yī)療方向已經(jīng)是正在進(jìn)行的動(dòng)作了,尤其是在醫(yī)學(xué)影像方面,人工智能的工作效率不但相比人類(lèi)醫(yī)生有了急速的提升,更是在病理診斷中表現(xiàn)的尤為突出。
    發(fā)表于 05-21 15:54

    解讀人工智能的未來(lái)

    被稱(chēng)為狹義人工智能,因?yàn)樗荒茏鲆患囟ǖ氖虑?。狹義AI是構(gòu)建AGI的第一步嗎?許多對(duì)AGI感到困惑的人認(rèn)為目前研發(fā)人員應(yīng)該正在用同樣的技術(shù)把這些分散的狹義AI拼湊起來(lái)。有趣的是,關(guān)于自動(dòng)化
    發(fā)表于 11-14 10:43

    人工智能技術(shù)及算法設(shè)計(jì)指南

    手把手教你設(shè)計(jì)人工智能芯片及系統(tǒng)(全階設(shè)計(jì)教程+AI芯片F(xiàn)PGA實(shí)現(xiàn)+開(kāi)發(fā)板)詳情鏈接:http://url.elecfans.com/u/c422a4bd15人工智能各種技術(shù)與算法
    發(fā)表于 02-12 14:07

    人工智能醫(yī)生未來(lái)或上線,人工智能醫(yī)療市場(chǎng)規(guī)模持續(xù)增長(zhǎng)

    上崗?   能“讀圖”識(shí)別影像,還能“認(rèn)字”讀懂病歷,甚至像醫(yī)生一樣“思考”,出具診斷報(bào)告,給出治療建議……這不是科幻,人工智能醫(yī)療正從前沿技術(shù)轉(zhuǎn)變?yōu)楝F(xiàn)實(shí)應(yīng)用,“人工智能醫(yī)生”離患者越來(lái)越近。   機(jī)構(gòu)
    發(fā)表于 02-24 09:29

    人工智能芯片是人工智能發(fā)展的

    ......無(wú)形之中,人工智能正以前所未有的發(fā)展速度滲透我們的日常生活。而作為人工智能的核心技術(shù)之一,人工智能芯片也向來(lái)備受關(guān)注。近幾年,谷歌、蘋(píng)果、微軟、Facebook、英特爾、高
    發(fā)表于 07-27 07:02

    物聯(lián)網(wǎng)人工智能是什么?

    2.概率推理3.機(jī)器人技術(shù)4.計(jì)算機(jī)視覺(jué)5.自然語(yǔ)言處理等常見(jiàn)人工智能產(chǎn)品:語(yǔ)音識(shí)別,指紋識(shí)別,人臉識(shí)別,視網(wǎng)膜識(shí)別,智能搜索,無(wú)人駕駛,機(jī)器翻譯,智能控制,專(zhuān)家答疑系統(tǒng)等。如何學(xué)習(xí)好
    發(fā)表于 09-09 14:12

    嵌入式人工智能學(xué)習(xí)路線

    嵌入式人工智能,一個(gè)不算陌生的新技術(shù)名詞。它曾經(jīng)被云端和現(xiàn)實(shí)技術(shù)所束縛,只能在很小范圍進(jìn)行實(shí)驗(yàn)、運(yùn)用,但是隨著5G時(shí)代的漸漸臨近,我們?cè)僖淮温?tīng)到了它的聲音,而這一次,它開(kāi)始腳踏實(shí)地地走入市場(chǎng),走入
    發(fā)表于 09-16 17:07

    《移動(dòng)終端人工智能技術(shù)與應(yīng)用開(kāi)發(fā)》人工智能的發(fā)展與AI技術(shù)的進(jìn)步

    人工智能的發(fā)展是隨著人類(lèi)生活需要,產(chǎn)業(yè)需求不斷提升的,其中人工智能的發(fā)展很大程度上受到了計(jì)算機(jī)算力的影響,隨著數(shù)據(jù)處理量的增大,人工智能算法對(duì)算力的要求逐年增加,而且沒(méi)過(guò)兩年算力上升一倍,因此往往
    發(fā)表于 02-17 11:00

    英偉達(dá)AI黑科技,視頻翻倍慢放也能順滑如絲

    6 月 18 日,英偉達(dá)發(fā)布了一個(gè)視頻,顯示他們正在搭建的一個(gè)人工智能可以將普通的視頻轉(zhuǎn)化為平滑自然的慢動(dòng)作
    的頭像 發(fā)表于 06-27 15:14 ?3114次閱讀