0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepMind把GAN又玩出了新花樣!推出的是雙視頻判別器GAN

DPVg_AI_era ? 來源:lq ? 2019-07-27 07:37 ? 次閱讀

DeepMind把GAN又玩出了新花樣!這次推出的是雙視頻判別器GAN,通過對(duì)判別器更高效的分解,生成的視頻樣本在長度和分辨率上都遠(yuǎn)高于此前最好水平,在多個(gè)合成和預(yù)測(cè)視頻數(shù)據(jù)集上刷新了SOTA。

也許你聽說過FaceApp,這是一款利用AI來改變自拍的移動(dòng)應(yīng)用程序,你可能也聽說過“這些人物都不存在”網(wǎng)站,它可以顯示計(jì)算機(jī)生成的虛構(gòu)人物照片。但是生成完完全全的新視頻的算法你聽說過嗎?最近,DeepMind的一篇最新論文詳細(xì)介紹了AI剪輯生成領(lǐng)域的最新進(jìn)展。

論文地址:

https://arxiv.org/pdf/1907.06571.pdf

研究人員表示,由于“高效計(jì)算”組件和技術(shù)的使用,再加上新的定制數(shù)據(jù)集,他們訓(xùn)練出的最佳性能模型:雙視頻鑒別器GAN(DVD-GAN)可以生成“高保真度”的連貫256 x 256像素視頻,幀數(shù)高達(dá)48幀。

DVD-GAN這個(gè)簡稱由Ian Goodfellow“欽定”

“生成自然視頻對(duì)于生成建模任務(wù)來說是一個(gè)明顯更困難的挑戰(zhàn),受到數(shù)據(jù)復(fù)雜性和計(jì)算要求增加的困擾,”共同作者寫道。“出于這個(gè)原因,許多關(guān)于視頻生成的先前研究都圍繞著相對(duì)簡單的數(shù)據(jù)集或可獲得強(qiáng)時(shí)間條件信息的任務(wù)。我們的研究則關(guān)注視頻合成和視頻預(yù)測(cè)的任務(wù)......并將生成圖像模型的成果擴(kuò)展到視頻領(lǐng)域?!?/p>

研究人員圍繞尖端AI架構(gòu)構(gòu)建系統(tǒng),并專門針對(duì)視頻進(jìn)行了特定的調(diào)整,使其能夠在Kinetics-600上進(jìn)行訓(xùn)練,這是一個(gè)比常用語料庫大一個(gè)數(shù)量級(jí)的自然視頻數(shù)據(jù)集。具體來說,研究人員利用擴(kuò)大的生成對(duì)抗網(wǎng)絡(luò)(GAN),它已應(yīng)用于多種轉(zhuǎn)換任務(wù),比如將字幕轉(zhuǎn)換為逐個(gè)場(chǎng)景的情節(jié)板,生成人造星系的圖像等。本文中采用的是BigGAN,以大批量和數(shù)百萬個(gè)參數(shù)而著稱。

DVD-GAN:雙判別器,非約束數(shù)據(jù)集無需擔(dān)心過擬合

一組4秒合成視頻剪輯,由Kinetics-600在128×128幀上訓(xùn)練

DVD-GAN包含兩個(gè)判別器:一個(gè)空間判別器,通過隨機(jī)采樣全分辨率幀并單獨(dú)處理,來評(píng)判單幀的內(nèi)容和結(jié)構(gòu),還有一個(gè)是時(shí)間判別器,負(fù)責(zé)提供學(xué)習(xí)信號(hào)來生成運(yùn)動(dòng)。此外還有一個(gè)單獨(dú)的模塊:變換器,讓學(xué)習(xí)到的信息在整個(gè)AI模型中傳播。

至于訓(xùn)練數(shù)據(jù)集(Kinetics-600),這是根據(jù)最初為人類行為識(shí)別策劃的500,000個(gè)10秒高分辨率YouTube剪輯編制的,研究人員稱該數(shù)據(jù)集具有“多樣化”和“非受限”的特點(diǎn),他們聲稱這些特征消除了過擬合的風(fēng)險(xiǎn)。(在機(jī)器學(xué)習(xí)中,過擬合是指與特定數(shù)據(jù)集過于緊密對(duì)應(yīng)的模型,因此無法可靠地預(yù)測(cè)未來的觀測(cè)結(jié)果。)

該團(tuán)隊(duì)在論文中表示,在經(jīng)過Google加速的第三代TPU訓(xùn)練12到96小時(shí)后,DVD-GAN成功創(chuàng)建了包括目標(biāo)結(jié)構(gòu)、移動(dòng),甚至是復(fù)雜紋理的視頻。模型還盡力在更高的分辨率下創(chuàng)建連貫的物體,物體的運(yùn)動(dòng)組成像素更多。但研究人員指出,在UCF-101(13,320個(gè)人類行為視頻的較小數(shù)據(jù)集)上評(píng)估時(shí),DVD-GAN生成的樣本的最好成績分?jǐn)?shù)為32.97。

“我們希望進(jìn)一步強(qiáng)調(diào)在大型復(fù)雜視頻數(shù)據(jù)集(如Kinetics-600)上訓(xùn)練生成模型的好處,”論文中寫道。“我們想通過DVD-GAN在此數(shù)據(jù)集上建立的強(qiáng)大基線標(biāo)準(zhǔn),作為生成建模社區(qū)的參考標(biāo)桿。雖然在非約束的環(huán)境下,要想始終如一地生成逼真的視頻還有很多工作要做,但我們相信,DVD-GAN是朝這個(gè)方向邁出的堅(jiān)實(shí)一步?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1896

    瀏覽量

    72339
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24592
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    129

    瀏覽量

    10801

原文標(biāo)題:DeepMind把GAN玩出新花樣!基于BigGAN,生成高保真視頻

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    GaN應(yīng)用介紹

    電子發(fā)燒友網(wǎng)站提供《GaN應(yīng)用介紹.pdf》資料免費(fèi)下載
    發(fā)表于 09-12 09:55 ?0次下載
    <b class='flag-5'>GaN</b>應(yīng)用介紹

    GaN HEMT有哪些優(yōu)缺點(diǎn)

    GaN HEMT(氮化鎵高電子遷移率晶體管)作為一種先進(jìn)的功率半導(dǎo)體器件,在電力電子、高頻通信、汽車電子等多個(gè)領(lǐng)域展現(xiàn)出了顯著的優(yōu)勢(shì),但同時(shí)也存在一些缺點(diǎn)。以下是對(duì)GaN HEMT優(yōu)缺點(diǎn)的詳細(xì)分析:
    的頭像 發(fā)表于 08-15 11:09 ?641次閱讀

    商用清潔賽道,普渡清潔機(jī)器人如何玩出新花樣?

    商用清潔賽道,普渡清潔機(jī)器人如何玩出新花樣? 前言 每次技術(shù)革命,都將對(duì)傳統(tǒng)模式帶來顛覆性改變。 目前,我國產(chǎn)業(yè)結(jié)構(gòu)正進(jìn)入快速升級(jí)階段,智能制造春潮涌動(dòng),各行各業(yè)正在經(jīng)歷一輪智能化轉(zhuǎn)型升級(jí)的變革
    的頭像 發(fā)表于 08-14 10:21 ?337次閱讀

    德州儀器推出先進(jìn)650V三相GaN IPM

    德州儀器 (TI) 推出了適用于 250W 電機(jī)驅(qū)動(dòng)應(yīng)用的先進(jìn) 650V 三相 GaN IPM。這款全新的 GaN IPM 解決了工程師在設(shè)計(jì)大型家用電器及加熱、通風(fēng)和空調(diào) (HVA
    的頭像 發(fā)表于 06-18 14:24 ?620次閱讀

    CGD推出高效環(huán)保GaN功率器件

    近日,無晶圓廠環(huán)??萍及雽?dǎo)體公司Cambridge GaN Devices(CGD)發(fā)布了一系列革命性的高能效氮化鎵(GaN)功率器件,旨在推動(dòng)電子器件向更環(huán)保的方向發(fā)展。
    的頭像 發(fā)表于 06-12 10:24 ?546次閱讀

    CGD為電機(jī)控制帶來GaN優(yōu)勢(shì)

    評(píng)估套件具有 Qorvo 的高性能無刷直流 / 永磁同步電機(jī)控制 / 驅(qū)動(dòng)和 CGD 易于使用的 ICeGaN GaN 功率 IC 的性能 ? 英國劍橋 - Cambridge GaN
    發(fā)表于 06-07 17:22 ?343次閱讀
    CGD為電機(jī)控制帶來<b class='flag-5'>GaN</b>優(yōu)勢(shì)

    適配MOSFET柵極驅(qū)動(dòng)以驅(qū)動(dòng)GaN FETs

    GaN FETs以其體積小、切換速度快、效率高及成本低等優(yōu)勢(shì),為電力電子產(chǎn)業(yè)帶來了革命性的變化。然而,GaN技術(shù)的快速發(fā)展有時(shí)超出了專門為GaN設(shè)計(jì)的柵極驅(qū)動(dòng)
    的頭像 發(fā)表于 02-29 17:54 ?709次閱讀
    適配MOSFET柵極驅(qū)動(dòng)<b class='flag-5'>器</b>以驅(qū)動(dòng)<b class='flag-5'>GaN</b> FETs

    功率GaN的多種技術(shù)路線簡析

    )。另一方面,功率GaN的技術(shù)路線從不同的層面看還有非常豐富的種類。 ? 器件模式 ? 功率GaN FET目前有兩種主流方向,包括增強(qiáng)型E-Mode和耗盡型D-Mode。其中增強(qiáng)型GaN FET是單芯片常關(guān)器件,而耗盡型
    的頭像 發(fā)表于 02-28 00:13 ?2539次閱讀

    功率GaN,炙手可熱的并購賽道?

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)繼去年英飛凌收購GaN Systems之后,2024年1月,另一家汽車芯片大廠瑞薩也收購了功率GaN公司Transphorm。 ? Transphorm在2022年
    的頭像 發(fā)表于 02-26 06:30 ?2278次閱讀
    功率<b class='flag-5'>GaN</b>,炙手可熱的并購賽道?

    OpenAI發(fā)布首個(gè)文生視頻模型Sora

    開發(fā)出熱門聊天機(jī)器人ChatGPT后,OpenAI繼續(xù)在生成式人工智能上玩出新花樣。
    的頭像 發(fā)表于 02-19 13:56 ?935次閱讀

    英飛凌聯(lián)手日本歐姆龍推出了一款集成GaN技術(shù)的V2X充電樁

    近日,英飛凌聯(lián)手日本歐姆龍推出了一款集成GaN技術(shù)的V2X 充電樁。
    的頭像 發(fā)表于 01-19 10:23 ?1043次閱讀
    英飛凌聯(lián)手日本歐姆龍<b class='flag-5'>推出了</b>一款集成<b class='flag-5'>GaN</b>技術(shù)的V2X充電樁

    GaN 技術(shù)的過去和現(xiàn)在

    GaN 技術(shù)的過去和現(xiàn)在
    的頭像 發(fā)表于 12-06 18:21 ?599次閱讀
    <b class='flag-5'>GaN</b> 技術(shù)的過去和現(xiàn)在

    GaN 如何改變了市場(chǎng)

    GaN 如何改變了市場(chǎng)
    的頭像 發(fā)表于 12-06 17:10 ?377次閱讀
    <b class='flag-5'>GaN</b> 如何改變了市場(chǎng)

    GaN是否可靠?

    GaN是否可靠?
    的頭像 發(fā)表于 12-05 10:18 ?378次閱讀
    <b class='flag-5'>GaN</b>是否可靠?

    什么是氮化鎵(GaN)?GaN的優(yōu)勢(shì)和應(yīng)用領(lǐng)域

    GaN近期為何這么火?如果再有人這么問你,你可以這樣回答:因?yàn)槲覀冸x不開電源。
    的頭像 發(fā)表于 11-02 10:32 ?4423次閱讀
    什么是氮化鎵(<b class='flag-5'>GaN</b>)?<b class='flag-5'>GaN</b>的優(yōu)勢(shì)和應(yīng)用領(lǐng)域