0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

4種用于視頻生成的尖端AI技術(shù)

倩倩 ? 來源:互聯(lián)網(wǎng)分析沙龍 ? 2020-04-11 10:00 ? 次閱讀

我們研究視頻到視頻的合成問題,其目的是學(xué)習(xí)從輸入源視頻(例如,一系列語義分割掩碼)到精確描述源視頻內(nèi)容的輸出真實感視頻的映射功能。

雖然它的圖像對應(yīng)物(圖像到圖像合成問題)是一個受歡迎的話題,但是視頻到視頻合成問題在文獻(xiàn)中很少探討。在不了解時間動態(tài)的情況下,將現(xiàn)有的圖像合成方法直接應(yīng)用于輸入視頻通常會導(dǎo)致視覺質(zhì)量低下的時間不連貫視頻。

在本文中,我們提出了一種在生成對抗性學(xué)習(xí)框架下的新穎的視頻合成方法。通過精心設(shè)計的生成器和鑒別器架構(gòu)以及時空對抗目標(biāo),我們可以通過多種輸入格式(包括分割蒙版,草圖和姿勢)獲得高分辨率,逼真的,時間上連貫的視頻結(jié)果。在多個基準(zhǔn)上進(jìn)行的實驗表明,與強基準(zhǔn)相比,我們的方法具有優(yōu)勢。

尤其是,我們的模型能夠合成長達(dá)30秒的街道場景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來的視頻預(yù)測,其性能超過了幾個最先進(jìn)的競爭系統(tǒng)。

我們的模型能夠合成長達(dá)30秒的街道場景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來的視頻預(yù)測,其性能超過了幾個最先進(jìn)的競爭系統(tǒng)。

我們的模型能夠合成長達(dá)30秒的街道場景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來的視頻預(yù)測,其性能超過了幾個最先進(jìn)的競爭系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 視頻
    +關(guān)注

    關(guān)注

    6

    文章

    1925

    瀏覽量

    72716
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3058

    瀏覽量

    48570
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    313

    瀏覽量

    20919
收藏 人收藏

    評論

    相關(guān)推薦

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標(biāo)志著火山引擎在視頻內(nèi)容生成領(lǐng)域邁出了重要一步。豆包模型憑借其獨特的
    的頭像 發(fā)表于 09-25 14:11 ?190次閱讀

    MediaTek與快手?jǐn)y手創(chuàng)新,端側(cè)視頻生成技術(shù)引領(lǐng)AI新紀(jì)元

    在科技日新月異的今天,MediaTek與快手再次攜手,于近日宣布了一項重大技術(shù)突破——高效端側(cè)視頻生成技術(shù)的誕生。這項技術(shù)不僅是對即將于2024年世界移動通信大會(MWC 2024)上
    的頭像 發(fā)表于 07-05 11:52 ?864次閱讀

    MediaTek聯(lián)合快手推出高效端側(cè)視頻生成技術(shù)

    MediaTek 與快手共同宣布,推出高效端側(cè)視頻生成技術(shù),共同探索并推進(jìn)生成AI 技術(shù)的革新。作為對 2024 世界移動通信大會(MW
    的頭像 發(fā)表于 07-05 11:23 ?4443次閱讀

    Google開發(fā)專為視頻生成配樂的人工智能技術(shù)

    近日,科技巨頭Google旗下的人工智能研究實驗室DeepMind宣布了一項引人注目的技術(shù)突破——V2A技術(shù)(Video to Audio),這是一項專為視頻生成配樂的人工智能技術(shù)。這
    的頭像 發(fā)表于 06-20 11:03 ?434次閱讀

    Runway發(fā)布Gen-3 Alpha視頻生成模型

    專為電影和圖像內(nèi)容創(chuàng)作者提供生成AI工具的Runway公司近日宣布,其最新的Gen-3 Alpha視頻生成模型已經(jīng)正式問世。這款模型在多方面均取得了顯著的進(jìn)步,為創(chuàng)作者們帶來了前所未有的便利和可能性。
    的頭像 發(fā)表于 06-19 09:25 ?480次閱讀

    阿里云視頻生成技術(shù)創(chuàng)新!視頻生成使用了哪些AI技術(shù)和算法

    照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領(lǐng)域的創(chuàng)新 ? EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院開發(fā)的框架,一個音頻驅(qū)動的 AI 肖像
    的頭像 發(fā)表于 05-08 00:07 ?3252次閱讀

    新火種AI|圍攻光明頂:Sora效應(yīng)下的AI視頻生成競賽

    Sora的出現(xiàn),讓AI視頻生成領(lǐng)域真正“活”了起來
    的頭像 發(fā)表于 03-16 11:12 ?558次閱讀

    除了刷屏的Sora,國內(nèi)外還有哪些AI視頻生成工具

    。Sora的發(fā)布也讓AI生成視頻有了突破性進(jìn)展。 ? 過去一年多,全球科技公司都在發(fā)布各種大模型,然而AI生成內(nèi)容更多集中在文本和圖片方面,
    的頭像 發(fā)表于 02-26 08:42 ?4144次閱讀
    除了刷屏的Sora,國內(nèi)外還有哪些<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>工具

    openai發(fā)布首個視頻生成模型sora

    美國當(dāng)?shù)貢r間2024年2月15日 ,OpenAI正式發(fā)布文生視頻模型Sora ,并發(fā)布了48個文生視頻案例和技術(shù)報告 ,正式入局視頻生成領(lǐng)域 。Sora能夠根據(jù)提示詞
    的頭像 發(fā)表于 02-21 16:45 ?1120次閱讀

    探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

    OpenAI的Sora現(xiàn)已擴展其能力范圍,進(jìn)入視頻生成領(lǐng)域,標(biāo)志著人工智能技術(shù)在多媒體內(nèi)容創(chuàng)作上的一個重大突破。Sora的視頻AI功能使得用戶能夠根據(jù)文本描述自動
    的頭像 發(fā)表于 02-20 12:01 ?1342次閱讀

    OpenAI新年開出王炸,視頻生成模型Sora問世

    近日,OpenAI在AI生成視頻領(lǐng)域取得重大突破,發(fā)布了全新的生成式人工智能模型“Sora”。該模型在視頻生成方面展現(xiàn)出了驚人的能力,通過文
    的頭像 發(fā)表于 02-20 11:46 ?682次閱讀

    AI視頻年大爆發(fā)!2023年AI視頻生成領(lǐng)域的現(xiàn)狀全盤點

    2023年,也是AI視頻元年。過去一年究竟有哪些爆款應(yīng)用誕生,未來視頻生成領(lǐng)域面臨的難題還有哪些?
    的頭像 發(fā)表于 02-20 10:40 ?1053次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>視頻</b>年大爆發(fā)!2023年<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>領(lǐng)域的現(xiàn)狀全盤點

    OpenAI發(fā)布文生視頻模型Sora,引領(lǐng)AI視頻生成新紀(jì)元

    在人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽的模型,以其“逼真”和“富有想象力”的視頻生成能力,徹底顛覆了傳統(tǒng)視頻生成
    的頭像 發(fā)表于 02-19 11:03 ?829次閱讀

    OpenAI發(fā)布首個視頻生成模型Sora

    OpenAI近日宣布推出其全新的文本到視頻生成模型——Sora。這一突破性的技術(shù)視頻創(chuàng)作帶入了一個全新的紀(jì)元,為用戶提供了前所未有的創(chuàng)作可能性。
    的頭像 發(fā)表于 02-18 10:07 ?950次閱讀

    閱流智作:一全新的生成AI視頻制作方式,或?qū)㈩嵏矊I(yè)視頻生產(chǎn)

    隨著AIGC技術(shù)的興起和發(fā)展,智能創(chuàng)作逐漸成為全球熱議的焦點,而面向?qū)I(yè)場景,可控的智能圖片、視頻生成式方向是所有內(nèi)容創(chuàng)作者最關(guān)心的。 AI創(chuàng)作類工具的應(yīng)用普及,創(chuàng)作者和設(shè)計師們在內(nèi)容創(chuàng)作流程中
    的頭像 發(fā)表于 11-02 14:40 ?357次閱讀