0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出能一次生成完整視頻的擴散模型

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-01-29 11:14 ? 次閱讀

谷歌研究院近日發(fā)布了一款名為Lumiere的文生視頻擴散模型,基于自家研發(fā)的Space-Time U-Net基礎(chǔ)架構(gòu),獨立生成具有高效、完整且動作連貫性的視頻效果。

公司指出,當前眾多文生視頻模型普遍存在無法生成長時、高品質(zhì)及動作連貫的問題。這些模型往往采用“分段生成視頻”策略,即先生成少量關(guān)鍵幀,再借助時間超級分辨率(TSM)技術(shù)生成其間的視頻文件。盡管此策略可減緩RAM負擔,但難以生成理想的連續(xù)視頻效果。

針對此問題,谷歌的Lumiere模型創(chuàng)新地引入了新型Space-Time U-Net基礎(chǔ)架構(gòu),這種架構(gòu)能在空間和時間兩個維度同時降低信號采樣率,使其具備更高的計算效率,進而實現(xiàn)生成更具持續(xù)性、動作連貫的視頻效果。

此外,開發(fā)者們特別說明,Lumiere每次可生成80幀視頻(在16FPS模式下相當于5秒視頻,或在24FPS模式下為約3.34秒視頻)。盡管這一時光貌似短暫,然而他們強調(diào),事實上,這段5秒視頻所包含的鏡頭時長已超出大多數(shù)媒體作品中單一鏡頭的平均時長。

除運用架構(gòu)創(chuàng)新以外,作為AI構(gòu)建基礎(chǔ)的預訓練文生圖像模型也得到了谷歌團隊的特別關(guān)注。該模型首次生成簡單像素草稿作為視頻分幀,然后借助空間超分辨率(SRM)模型,逐步提高分幀分辨率,同時引入通用生成框架Multi-Diffusion以增強模型穩(wěn)定性,從而確保最終輸出的視頻效果一致且連續(xù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6104

    瀏覽量

    104791
  • RAM
    RAM
    +關(guān)注

    關(guān)注

    8

    文章

    1351

    瀏覽量

    114372
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29383

    瀏覽量

    267679
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3062

    瀏覽量

    48575
收藏 人收藏

    評論

    相關(guān)推薦

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這舉措標志著火山引擎在視頻內(nèi)容
    的頭像 發(fā)表于 09-25 14:11 ?191次閱讀

    鴻蒙OS開發(fā):【一次開發(fā),多端部署】(視頻應用)

    提供了“一次開發(fā),多端部署”的系統(tǒng)能力,讓開發(fā)者可以基于一次開發(fā),快速構(gòu)建不同類型終端上的應用,降低開發(fā)成本,提高開發(fā)效率。
    的頭像 發(fā)表于 05-25 16:29 ?4379次閱讀
    鴻蒙OS開發(fā):【<b class='flag-5'>一次</b>開發(fā),多端部署】(<b class='flag-5'>視頻</b>應用)

    谷歌發(fā)布全新視頻生成模型Veo與Imagen文生圖模型

    谷歌近日宣布了兩項重大技術(shù)進展,首先是視頻生成模型Veo的正式推出。這款先進的模型能夠支持生成質(zhì)
    的頭像 發(fā)表于 05-16 10:46 ?341次閱讀

    HarmonyOS開發(fā)案例:【一次開發(fā),多端部署(視頻應用)】

    提供了“一次開發(fā),多端部署”的系統(tǒng)能力,讓開發(fā)者可以基于一次開發(fā),快速構(gòu)建不同類型終端上的應用,降低開發(fā)成本,提高開發(fā)效率。
    的頭像 發(fā)表于 05-11 15:41 ?1208次閱讀
    HarmonyOS開發(fā)案例:【<b class='flag-5'>一次</b>開發(fā),多端部署(<b class='flag-5'>視頻</b>應用)】

    谷歌推出模型提升天氣預報準確性

    谷歌公司在天氣預報領(lǐng)域邁出了重要步,宣布推出名為“可擴展集成包絡(luò)擴散采樣器”(SEEDS)的新型AI模型。這
    的頭像 發(fā)表于 05-06 11:31 ?520次閱讀

    谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

    谷歌DeepMind的首席執(zhí)行官德米斯·哈薩比斯在2月26日透露,公司計劃在接下來的幾周內(nèi)重新發(fā)布其備受關(guān)注的Gemini AI模型人像生成功能。此前,由于在某些歷史圖像生成描述中出現(xiàn)
    的頭像 發(fā)表于 02-28 10:17 ?488次閱讀

    谷歌DeepMind推新AI模型Genie,生成2D游戲平臺

    據(jù)報道,谷歌公司的DeepMind團隊近期發(fā)布了AI模型Genie,此模型擁有多達110億個參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當完整的2D游戲場景。
    的頭像 發(fā)表于 02-27 14:53 ?680次閱讀

    sora模型中國可以使用嗎 sora模型是哪個公司

    。 Sora是擴散模型,具備從噪聲中生成完整視頻的能力,它
    的頭像 發(fā)表于 02-22 16:52 ?3047次閱讀

    OpenAI 在 AI 生成視頻領(lǐng)域扔出枚“王炸”,視頻生成模型“Sora”

    ABSTRACT摘要2月16日凌晨,也就是中國大年初七,OpenAI在AI生成視頻領(lǐng)域扔出枚“王炸”,宣布推出全新的生成式人工智能
    的頭像 發(fā)表于 02-22 08:25 ?324次閱讀
    OpenAI 在 AI <b class='flag-5'>生成</b><b class='flag-5'>視頻</b>領(lǐng)域扔出<b class='flag-5'>一</b>枚“王炸”,<b class='flag-5'>視頻生成</b><b class='flag-5'>模型</b>“Sora”

    sora如何使用 sora是什么軟件

    Sora是擴散模型,具備從噪聲中生成完整視頻的能力,它
    的頭像 發(fā)表于 02-21 17:20 ?2124次閱讀

    OpenAI發(fā)布文生視頻模型Sora,引領(lǐng)AI視頻生成新紀元

    在人工智能(AI)領(lǐng)域掀起新輪革命浪潮的,正是OpenAI最新推出的文生視頻模型——Sora。這款被業(yè)界廣泛贊譽的模型,以其“逼真”和“
    的頭像 發(fā)表于 02-19 11:03 ?832次閱讀

    OpenAI發(fā)布首個視頻生成模型Sora

    OpenAI近日宣布推出其全新的文本到視頻生成模型——Sora。這突破性的技術(shù)將視頻創(chuàng)作帶入了
    的頭像 發(fā)表于 02-18 10:07 ?951次閱讀

    谷歌推出AI擴散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴散模型Lumiere,這款模型基于谷歌自主研發(fā)的“Space-
    的頭像 發(fā)表于 02-04 13:49 ?920次閱讀

    基于DiAD擴散模型的多類異常檢測工作

    現(xiàn)有的基于計算機視覺的工業(yè)異常檢測技術(shù)包括基于特征的、基于重構(gòu)的和基于合成的技術(shù)。最近,擴散模型因其強大的生成能力而聞名,因此本文作者希望通過擴散
    的頭像 發(fā)表于 01-08 14:55 ?1085次閱讀
    基于DiAD<b class='flag-5'>擴散</b><b class='flag-5'>模型</b>的多類異常檢測工作

    如何在PyTorch中使用擴散模型生成圖像

    除了頂尖的圖像質(zhì)量,擴散模型還帶來了許多其他好處,包括不需要對抗性訓練。對抗訓練的困難是有據(jù)可查的。在訓練效率的話題上,擴散模型還具有可伸縮性和并行性的額外好處。
    發(fā)表于 11-22 15:51 ?446次閱讀
    如何在PyTorch中使用<b class='flag-5'>擴散</b><b class='flag-5'>模型</b><b class='flag-5'>生成</b>圖像