0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌AI新突破:為無聲視頻智能配音

CHANBAEK ? 來源:網(wǎng)絡(luò)整理 ? 2024-06-21 10:50 ? 次閱讀

近日,谷歌DeepMind團(tuán)隊(duì)公布了一項(xiàng)革命性的技術(shù)——利用AI為無聲視頻生成背景音樂的“video-to-audio”技術(shù)。這一技術(shù)的出現(xiàn),不僅為視頻創(chuàng)作領(lǐng)域帶來了新的可能,也為觀眾帶來了更加豐富的視聽體驗(yàn)。

據(jù)悉,該模型的工作原理十分獨(dú)特。首先,它會對用戶輸入的視頻進(jìn)行深度拆解,分析視頻中的每一幀畫面,提取出關(guān)鍵信息。然后,結(jié)合用戶提供的文字提示,模型會利用擴(kuò)散模型進(jìn)行反復(fù)運(yùn)算,以生成與視頻畫面相協(xié)調(diào)的背景聲音。

值得注意的是,這一模型具有極高的靈活性和可擴(kuò)展性。它可以為任何視頻生成無限數(shù)量的音軌,無論是輕松愉悅的旋律,還是緊張刺激的音效,都能輕松應(yīng)對。同時,通過調(diào)整提示詞的內(nèi)容,模型還能判斷生成的音頻是“正向性”還是“反向性”,從而令生成的聲音更加貼近某些特定場景。

這項(xiàng)技術(shù)的應(yīng)用前景十分廣闊。對于視頻創(chuàng)作者來說,他們無需再為尋找合適的背景音樂而煩惱,只需簡單輸入文字提示,AI就能為他們生成與視頻內(nèi)容完美契合的背景音樂。對于觀眾來說,他們也將享受到更加豐富多彩的視聽盛宴,沉浸在更加真實(shí)、生動的視頻世界中。

谷歌DeepMind團(tuán)隊(duì)的這一創(chuàng)新技術(shù),無疑為人工智能領(lǐng)域帶來了新的突破。它展示了AI在音視頻創(chuàng)作領(lǐng)域的巨大潛力,也為未來的音視頻創(chuàng)作帶來了更多的可能性。我們有理由相信,在不久的將來,這一技術(shù)將在更廣泛的領(lǐng)域得到應(yīng)用,為人們的生活帶來更多便利和樂趣。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6104

    瀏覽量

    104783
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29383

    瀏覽量

    267670
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3062

    瀏覽量

    48575
收藏 人收藏

    評論

    相關(guān)推薦

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    非常高興本周末收到一本新書,也非常感謝平臺提供閱讀機(jī)會。 這是一本挺好的書,包裝精美,內(nèi)容詳實(shí),干活滿滿。 關(guān)于《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章“AI
    發(fā)表于 10-14 09:16

    谷歌全球AI教育設(shè)立1.2億美元基金

    在聯(lián)合國未來峰會上,谷歌CEO桑達(dá)爾·皮查伊發(fā)表了一場激動人心的演講,他將人工智能AI)譽(yù)為“迄今為止最具變革性的技術(shù)”,并承諾將這一力量用于推動全球教育進(jìn)步。為此,谷歌宣布設(shè)立一項(xiàng)
    的頭像 發(fā)表于 09-25 14:32 ?257次閱讀

    谷歌任命原Character.AI首席執(zhí)行官Gemini聯(lián)合技術(shù)負(fù)責(zé)人

    近日,谷歌宣布了一項(xiàng)重要人事任命,原Character.AI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官諾姆·沙澤爾(Noam Shazeer)已重返谷歌,并將擔(dān)任其人工智能新項(xiàng)目“Gemini”的聯(lián)合技
    的頭像 發(fā)表于 08-26 11:06 ?411次閱讀

    谷歌:聚焦AI與技術(shù)創(chuàng)新,攜手中國開發(fā)者共筑未來

    2024年8月9日,備受矚目的谷歌開發(fā)者大會——I/O Connect China圓滿落幕。此次盛會,谷歌面向中國廣大的開發(fā)者群體,全面展示了其在人工智能AI)、移動技術(shù)、云計(jì)算及W
    的頭像 發(fā)表于 08-09 17:03 ?806次閱讀

    谷歌推出旗下AI智能體管理項(xiàng)目Project Oscar

    在近日于印度班加羅爾盛大舉行的2024 I/O Connect開發(fā)者活動上,谷歌公司隆重推出了Project Oscar項(xiàng)目,這一創(chuàng)新舉措標(biāo)志著開源軟件項(xiàng)目管理領(lǐng)域迎來了AI智能體的全面賦能
    的頭像 發(fā)表于 07-19 16:07 ?523次閱讀

    ai智能視頻監(jiān)控系統(tǒng) OpenCV

    ai智能視頻監(jiān)控系統(tǒng)選用數(shù)字圖像處理、計(jì)算機(jī)視覺和機(jī)器視覺技術(shù)性,利用軟件強(qiáng)勁的數(shù)據(jù)處理方法工作能力。ai智能
    的頭像 發(fā)表于 07-08 08:46 ?269次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>智能</b><b class='flag-5'>視頻</b>監(jiān)控系統(tǒng) OpenCV

    榮耀新品將搭載谷歌AI功能,提升生成式AI體驗(yàn)

    榮耀于5月22日宣布,將在新款智能手機(jī)上集成谷歌AI功能,實(shí)現(xiàn)生成式AI體驗(yàn)。此外,新機(jī)還將得到谷歌云服務(wù)的支持。
    的頭像 發(fā)表于 05-23 08:51 ?392次閱讀

    微軟發(fā)布視頻編輯新功能:自動消除無聲片段

    用戶只需要在Clipchamp工具欄中啟用人工智能建議,軟件即可自動掃描視頻并識別其中的靜音片段。用戶可以選擇單獨(dú)或批量刪除這些無聲音節(jié)。
    的頭像 發(fā)表于 04-19 14:42 ?542次閱讀

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日發(fā)布了一項(xiàng)令人矚目的新功能,它是一款能夠借助自然語言對話幫助用戶生成旅行行程和出游建議的AI工具。這款工具的推出,標(biāo)志著谷歌在人工智能領(lǐng)域的又一重要
    的頭像 發(fā)表于 03-29 11:08 ?574次閱讀

    Nvidia利用人工智能將游戲角色變成聊天機(jī)器人

    英偉達(dá)正在展示開發(fā)者如何開始使用其人工智能“數(shù)字人”工具視頻游戲角色配音、制作動畫和生成對話。
    的頭像 發(fā)表于 03-21 16:14 ?775次閱讀

    谷歌DeepMind推出SIMI通用AI智能

    視頻游戲中理解并遵循自然語言指令。這一突破性的技術(shù)成果標(biāo)志著人工智能領(lǐng)域的一大步,使得機(jī)器能夠更好地理解和適應(yīng)人類的各種需求。
    的頭像 發(fā)表于 03-18 11:39 ?824次閱讀

    探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

    OpenAI的Sora現(xiàn)已擴(kuò)展其能力范圍,進(jìn)入視頻生成領(lǐng)域,標(biāo)志著人工智能技術(shù)在多媒體內(nèi)容創(chuàng)作上的一個重大突破。Sora的視頻AI功能使得用
    的頭像 發(fā)表于 02-20 12:01 ?1343次閱讀

    谷歌發(fā)布AI新版本Gemini 1.5

    谷歌近日宣布推出其最新的人工智能AI)版本——Gemini 1.5,這一新版本在文本處理能力上實(shí)現(xiàn)了重大突破。據(jù)了解,Gemini 1.5 Pro的上下文窗口長度已經(jīng)擴(kuò)展到驚人的10
    的頭像 發(fā)表于 02-19 11:05 ?995次閱讀

    谷歌推出AI擴(kuò)散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴(kuò)散模型Lumiere,這款模型基于谷歌自主研發(fā)的“Space-Time U-Net”基礎(chǔ)架構(gòu),旨在實(shí)現(xiàn)視頻生成的一次性完成,同時保證
    的頭像 發(fā)表于 02-04 13:49 ?918次閱讀

    人工智能的影響力正在蔓延

    2023人工智能/機(jī)器學(xué)習(xí)(AI/ML) 隨著 Google Gemini AI 的發(fā)布而落下帷幕,它既是對 ChatGPT 的追趕,也是對多模式 AI
    發(fā)表于 12-27 18:16 ?254次閱讀