0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TikTok引入前谷歌VideoPoet負(fù)責(zé)人蔣路,發(fā)力AI視頻生成

甲子光年 ? 來(lái)源:甲子發(fā)現(xiàn) ? 2024-02-22 13:36 ? 次閱讀

獨(dú)家獲悉,谷歌高級(jí)科學(xué)家、卡內(nèi)基梅隆大學(xué)(CMU)計(jì)算機(jī)學(xué)院兼職教授蔣路,已經(jīng)加入TikTok。

蔣路是谷歌 VideoPoet 項(xiàng)目負(fù)責(zé)人,VideoPoet 是谷歌在 2023 年 12 月推出的視頻生成大模型,類(lèi)似 OpenAI 剛剛發(fā)布的 Sora。

近期,昆侖萬(wàn)維創(chuàng)始人周亞輝在朋友圈表示,有個(gè)論文的作者加入字節(jié)北美做Tech Leader,正是指《VideoPoet: A large language model for zero-shot video generation》論文的作者蔣路。

資料顯示,蔣路先后在西安交通大學(xué)、布魯塞爾自由大學(xué)、卡內(nèi)基梅隆大學(xué)學(xué)習(xí)計(jì)算機(jī),并先后進(jìn)入微軟亞洲研究院、谷歌研究院、雅虎研究院實(shí)習(xí)。

2017 年,蔣路畢業(yè)后加入谷歌。他是谷歌云 AI 的創(chuàng)始成員,也是李佳博士和李飛飛博士首次聘請(qǐng)的研究員。此后,蔣路進(jìn)入谷歌研究院工作。

蔣路的研究曾被應(yīng)用到谷歌多個(gè)產(chǎn)品,如 YouTube、云服務(wù)、云 AutoML、廣告、Waymo 和翻譯服務(wù),影響了全球數(shù)十億用戶的日常生活。

蔣路的工作在自然語(yǔ)言處理(ACL)和計(jì)算機(jī)視覺(jué)(CVPR)的頂級(jí)會(huì)議上被提名為最佳論文。他是研究社區(qū)的活躍成員,擔(dān)任美國(guó)國(guó)家種子基金(NSF SBIR)的 AI 評(píng)審專(zhuān)家,并定期擔(dān)任 CVPR、ICCV、NeurlPS、ACM Multimedia 和 AAAI 等著名會(huì)議的領(lǐng)域主席。

蔣路的研究興趣主要在多媒體交叉領(lǐng)域,他專(zhuān)注于生成式 AI 和視頻創(chuàng)作。2019 年起,他就開(kāi)始嘗試將 Transformer 用在圖像、視頻生成研究上。

與 Sora 采用的 Diffusion + Transformer 架構(gòu)不同,蔣路負(fù)責(zé)的 VideoPoet 視頻生成模型采用了單 Transformer 架構(gòu),可以將任何自回歸語(yǔ)言模型或大型語(yǔ)言模型轉(zhuǎn)換為高質(zhì)量的視頻生成器,支持生成方形或縱向視頻,以針對(duì)短格式內(nèi)容定制生成視頻,并支持視頻輸入生成音頻

VideoPoet 采用了名為 Tokenizer 的數(shù)據(jù)處理技術(shù),可以將視頻和音頻片段編碼為離散標(biāo)記序列(discrete tokens),這些標(biāo)記也可以被轉(zhuǎn)換回原始表示。其中,視頻和圖像數(shù)據(jù)使用名為 MAGVIT V2 的技術(shù),音頻數(shù)據(jù)使用 SoundStream 的技術(shù)。

VideoPoet 通過(guò)使用多個(gè) Tokenizer 訓(xùn)練一個(gè)自回歸語(yǔ)言模型,以學(xué)習(xí)跨視頻、圖像、音頻和文本模態(tài)。一旦模型根據(jù)某些上下文生成了標(biāo)記,這些標(biāo)記就可以通過(guò)分詞器解碼器轉(zhuǎn)換回可查看的表示。

fe1ad37c-d143-11ee-a297-92fbcf53809c.png

3 周前,蔣路本人在職場(chǎng)社交平臺(tái)宣布了自己在谷歌的 Last Day,并特別表示對(duì)在谷歌所做的視頻生成項(xiàng)目(VideoPoet,MAGVIT,WALT等)感到自豪。

蔣路表示自己將繼續(xù)留在灣區(qū),開(kāi)始視頻生成領(lǐng)域的新旅程?,F(xiàn)在來(lái)看,新的旅程就是 TikTok。

值得一提的是,字節(jié)跳動(dòng)已經(jīng)在大模型領(lǐng)域全面布局,模型層推出了自研的「云雀大模型」以及類(lèi) ChatGPT 對(duì)話機(jī)器人產(chǎn)品豆包。2023 年底,字節(jié)跳動(dòng)成立新的 AI 應(yīng)用部門(mén) Flow,并在海外推出了 Coze 等多款產(chǎn)品。抖音集團(tuán) CEO 張楠也于近期卸任,專(zhuān)注于 AI 工具剪映的發(fā)展。

字節(jié)跳動(dòng)近期辟謠了推出中文版 Sora,并表示:“還無(wú)法完善產(chǎn)品落地,距離國(guó)外模型有很大差距。”但另一方面,字節(jié)跳動(dòng)正在大力招攬人才。

大模型戰(zhàn)場(chǎng),字節(jié)跳動(dòng)將會(huì)如何攪局?




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27989

    瀏覽量

    205535
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    8

    文章

    1688

    瀏覽量

    45869
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1010

    瀏覽量

    6343
  • TikTok
    +關(guān)注

    關(guān)注

    2

    文章

    212

    瀏覽量

    7183

原文標(biāo)題:獨(dú)家:TikTok引入前谷歌VideoPoet負(fù)責(zé)人蔣路,發(fā)力AI視頻生成|甲子光年

文章出處:【微信號(hào):jazzyear,微信公眾號(hào):甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標(biāo)志著火山引擎在視頻內(nèi)容生成領(lǐng)域邁出了重要一步。豆包模型憑借其獨(dú)特的技術(shù)優(yōu)勢(shì),吸引了業(yè)
    的頭像 發(fā)表于 09-25 14:11 ?190次閱讀

    OpenAI硬件負(fù)責(zé)人熱議AI基礎(chǔ)設(shè)施擴(kuò)展與節(jié)能方案

    在近日于斯坦福大學(xué)舉辦的Hot Chips 2024大會(huì)上,OpenAI的硬件設(shè)施負(fù)責(zé)人Trevor Cai發(fā)表了一場(chǎng)深入人心的演講,其核心聚焦于“構(gòu)建可擴(kuò)展的AI基礎(chǔ)設(shè)施”。Trevor Cai
    的頭像 發(fā)表于 09-02 16:20 ?449次閱讀

    谷歌任命原Character.AI首席執(zhí)行官為Gemini聯(lián)合技術(shù)負(fù)責(zé)人

    近日,谷歌宣布了一項(xiàng)重要人事任命,原Character.AI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官諾姆·沙澤爾(Noam Shazeer)已重返谷歌,并將擔(dān)任其人工智能新項(xiàng)目“Gemini”的聯(lián)合技術(shù)負(fù)責(zé)人
    的頭像 發(fā)表于 08-26 11:06 ?407次閱讀

    MediaTek與快手?jǐn)y手創(chuàng)新,端側(cè)視頻生成技術(shù)引領(lǐng)AI新紀(jì)元

    在科技日新月異的今天,MediaTek與快手再次攜手,于近日宣布了一項(xiàng)重大技術(shù)突破——高效端側(cè)視頻生成技術(shù)的誕生。這項(xiàng)技術(shù)不僅是對(duì)即將于2024年世界移動(dòng)通信大會(huì)(MWC 2024)上亮相的先進(jìn)視頻生成技術(shù)的有力延續(xù),更是雙方在生成
    的頭像 發(fā)表于 07-05 11:52 ?864次閱讀

    MediaTek聯(lián)合快手推出高效端側(cè)視頻生成技術(shù)

    MediaTek 與快手共同宣布,推出高效端側(cè)視頻生成技術(shù),共同探索并推進(jìn)生成AI 技術(shù)的革新。作為對(duì) 2024 世界移動(dòng)通信大會(huì)(MWC 2024)上亮相的視頻生成技術(shù)的延續(xù),該
    的頭像 發(fā)表于 07-05 11:23 ?4443次閱讀

    三星電子任命半導(dǎo)體業(yè)務(wù)新負(fù)責(zé)人,加碼AI芯片市場(chǎng)

    三星電子近日宣布,任命Young Hyun Jun為半導(dǎo)體部門(mén)的新負(fù)責(zé)人,此舉旨在進(jìn)一步加碼AI芯片市場(chǎng),以追趕包括SK海力士在內(nèi)的競(jìng)爭(zhēng)對(duì)手。
    的頭像 發(fā)表于 05-27 14:06 ?431次閱讀

    谷歌發(fā)布全新視頻生成模型Veo與Imagen文生圖模型

    谷歌近日宣布了兩項(xiàng)重大技術(shù)進(jìn)展,首先是視頻生成模型Veo的正式推出。這款先進(jìn)的模型能夠支持生成質(zhì)量更高的視頻內(nèi)容,讓用戶能夠根據(jù)自己的需求設(shè)定光照、鏡頭語(yǔ)言、
    的頭像 發(fā)表于 05-16 10:46 ?338次閱讀

    阿里云視頻生成技術(shù)創(chuàng)新!視頻生成使用了哪些AI技術(shù)和算法

    照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領(lǐng)域的創(chuàng)新 ? EMO(Emote Portrait Alive)是一個(gè)由阿里巴巴集團(tuán)智能計(jì)算研究院開(kāi)發(fā)的框架,一個(gè)音頻驅(qū)動(dòng)的 AI 肖像
    的頭像 發(fā)表于 05-08 00:07 ?3252次閱讀

    小鵬汽車(chē)迎來(lái)新AI負(fù)責(zé)人,研發(fā)XNGP技術(shù)

    小鵬汽車(chē)近日迎來(lái)新的AI團(tuán)隊(duì)負(fù)責(zé)人——Cruise公司前高級(jí)資深機(jī)器學(xué)習(xí)工程師LiuXianming。他將帶領(lǐng)小鵬AI團(tuán)隊(duì)研發(fā)XNGP技術(shù),為公司的自動(dòng)駕駛領(lǐng)域注入新的活力。
    的頭像 發(fā)表于 03-26 10:43 ?603次閱讀

    新火種AI|圍攻光明頂:Sora效應(yīng)下的AI視頻生成競(jìng)賽

    Sora的出現(xiàn),讓AI視頻生成領(lǐng)域真正“活”了起來(lái)
    的頭像 發(fā)表于 03-16 11:12 ?558次閱讀

    除了刷屏的Sora,國(guó)內(nèi)外還有哪些AI視頻生成工具

    。Sora的發(fā)布也讓AI生成視頻有了突破性進(jìn)展。 ? 過(guò)去一年多,全球科技公司都在發(fā)布各種大模型,然而AI生成內(nèi)容更多集中在文本和圖片方面,
    的頭像 發(fā)表于 02-26 08:42 ?4144次閱讀
    除了刷屏的Sora,國(guó)內(nèi)外還有哪些<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>工具

    openai發(fā)布首個(gè)視頻生成模型sora

    美國(guó)當(dāng)?shù)貢r(shí)間2024年2月15日 ,OpenAI正式發(fā)布文生視頻模型Sora ,并發(fā)布了48個(gè)文生視頻案例和技術(shù)報(bào)告 ,正式入局視頻生成領(lǐng)域 。Sora能夠根據(jù)提示詞生成60s的連貫
    的頭像 發(fā)表于 02-21 16:45 ?1120次閱讀

    AI視頻年大爆發(fā)!2023年AI視頻生成領(lǐng)域的現(xiàn)狀全盤(pán)點(diǎn)

    2023年,也是AI視頻元年。過(guò)去一年究竟有哪些爆款應(yīng)用誕生,未來(lái)視頻生成領(lǐng)域面臨的難題還有哪些?
    的頭像 發(fā)表于 02-20 10:40 ?1053次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>視頻</b>年大爆發(fā)!2023年<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>領(lǐng)域的現(xiàn)狀全盤(pán)點(diǎn)

    OpenAI發(fā)布文生視頻模型Sora,引領(lǐng)AI視頻生成新紀(jì)元

    在人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽(yù)的模型,以其“逼真”和“富有想象”的視頻生成能力,徹底顛覆了傳統(tǒng)
    的頭像 發(fā)表于 02-19 11:03 ?829次閱讀

    超算負(fù)責(zé)人離職,特斯拉下一代自動(dòng)駕駛何去何從?

    Peter Bannon 領(lǐng)導(dǎo)。特斯拉的 Dojo 項(xiàng)目不僅在為其自動(dòng)駕駛技術(shù)提供大量的算,也在特斯拉人形機(jī)器人 Optimus 項(xiàng)目開(kāi)發(fā)的算來(lái)源。 ? Dojo超算負(fù)責(zé)人離職 ? 近日,Ganesh在
    的頭像 發(fā)表于 01-02 09:19 ?1415次閱讀