3 月 19 日,Google 在其官方博客上發(fā)布了關(guān)于 VLOGGER AI 模型的相關(guān)信息。這是一款利用用戶提供的肖像照片和音頻內(nèi)容,使人物生動(dòng)地呈現(xiàn)音頻內(nèi)容并具備豐富面部表情的人工智能程序。
具體來說,VLOGGER AI 采用一種適應(yīng)虛擬肖像的多模態(tài) Diffusion 模型,通過 MENTOR 數(shù)據(jù)庫進(jìn)行訓(xùn)練,涵蓋了超80萬個(gè)人物肖像及超過2200小時(shí)的視頻數(shù)據(jù)。得益于此,VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的肖像視頻。
研發(fā)團(tuán)隊(duì)指出,相較于之前的同類產(chǎn)品,VLOGGER 的獨(dú)特之處在于無需針對(duì)每個(gè)使用者進(jìn)行單獨(dú)培訓(xùn),且不受限于人臉檢測(cè)和裁剪,能產(chǎn)出完整的圖像,且能夠處理更多元化的情境如可見的身軀或者其他身份特征,這對(duì)于真實(shí)再現(xiàn)人物交流過程至關(guān)重要。
谷歌將 VLOGGER 視為通往“通用聊天機(jī)器人”未來的關(guān)鍵一步,使人工智能能以自然的語音、手勢(shì)和眼神等方式與人類交互。除此之外,VLOGGER 還可用作報(bào)告、教育領(lǐng)域以及旁白等方面的輔助工具,并能對(duì)已有的電影進(jìn)行剪輯和表情調(diào)整。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
近日,谷歌在人工智能領(lǐng)域取得新突破,正式推出了Imagen文生圖模型。這款模型以其卓越的細(xì)節(jié)調(diào)整功能、逼真的光線效果以及從草圖快速生成高分辨率圖像的能力,引起了業(yè)界的廣泛關(guān)注。
發(fā)表于 05-16 09:30
?440次閱讀
谷歌最新推出的VLOGGER AI技術(shù)引起了廣泛關(guān)注,這項(xiàng)創(chuàng)新的多模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來并“說話”。用戶只需提供一張人物
發(fā)表于 03-22 10:45
?726次閱讀
谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨(dú)特之處在于,僅需一張圖片,便能生成一個(gè)充滿活力和交互性的虛擬世界。用戶可以在這個(gè)世界中逐
發(fā)表于 03-04 14:02
?650次閱讀
谷歌近日發(fā)布了其全新的AI模型Genie,這一模型徹底改變了我們與數(shù)字世界的互動(dòng)方式。Genie不僅可以接收文本提示、草圖或想法,還能將這些
發(fā)表于 02-28 18:25
?1578次閱讀
谷歌公司近日宣布,其全新的AI大模型Gemma現(xiàn)已在全球范圍內(nèi)開放使用。這一重要舉措不僅彰顯了谷歌在AI領(lǐng)域的領(lǐng)先地位,還為其在全球范圍內(nèi)的
發(fā)表于 02-28 18:12
?1030次閱讀
谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎(chǔ)世界模型Genie。這一創(chuàng)新技術(shù)允許用戶通過單張圖像提示,生成一個(gè)可玩的、交互式的虛擬環(huán)境,從而開啟了一個(gè)全新的數(shù)字體驗(yàn)時(shí)代。
發(fā)表于 02-28 17:41
?701次閱讀
近日,谷歌發(fā)布了全新AI大模型Gemma,這款模型為各種規(guī)模的組織提供了前所未有的機(jī)會(huì),以負(fù)責(zé)任的方式在商業(yè)應(yīng)用中進(jìn)行分發(fā)。
發(fā)表于 02-28 17:38
?755次閱讀
近日,谷歌推出了一款革命性的AI模型——Genie。這款模型能夠?qū)⒑?jiǎn)單的文本提示、草圖或初步想法迅速轉(zhuǎn)化為一個(gè)可以互動(dòng)和游戲的虛擬世界。這一突破性的技術(shù)無疑將改變?nèi)藗儎?chuàng)建和體驗(yàn)虛擬世界
發(fā)表于 02-28 10:05
?648次閱讀
谷歌模型
北京中科同志科技股份有限公司
發(fā)布于 :2024年02月28日 09:13:06
據(jù)報(bào)道,谷歌公司的DeepMind團(tuán)隊(duì)近期發(fā)布了AI模型Genie,此模型擁有多達(dá)110億個(gè)參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當(dāng)完
發(fā)表于 02-27 14:53
?680次閱讀
谷歌近日宣布推出開源人工智能(AI)模型系列Gemma,旨在為開發(fā)人員和研究人員提供一個(gè)負(fù)責(zé)任的AI構(gòu)建平臺(tái)。這一舉措標(biāo)志著自2022年OpenAI的ChatGPT引領(lǐng)
發(fā)表于 02-23 11:38
?740次閱讀
在人工智能領(lǐng)域,谷歌可以算是開源的鼻祖。今天幾乎所有的大語言模型,都基于谷歌在 2017 年發(fā)布的 Transformer 論文;谷歌的
發(fā)表于 02-22 18:14
?385次閱讀
近日,谷歌研究院重磅推出全新AI擴(kuò)散模型Lumiere,這款模型基于谷歌自主研發(fā)的“Space-Time U-Net”基礎(chǔ)架構(gòu),旨在
發(fā)表于 02-04 13:49
?920次閱讀
近日,獵戶星空在2024·傅盛的開年AI大課暨獵戶星空企業(yè)應(yīng)用大模型發(fā)布會(huì)上,正式發(fā)布了其最新研發(fā)的大模型。這個(gè)大
發(fā)表于 01-22 14:31
?608次閱讀
谷歌破繭而出,全新發(fā)布 Google AI SDK,引領(lǐng) Android 應(yīng)用邁向高性能 AI 集成新時(shí)代。這次發(fā)布的 SDK,專門為 An
發(fā)表于 01-03 14:18
?732次閱讀
評(píng)論