0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達開發(fā)新AI算法,視頻通話的流量最高壓縮90%以上

工程師鄧生 ? 來源:量子位 ? 作者:凹非寺 ? 2020-12-02 14:29 ? 次閱讀

為了讓網(wǎng)速慢的用戶用上高清通話,英偉達可謂絞盡腦汁。他們開發(fā)的新AI算法,可以將視頻通話的流量最高壓縮90%以上。

和其他視頻相比,通話的場景比較單一,基本上只有人的頭部在運動。因此只要能把頭像數(shù)據(jù)大規(guī)模壓縮,就能大大節(jié)約流量。

英偉達的新算法face vid2vid正是從這一點出發(fā)。只要一張圖片,就能實現(xiàn)重建各種頭部姿勢圖片。

H.264視頻所需的帶寬是這種新算法的2~12倍,從前面的演示也能看出,如果讓二者使用相同比特率,那么H.264視頻幾乎不可用。

轉動面部不扭曲

英偉達提供了一個試用Demo,可以在Pitch(俯仰角)、Yaw(偏航角)、Roll(翻滾角)三個方向上任意旋轉。

輸入一張人臉,最多可以在每個方向上最多旋轉30度。以下是三個方向上旋轉到最大角度生成的圖片。

與相比之前的方法,英偉達的這種技術即使在面部轉動幅度較大時,人臉也不會扭曲變形。

然而,圖片終究是不動的,要把生成的人臉放在運動的視頻中還要多一個步驟。

合成面部視頻

我們把上傳的清晰照片作為源圖像,從中獲取外貌特征。然后把視頻中一幀幀畫面作為重構視頻的依據(jù),從中提取出面部表情和頭部姿勢等信息。

而表情和姿勢這兩個數(shù)據(jù)可以通過關鍵點進行編碼,這樣就分離了人物身份信息和運動信息。在傳輸視頻時只要有運動信息即可,從而節(jié)約了流量。

從源圖像s中,我們得到了兩組數(shù)據(jù):關鍵點坐標x和雅可比矩陣J。這兩組參數(shù)與面部的具體特征無關,只包含人的幾何特征。

其中,雅可比矩陣表示如何通過仿射變換將關鍵點周圍的局部補丁轉換為另一幅圖像中的補丁。如果是恒等雅可比矩陣,則補丁將直接復制并粘貼到新位置。

下圖展示了計算前5個關鍵點的流程。給定源圖像以及模型預測的規(guī)范關鍵點。

從運動視頻估計的旋轉和平移應用于關鍵點,帶動頭部姿勢的變化。然后可以感知表情的變形將關鍵點調整為目標表情。

接下來開始合成視頻。使用源和運動的關鍵點與其雅可比矩陣來估計流wk,從生成流組合成掩碼m,將這兩組進行線性組合即可產(chǎn)生合成流場w。

接著輸入人臉面部特征f,即可生成輸出圖像y。

這種方法不僅能用于視頻通話,也有其他“新玩法”。

比如覺得人物頭像有點歪,可以手動輸入糾正后的數(shù)據(jù),從而將面部轉正。

又或者是,把一個人的面部特征點和雅可比矩陣用于另一個人,實現(xiàn)面部視頻動作的遷移。

團隊簡介

這篇文章的第一作者是來自英偉達的高級研究員Ting-Chun Wang。

文章的通訊作者是英偉達的著名研究員劉洺堉。

如果你長期關注CV領域,一定對這兩位作者非常熟悉。他們在圖像風格遷移、GAN等方面做出了大量的工作。

△ GauGAN

兩人之前已經(jīng)有過多次合作。比如。無監(jiān)督圖像遷移網(wǎng)絡(NIPS 2017),還有從涂鴉生成照片的GauGAN(CVPR 2019),都是出自這二位之手。

責任編輯:PSY

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4580

    瀏覽量

    92369
  • 開發(fā)
    +關注

    關注

    0

    文章

    361

    瀏覽量

    40776
  • AI
    AI
    +關注

    關注

    87

    文章

    29447

    瀏覽量

    267771
  • 視頻通話
    +關注

    關注

    0

    文章

    49

    瀏覽量

    11708
  • 英偉達
    +關注

    關注

    22

    文章

    3689

    瀏覽量

    90536
收藏 人收藏

    評論

    相關推薦

    英偉與阿聯(lián)酋G42合作開發(fā)天氣預測AI模型

    英偉近期宣布與阿聯(lián)酋的領先AI應用開發(fā)企業(yè)G42達成戰(zhàn)略合作,共同探索天氣預測技術的新前沿。雙方將整合各自的技術優(yōu)勢,依托英偉
    的頭像 發(fā)表于 09-24 15:41 ?213次閱讀

    英偉投資日本AI公司Sakana AI

    英偉現(xiàn)身日本人工智能研發(fā)初創(chuàng)公司Sakana AI的A輪融資名單中;據(jù)悉;Sakana AI的A輪融資而完成超過1億美元,此次融資由New Enterprise Associates
    的頭像 發(fā)表于 09-05 15:46 ?557次閱讀

    英偉Blackwell架構揭秘:下一個AI計算里程碑?# 英偉# 英偉Blackwell

    英偉行業(yè)資訊
    jf_02331860
    發(fā)布于 :2024年08月26日 10:58:09

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    英偉推出AI模型推理服務NVIDIA NIM

    英偉近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉
    的頭像 發(fā)表于 06-04 09:15 ?586次閱讀

    英偉首席執(zhí)行官黃仁勛:AI模型推動英偉AI芯片需求

    近來,以ChatGPT為代表的AI聊天機器人已經(jīng)導致英偉AI芯片供應緊張。然而,隨著能夠創(chuàng)造視頻并進行近似人類交流的新型
    的頭像 發(fā)表于 05-24 10:04 ?425次閱讀

    進一步解讀英偉 Blackwell 架構、NVlink及GB200 超級芯片

    AI 超級計算和量子計算服務方面的最新進展。 **10.NVIDIA NIM **軟件棧和 OVX 計算系統(tǒng) 推出新的軟件和計算系統(tǒng),加速企業(yè)級 AI 應用的開發(fā)和部署。 英偉
    發(fā)表于 05-13 17:16

    英偉宣布收購Run:ai

    英偉近期宣布收購Run:ai公司,以進一步推動后者的產(chǎn)品路線圖并整合其資源至Nvidia DGX Cloud。雖然具體的收購金額和完成時間尚未對外公布,但這一舉措無疑顯示了英偉
    的頭像 發(fā)表于 05-06 10:34 ?404次閱讀

    基于門控線性網(wǎng)絡(GLN)的高壓縮比無損醫(yī)學圖像壓縮算法

    實現(xiàn)基于門控線性網(wǎng)絡(GLN)的高壓縮比無損醫(yī)學圖像壓縮算法,以提高醫(yī)學圖像存儲和分發(fā)系統(tǒng)的效率。與“傳統(tǒng)”的基于上下文的數(shù)據(jù)壓縮算法相比,
    的頭像 發(fā)表于 04-08 10:29 ?553次閱讀
    基于門控線性網(wǎng)絡(GLN)的<b class='flag-5'>高壓縮</b>比無損醫(yī)學圖像<b class='flag-5'>壓縮</b><b class='flag-5'>算法</b>

    英偉擬將收購AI基礎設施虛擬化初創(chuàng)企業(yè)Run:ai

    據(jù)外媒最新報道,英偉公司正考慮收購一家名為Run:aiAI基礎設施虛擬化初創(chuàng)企業(yè),雙方的交易金額最高可能達到驚人的10億美元。
    的頭像 發(fā)表于 03-22 10:47 ?610次閱讀

    市值最高的半導體公司 英偉市值短暫突破兩萬億美元

    英偉的市值短暫突破2.02萬億美元。是目前市值最高的半導體公司。而且非常多的投資都相信AI熱潮遠未結束;英偉
    的頭像 發(fā)表于 02-24 18:13 ?1076次閱讀

    英偉市值躍居全球第四 文生視頻大模型Sora帶動

    英偉市值躍居全球第四 文生視頻大模型Sora帶動 文生視頻大模型Sora引發(fā)市場關注;OpenAI的首款文生視頻大模型Sora橫空出世帶動
    的頭像 發(fā)表于 02-19 16:48 ?936次閱讀

    【機器視覺】歡創(chuàng)播報 | 英偉拿下全球90%的AI芯片市場

    預計最高可能已經(jīng)達到了90%,創(chuàng)下新高紀錄。在目前的人工智能智能加速芯片市場,英偉的A100/H100系列AI GPU可謂是市場的首選。
    的頭像 發(fā)表于 02-01 11:29 ?647次閱讀

    英偉AI計算的領導者與市場前景展望

    英偉在全球AI芯片市場中的份額一直處于領先地位。有數(shù)據(jù)顯示,英偉在中國AI芯片市場的規(guī)模預計
    的頭像 發(fā)表于 01-10 10:04 ?788次閱讀

    英偉推出新款AI芯片H200 性能飆升90%但是估計依然被出口管制

    大,也是H100的升級版,號稱性能飆升90%;全球最強 AI 芯片。 據(jù)英偉的消息,H200擁有141GB的內存、4.8TB/秒的帶寬,并將與H100相互兼容,推理速度幾乎達到H10
    的頭像 發(fā)表于 11-14 16:45 ?1424次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>推出新款<b class='flag-5'>AI</b>芯片H200 性能飆升<b class='flag-5'>90</b>%但是估計依然被出口管制