0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌正式推出ARCore 1.7版本,為其添加了前置攝像頭AR自拍能力以及動畫效果支持

jmiy_worldofai ? 來源:lp ? 2019-03-14 15:27 ? 次閱讀

ARCore 是谷歌于去年 2 月份正式推出的 增強現(xiàn)實(AR)軟件開發(fā)工具包,給開發(fā)者提供了一個開發(fā) AR APP 的平臺。不到一個月前,谷歌正式推出ARCore 1.7 版本,為其添加了前置攝像頭 AR 自拍能力以及動畫效果支持;而日前,谷歌又為其引入了機器學習技術,使其實時自拍 AR 的逼真效果更進一步,該技術相關的文章發(fā)布在谷歌 AI 的官方博客上。

增強現(xiàn)實(AR)通過將數(shù)字內容與信息疊加到物質世界的真實場景中,來讓人類實現(xiàn)超越現(xiàn)實的感官體驗。例如,谷歌地圖的 AR 功能,能夠在現(xiàn)實場景中疊加方向信息來為你指路。借助于Pixel 相機中的 Playground 模式,你可以使用 AR 從不同的視角看世界。并且通過借助于最新發(fā)布的「YouTube Stories」以及ARCore 全新的面部增強(Augmented Faces)API,你可以在自拍上添加動畫面具、眼鏡、帽子、皮膚等特效。

實現(xiàn)這種 AR 功能的關鍵挑戰(zhàn)之一,就是以合適的方式將虛擬內容錨定到現(xiàn)實世界:這一過程需要一套能夠追蹤到每一次微笑、皺眉或假笑的高動態(tài)表面幾何結構的獨特的感知技術。

ARCore 的3D 網格以及它能實現(xiàn)的一些特效

為此,我們引入了機器學習(ML)技術來推斷近似的 3D 表面幾何結構,并且僅需要用到一個單攝像頭輸入而無需使用專用的深度傳感器。這種方法利用面向移動 CPU 界面推斷或其可用的全新移動 GPU 功能的TensorFlow Lite,實現(xiàn)了逼真的實時 AR 效果。與「 YouTube Stories」 全新的創(chuàng)作者特效所利用的技術一樣,這項技術已通過最新的 ARCore SDK和ML Kit Face Contour Detection API向廣泛的開發(fā)者社區(qū)開放。

用于自拍 AR 的機器學習工作流

我們的機器學習工作流由兩個協(xié)同工作的實時深度神經網絡模型組成:一個是探測器,它在整張圖像上運行并計算出面部位置;另一個是通用的 3D 網格模型,它在探測器計算出來的面部位置上運行,并通過回歸預測近似的表面幾何結構。精確地裁剪面部能夠極大地減少對一般的數(shù)據增強的要求,例如由旋轉、平移和比例變換組成的仿射變換(affine transformations)等,同時讓網絡將大部分性能投入于預測坐標來提高其準確性——這對于錨定合適的虛擬內容至關重要。

裁剪完所關注的位置后,該網格網絡一次僅應用于一個單幀,并利用加窗平滑(windowed smoothing)來減少面部處于靜態(tài)時的噪音,同時避免在大幅移動期間出現(xiàn)的延遲。

針對 3D 網格,我們采用了遷移學習,并訓練了一個具有多個目標的網絡:該網絡能夠同時地基于合成、渲染的數(shù)據預測 3D 網格坐標以及基于類似于MLKit所提供的帶有注釋的、現(xiàn)實世界的數(shù)據預測 2D 語義輪廓。最終的網絡為我們提供了基于合成數(shù)據乃至現(xiàn)實世界數(shù)據的合理的 3D 網格預測。所有模型都在源自于地理學多樣化的數(shù)據集的數(shù)據上進行訓練,并接著在平衡、多樣化的測試集上進行定性和定量性能的測試。

3D 網格網絡接收經裁剪的視頻幀作為輸入。由于它不依賴于額外的深度輸入,因而也可以應用于預先錄制的視頻。該模型不僅輸出 3D 點的位置,還輸出在輸入中存在并合理對齊的面部概率。一種常見的替代方法就是為每個地標預測出 2D 熱圖,但這種方法并不適用于深度預測,并且對于如此多的數(shù)據點來說,使用這種方法耗費的計算成本非常高。

通過迭代自展和精煉預測,我們進一步提高了模型的準確性和魯棒性,同時也將數(shù)據集發(fā)展成為愈加具有挑戰(zhàn)性的實例,如鬼臉,拍攝角度傾斜以及面部遮擋等。此外,數(shù)據集增強技術也擴展了可用的 ground truth 數(shù)據,并開發(fā)出了對攝像頭瑕疵等人工產品問題或極端光照條件具有彈力的模型。

數(shù)據集擴展和改善路徑

專為硬件定制的界面

我們使用 TensorFlow Lite 進行設備內置的神經網絡推理。新推出的 GPU 后端加速能夠有效提升性能,并顯著降低功耗。此外,我們還設計了具有不同性能和效率特性的一系列模型架構,來覆蓋到更加廣泛的消費級硬件。較簡單網絡之間的最重要的區(qū)別就在于殘差塊(Residual Block)設計和可接受的輸入分辨率(最簡單模型中的輸入分辨率為 128×128 像素,而最復雜模型中的輸入分辨率為 256×256)。同時,我們還改變了層數(shù)以及子采樣率(輸入分辨率隨網絡深度的減少而減少的速度)。

每一幀的推斷時間:CPU vs. GPU

這一系列的優(yōu)化的結果就是:使用更簡單的模型帶來了實質性的加速,同時也將 AR 特效質量的降低幅度最小化。

這些成果最終則能夠通過以下方式,讓用戶在 YouTube、ARCore 以及其他客戶端體驗到更加逼真的自拍 AR 效果:

通過環(huán)境映射模擬光反射,來實現(xiàn)眼鏡的逼真渲染;

通過將虛擬的目標陰影投射到面部網格上,來實現(xiàn)了自然光照效果;

對面部遮擋進行建模,來隱藏面部后面的虛擬目標部分,如下所示的虛擬眼鏡案例。

另外,我們還通過以下方式實現(xiàn)了逼真的妝容效果:

對應用到嘴唇上的鏡面反射進行建模;

利用亮度感知材料來實現(xiàn)面部著色。

案例對比:5 個目標在不同光線下的真實化妝效果以及 AR 化妝效果

我們很高興將這項新技術分享給創(chuàng)作者、用戶以及開發(fā)者。感興趣的讀者可以通過下載最新的 ARCore SDK (下載地址:https://developers.googleblog.com/2019/02/new-ui-tools-and-richer-creative-canvas.html)來將這項技術用起來。未來,我們還計劃將這項技術廣泛應用到更多的谷歌產品線中。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 探測器
    +關注

    關注

    14

    文章

    2596

    瀏覽量

    72803
  • 神經網絡
    +關注

    關注

    42

    文章

    4726

    瀏覽量

    100327
  • 機器學習
    +關注

    關注

    66

    文章

    8325

    瀏覽量

    132201

原文標題:通過引入 ML,谷歌 ARCore 實時自拍 AR 的逼真效果更進一步

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    谷歌推出用于自拍攝像頭的防臉部失真算法

    在人工智能領域,雖然今年在市場落地方面中外企業(yè)進步不同,但是谷歌、微軟等巨頭在具體算法研究上依然處于領先地位。谷歌研究人員成功開發(fā)了用于自拍攝像頭的防臉部失真算法,這項研究成果對于社交媒體等企業(yè)大有裨益。
    發(fā)表于 06-18 08:54 ?721次閱讀

    ESM6802支持Qt攝像頭應用

    版本。使用Qt的multimedia模塊可以方便快捷的進行攝像頭應用的開發(fā),本文使用Qt源碼中提供的camera例程進行展示,例程代碼可從Qt源碼中獲取或者向我們工程師索要?! ∥覀兪褂玫?b class='flag-5'>攝像頭
    發(fā)表于 10-20 10:33

    如何快速 MCU 添加人臉識別攝像頭

    - 1000 的十進制數(shù)表示。攝像頭支持圖像輸出功能,主要用于開發(fā)人員設置攝像頭和對準方向時的調試輔助。它的分辨率 320 x 240,還不足以用作安防監(jiān)視器。如果需要流媒體視頻,
    發(fā)表于 08-01 10:10

    谷歌將通過CNET在Motion Stills應用程序中增加對AR貼紙的支持

    谷歌的研究博客今天宣布,它將通過CNET在Motion Stills應用程序中增加對AR貼紙的支持。 該功能于去年晚些時候首次在谷歌Pixel 2手機上
    的頭像 發(fā)表于 02-08 11:19 ?2996次閱讀

    Scope AR通過谷歌ARCore功能,將Remote AR進一步應用到移動AR領域

    Scope AR通過利用谷歌最近發(fā)布的ARCore功能,決定將其遠程協(xié)助企業(yè)應用程序Remote AR進一步應用到移動AR領域。 雖然之前
    發(fā)表于 05-16 10:14 ?1718次閱讀

    谷歌推出支持多人AR體驗的ARcore

    AR云基于ARCore的運動跟蹤功能,簡單來說,通過尋找虛擬物體的特殊點并創(chuàng)建稀疏點云來起作用。
    的頭像 發(fā)表于 05-16 15:42 ?4369次閱讀

    三星Galaxy S10 Plus曝光將有前置攝像頭和后置四攝像頭

    這表明三星將在新旗艦手機的Super AMOLED屏幕上面開一個孔,里面塞入前置攝像頭,而手機背部至少有三顆水平設計的攝像頭。其中三星Galaxy S10 Plus有前置
    發(fā)表于 12-13 08:59 ?1946次閱讀

    小米MIX3前置攝像頭超越華為Mate20

    DxOMark昨天公布了手機前置攝像頭自拍排行榜,排在前三位的是谷歌Pixel3、三星Galaxy Note9、小米MIX3,如果放在中國手機廠商里面,小米的MIX3則是成為
    的頭像 發(fā)表于 01-30 16:25 ?5175次閱讀
    小米MIX3<b class='flag-5'>前置</b><b class='flag-5'>攝像頭</b>超越華為Mate20

    全面屏時代,如何解決前置攝像頭的問題?

    在劉海屏時代,前置攝像頭和聽筒安放在劉海中;在水滴屏時代,隱藏式聽筒的出現(xiàn),讓水滴僅需要容納前置攝像頭,而在全面屏時代,如何解決前置
    的頭像 發(fā)表于 08-04 09:55 ?5793次閱讀

    谷歌推出ARCore Depth API 可以使AR游戲體驗更加自然

    谷歌的開發(fā)者平臺ARCore推出一款稱為Depth API的新工具,該工具可以讓開發(fā)者使用谷歌的動態(tài)深度算法和一個RGB攝像頭來制作深度地圖
    發(fā)表于 12-11 10:25 ?1108次閱讀

    谷歌ARCore的Depth API用單個攝像頭能創(chuàng)建深度圖

    Android增強現(xiàn)實(AR)取得重大進步,近日谷歌正在為開發(fā)工具包ARCore添加Depth API,這項新功能僅用單個攝像頭就可以創(chuàng)建深
    的頭像 發(fā)表于 12-11 16:21 ?3762次閱讀

    手機攝像頭結構性能分析以及測試方案的介紹

    手機攝像頭結構由前置攝像頭和后置攝像頭組成。 前置攝像頭目前主要以在手機屏幕打孔的形式呈現(xiàn),有利
    發(fā)表于 11-04 16:39 ?2124次閱讀

    升級!谷歌將利用手機的雙攝像頭來提升 AR 性能

    據外媒 AndroidPolice 報道,谷歌即將利用手機的雙攝像頭來提升 AR 性能。
    發(fā)表于 03-03 18:18 ?1007次閱讀

    淺談ADAS前置攝像頭設計挑戰(zhàn)

    前置攝像頭是高級駕駛輔助系統(tǒng) (ADAS) 的重要組件,尤其是鑒于現(xiàn)在的新車碰撞測試要求將自動緊急制動和正面防撞作為汽車的標準功能。前置攝像頭有助于實現(xiàn)其他 ADAS 功能,例如自適應
    的頭像 發(fā)表于 12-14 15:57 ?626次閱讀
    淺談ADAS<b class='flag-5'>前置</b><b class='flag-5'>攝像頭</b>設計挑戰(zhàn)

    用usb攝像頭替換手機前置攝像頭可以嗎

    隨著科技的進步和智能手機的普及,攝影已經成為了我們日常生活中不可或缺的一部分。然而,有時我們可能會對手機自帶的前置攝像頭的拍攝效果感到不滿意。那是否可以考慮用USB攝像頭替代手機
    的頭像 發(fā)表于 01-08 14:11 ?1951次閱讀