0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI換臉的基本原理

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 2023-05-26 14:45 ? 次閱讀

前不久,社交媒體平臺上一款名為“螞蟻呀嘿”的特效火爆全網(wǎng),許多網(wǎng)友都將自己的照片導(dǎo)入換臉軟件Avatarify中,照片便可以被算法驅(qū)動(dòng),生成一段表情夸張扭曲且跟著節(jié)奏晃動(dòng)的換臉短視頻。

魔幻的特效讓這類的視頻迅速侵襲社交平臺,網(wǎng)友驚呼:簡直就像捅了螞蟻窩。

例如:馬云、馬化騰、馬斯克等大佬們,正在集體演唱神曲《螞蟻呀嘿》。

例如,李開復(fù)老師便友情上演了一首《Only You》。

這項(xiàng)技術(shù)可以完成在給定一張?jiān)磮D片和一個(gè)目標(biāo)動(dòng)作視頻,將目標(biāo)視頻的表情和動(dòng)作遷移到源圖片上,使得源圖片中的人物做出目標(biāo)視頻相同的表情動(dòng)作。

Faceswap

這種換臉的算法,其實(shí)有很多。 例如 Faceswap 、DeepFaceLab、Faceswap-GAN 等等。 本文以 star 量最多的 Faceswap 為例,進(jìn)行說明。

4989cfa8-fb83-11ed-90ce-dac502259ad0.jpg

算法原理

Faceswap 是一個(gè)名為 deepfakes 的 Github 用戶開源的項(xiàng)目。 Deepfake 就是“Deep Machine Learning”(深度學(xué)習(xí))和“Fake Photo”(假照片)組合而成的。 早期技術(shù)可以追溯到 2018 年,當(dāng)時(shí)在構(gòu)建模型的時(shí)候使用了 Encoder-Decoder 自編解碼架構(gòu)。 而 Faceswap 算法,在此之上又引入 GAN(生成對抗網(wǎng)絡(luò))技術(shù),顯著提升了換臉的效果。 總體上,「Faceswap」換臉主要分為以下三個(gè)過程:

人臉檢測

特征提取

人臉轉(zhuǎn)換

人臉檢測 想要替換人臉,那首先得找到人臉的位置,這就需要用到人臉檢測算法。

Faceswap 算法采用了 SSD 這類比較成熟的檢測框架,同于提取面部圖像。 與傳統(tǒng)人臉檢測略有不同的,F(xiàn)aceswap 算法需要裁剪的人臉邊界框(bouding box, bbox)是正方形的,同時(shí)還會(huì)適當(dāng)?shù)南蛲鈹U(kuò)充一些,以保證人臉都在 bbox 內(nèi)。 特征提取 檢測到人臉后,需要提取人臉的特征。 首先要做的就是,人臉關(guān)鍵點(diǎn)檢測,也就是 landmark。

這些關(guān)鍵點(diǎn),抽取了人臉的表情特征,同時(shí)大致描述了人臉的器官分布。 我們可以直接通過 dlib 和 OpenCV 等主流的工具包直接提取人臉的關(guān)鍵點(diǎn)。 當(dāng)然,為了取得更好的定位精度,也可以使用 CNN 訓(xùn)練一個(gè)人臉關(guān)鍵點(diǎn)檢測模型,簡單好用。 人臉轉(zhuǎn)換

人臉轉(zhuǎn)換的思想,就是采用編碼器的原理。 簡單來講,就是將人臉圖像壓縮到短向量,再由短向量恢復(fù)到人臉圖像。這些短向量包含了人臉的主要信息,例如該向量的元素可能表示人臉膚色、眉毛位置、眼睛大小等等。

49a4d230-fb83-11ed-90ce-dac502259ad0.png

所以如果我們用某個(gè)編碼器學(xué)習(xí)所有人,那么它就能學(xué)習(xí)到人臉的共性;如果再用某個(gè)解碼器學(xué)習(xí)特定的某個(gè)人,那么就能學(xué)習(xí)到這個(gè)人的特性。 簡單而言,當(dāng)我們用通用編碼器編碼人臉 A,再使用特定解碼器 B 解碼短向量,那么就能生成出擁有 A 的人臉表情,但卻是 B 人臉的圖像。 就好比,你擺出一個(gè)表情,我根據(jù)你睜眼的大小,嘴巴咧開的大小等面部特征,模仿出你的表情。 我們表情一樣,但長相不一樣。 人臉轉(zhuǎn)換,除了自編碼器的方法,還有一種 GAN 方法。 GAN 會(huì)利用提取的人臉特征點(diǎn),使用生成器直接生成對應(yīng)的目標(biāo)人臉圖像,這跟 StyleGAN 人臉生成算法很類似,但不同的是需要生成指定表情的人臉。 在生成的圖片后,會(huì)接一個(gè)判別器,判斷圖片的逼真程度。

49aba772-fb83-11ed-90ce-dac502259ad0.png

上述算法都是針對單張圖片而言的,對于視頻而言,就是多了一個(gè)視頻拆分成圖片,圖片拼接成視頻的過程。 DeepFakes 技術(shù)發(fā)展已久,2020 年有一篇發(fā)表的綜述論文,包含了各種 DeepFakes 算法的概述,想了解更多的讀者,可以去“啃”一下論文了。 論文地址: https://arxiv.org/pdf/2001.00179.pdf 預(yù)處理和后處理 大致思路就是這樣,里面還有很多細(xì)節(jié),我們稱之為 Tricks ,這就需要通過閱讀源碼去學(xué)習(xí)了。 比如,在進(jìn)行提取人臉特征之前,需要進(jìn)行圖像的預(yù)處理。 對數(shù)據(jù)進(jìn)行規(guī)范化(Normalization),使訓(xùn)練的圖像的分布信息盡可能相近:

訓(xùn)練的數(shù)據(jù)集是分為 A 數(shù)據(jù)集和 B 數(shù)據(jù)集的,如上圖,A 數(shù)據(jù)集為川普,B 數(shù)據(jù)集為凱奇。 我們可以將 A 數(shù)據(jù)集(川普)加上兩者數(shù)據(jù)集的平均差值(RGB三通道差值)來使兩個(gè)輸入圖像圖像的分布盡可以相近,這樣我們的損失函數(shù)曲線下降會(huì)更快些。 用代碼表示就是:

images_A+=images_B.mean(axis=(0,1,2))-images_A.mean(axis=(0,1,2))
再比如,換臉之后,需要進(jìn)行圖像的后處理。 為了是生成的人臉效果更加,會(huì)進(jìn)行諸如邊緣融合、色彩均衡等處理方法。 想要了解算法背后的實(shí)現(xiàn)方法,那就得耐著性子看源碼了。

最后我們再簡單解釋一下?lián)Q臉的基本原理:提取兩個(gè)例子,分為A&B,進(jìn)行以下三步:1.人臉偵測和識別。2.確定變換矩陣。3.人臉替換。對于視頻中的每一幀信息重復(fù)以上操作直至結(jié)束即可!

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    4629

    瀏覽量

    87022
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29456

    瀏覽量

    267788
  • 源碼
    +關(guān)注

    關(guān)注

    8

    文章

    630

    瀏覽量

    29082

原文標(biāo)題:帶你揭開AI換臉技術(shù)的原理

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    串聯(lián)諧振逆變器的基本原理

    串聯(lián)諧振通常伴有逆變器。該組合稱為串聯(lián)諧振逆變器。什么是基本原理?讓我簡要介紹串聯(lián)諧振逆變器的一些基本原理。]首先給你看一張圖片:
    發(fā)表于 11-07 10:21

    電機(jī)轉(zhuǎn)動(dòng)的基本原理是什么?

    電機(jī)轉(zhuǎn)動(dòng)的基本原理是什么?電機(jī)運(yùn)動(dòng)的基本原則有哪些?
    發(fā)表于 07-21 07:59

    線性電源的基本原理是什么

    多路線性電源 AC-DC穩(wěn)壓電源 低紋波電源 可調(diào)線性電源 原理圖PCB目錄多路線性電源 AC-DC穩(wěn)壓電源 低紋波電源 可調(diào)線性電源 原理圖PCB基本原理芯片選型原理圖&3D-PCB具體
    發(fā)表于 07-30 07:47

    無線充電的基本原理是什么

    一 、無線充電基本原理無線充電的基本原理就是我們平時(shí)常用的開關(guān)電源原理,區(qū)別在于沒有磁介質(zhì)耦合,那么我們需要利用磁共振的方式提高耦合效率,具體方法是在發(fā)送端和接收端線圈串并聯(lián)電容,是發(fā)送線圈處理諧振
    發(fā)表于 09-15 06:01

    步進(jìn)馬達(dá)基本原理

    步進(jìn)馬達(dá)基本原理步進(jìn)馬達(dá)基本原理步進(jìn)馬達(dá)基本原理
    發(fā)表于 11-30 11:55 ?8次下載

    通過AI特效技術(shù)特效手術(shù)愿望馬上成真共同期待

    高科技版畫皮來了! 看AI黑科技如何顛覆認(rèn)知!因?yàn)?b class='flag-5'>AI的精準(zhǔn)捕捉和實(shí)時(shí)化能力,這場關(guān)于“
    發(fā)表于 07-07 11:00 ?1105次閱讀

    AI正式進(jìn)入禁令

    AI正式進(jìn)入禁令。
    發(fā)表于 07-03 15:49 ?7725次閱讀

    AI或成潘多拉的魔盒

    AI,究竟是黑科技還是技術(shù)濫用
    的頭像 發(fā)表于 08-28 10:19 ?3010次閱讀

    ZAO或?qū)⒉角拜叾堂髩m,“AI”已形成黑色產(chǎn)業(yè)鏈

    8月30日晚,一款主打視頻功能的、名為“ZAO”的APP“點(diǎn)燃”社交網(wǎng)絡(luò)。其操作十分簡單,用戶只需上傳一張照片,用AI功能,就可將照
    的頭像 發(fā)表于 09-02 10:18 ?3389次閱讀

    AI技術(shù)背后的問題

     近日,一款臉軟件刷屏了社交網(wǎng)絡(luò)。通過這款軟件,用戶可實(shí)現(xiàn)與明星,“一鍵”進(jìn)入明星出演的影視片段中,過把戲癮。然而,隨著這款軟件火爆網(wǎng)絡(luò),大家也開始關(guān)注其背后涉及的隱私、肖像權(quán)等相關(guān)問題。
    的頭像 發(fā)表于 09-10 17:05 ?1.5w次閱讀

    AI等技術(shù)引起爭議,已造成新型侵權(quán)不良影響

    2018年以來,一些關(guān)于“AI”的熱點(diǎn)事件和爭議開始逐步發(fā)酵,如2019年引爆網(wǎng)絡(luò)的一款名為“ZAO”的臉軟件。通過人工智能技術(shù),只要用一張自己的照片就能順利替換掉明星的面部,在
    的頭像 發(fā)表于 09-18 16:07 ?2667次閱讀

    AI不斷引來爭議,需要不斷完善

    2018年以來,一些關(guān)于“AI”的熱點(diǎn)事件和爭議開始逐步發(fā)酵,如2019年引爆網(wǎng)絡(luò)的一款名為“ZAO”的臉軟件。通過人工智能技術(shù),只要用一張自己的照片就能順利替換掉明星的面部,在
    的頭像 發(fā)表于 10-20 11:56 ?2377次閱讀

    AI門檻漸低,如何制止走向墮落?

    具備深厚的專業(yè)知識,只要收集到足夠素材,AI就可以完成。Deepfake效果逼真,讓人難以分辨真假,這也引發(fā)了眾多倫理和隱私問題。
    的頭像 發(fā)表于 12-10 14:31 ?1551次閱讀

    一南京女子疑遇AI被騙錢

    近日在南京,一女子疑遇AI被騙3000元,雖然被騙數(shù)額不大,但背后的隱患卻讓人捏了一把汗?,F(xiàn)代快報(bào)記者發(fā)現(xiàn),市面上仍有多款A(yù)pp可輕
    的頭像 發(fā)表于 01-25 11:06 ?2000次閱讀

    AI的新用途,讓人們充滿了正能量

    這兩年一說到ai,因?yàn)榇蠖嘈枰蟼髡掌?不僅因?yàn)橐曨l可能侵權(quán),還涉及人臉隱私收集,幾乎是臭名昭著了。但這款ai情感鬧鐘
    的頭像 發(fā)表于 12-01 15:23 ?4891次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>換</b><b class='flag-5'>臉</b>的新用途,讓人們充滿了正能量