0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Pix2Pix與Unity 3D結(jié)合,打造專屬小貓咪!

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-10-04 09:19 ? 次閱讀

圖像翻譯已然不是一件新鮮的事情了,但最近博主Keijiro Takahashi不僅實(shí)時(shí)的完成了這個(gè)圖像生成任務(wù),而且還將它“貼”到了3D模型上,打造了一只生動(dòng)可愛的“專屬小貓咪”!

看!這貨竟然比神筆馬良還要厲害!

隨著GAN、pix2pix等技術(shù)的提出,圖像翻譯已然不是一件稀奇的事情。但實(shí)時(shí)且3D的圖像翻譯,卻算的上是喜聞樂見了。

作者Keijiro Takahashi歷經(jīng)半個(gè)月的時(shí)間,終于“翻譯”出了這只活靈活現(xiàn)的3D小喵咪:

專屬貓咪,你值得擁有!

其實(shí),搞出來個(gè)這樣的喵咪并不難。

首先,用Sketch Pad畫一個(gè)貓!

類似于非常出名的edges2cats,Sketch Pad也是一種演示方法,但它還是實(shí)時(shí)的。

其次,需要一些系統(tǒng)的要求:

Unity 2018.1

計(jì)算著色器功能(DX11,Metal,Vulkan等)

盡管它是以平臺(tái)無關(guān)的方式實(shí)現(xiàn)的,但它的許多部分都針對(duì)NVIDIA GPU體系結(jié)構(gòu)進(jìn)行了優(yōu)化。

為了完美地運(yùn)行Sketch Pad,作者建議使用GeForce GTX 1070或更高版本的Windows系統(tǒng)。

那么,如何使用訓(xùn)練過的模型呢?

這個(gè)存儲(chǔ)庫(kù)不包含任何用來節(jié)省帶寬和存儲(chǔ)配額且經(jīng)過訓(xùn)練的模型。

要在Unity Editor上運(yùn)行示例項(xiàng)目,需下載預(yù)先訓(xùn)練好的edges2cats模型,并將其復(fù)制到Assets/StreamingAssets中。

該實(shí)現(xiàn)只支持在Christopher Hesse交互演示中使用的.pict權(quán)重?cái)?shù)據(jù)格式。你可以選擇一個(gè)預(yù)先訓(xùn)練好的模型或者使用pix2pix-tensorflow來訓(xùn)練你自己的模型。

經(jīng)典Pix2pix

Pix2pix 是一個(gè)不同圖像效果的轉(zhuǎn)換工具,基于GAN實(shí)現(xiàn)。Pix2pix由UC Berkeley的Phillip Isola等人提出,論文最早在2016年11月在arxiv上公開,并被CVPR 2017錄取。雖然是比較老的論文,但作為一篇很經(jīng)典的論文,非常值得一讀,因此我們也在這里介紹一下Pix2pix的方法。

論文研究了條件對(duì)抗網(wǎng)絡(luò)作為一種圖像到圖像轉(zhuǎn)換問題的通用解決方案。這些網(wǎng)絡(luò)不僅學(xué)習(xí)從輸入圖像到輸出圖像的映射,還學(xué)習(xí)了用于訓(xùn)練該映射的損失函數(shù)。這使得對(duì)傳統(tǒng)上需要非常不同的損失公式的問題應(yīng)用相同的通用方法成為可能。

研究人員證明了這種方法在從標(biāo)簽地圖合成照片,從邊緣地圖重建對(duì)象,以及給黑白圖像上色等任務(wù)中都是有效的。這項(xiàng)工作表明我們可以在不需要手工設(shè)計(jì)損失函數(shù)的情況下獲得合理的結(jié)果。

圖1:有條件的對(duì)抗性網(wǎng)絡(luò)是一種通用的解決方案,似乎可以很好地解決各種各樣的問題。這里我們展示幾種方法的結(jié)果。在每種情況下都使用相同的架構(gòu)和目標(biāo),只是簡(jiǎn)單地在不同的數(shù)據(jù)上訓(xùn)練。

在一些任務(wù)中,可以相當(dāng)快地在小數(shù)據(jù)集中獲得不錯(cuò)的結(jié)果。例如,為了學(xué)習(xí)生成外墻(如上圖所示),我們僅花了大約2小時(shí)訓(xùn)練了400張圖像(用一個(gè)Pascal Titan X GPU)。然而,對(duì)于更困難的問題,在更大的數(shù)據(jù)集上進(jìn)行訓(xùn)練可能是很重要的,而且需要花費(fèi)很多小時(shí)甚至數(shù)天的時(shí)間。

既然是基于GAN的,那么Pix2pix也離不開生成器和判別器。

GAN是生成模型,它學(xué)習(xí)從隨機(jī)噪聲向量z映射到輸出圖像y,即:G : z → y。

相比之下,條件GAN是從觀察到的圖像x和隨機(jī)噪聲向量z,學(xué)習(xí)它們與y的映射,即:G : {x, z} → y。

生成器G是訓(xùn)練來產(chǎn)生輸出的,目的是讓這些輸出不被對(duì)抗訓(xùn)練的鑒別器D將其與“真實(shí)”圖像區(qū)分開來;同時(shí),鑒別器D被訓(xùn)練來盡可能地檢測(cè)到生成器的“假”輸出。訓(xùn)練過程如下圖所示:

訓(xùn)練一個(gè)從map edges到photo的條件GAN

網(wǎng)絡(luò)架構(gòu)

這里采用了深度卷積生成對(duì)抗網(wǎng)絡(luò)DCGAN中的生成器和鑒別器的結(jié)構(gòu)進(jìn)行調(diào)整。生成器和鑒別器都采用了convolution-BatchNorm-ReLu的模塊。

生成器架構(gòu)的兩種選擇?!癠-Net”是編碼器 - 解碼器,在編碼器和解碼器堆棧中的鏡像層之間有跳過連接(skip connection)。

有關(guān)Pix2pix結(jié)構(gòu)的更多細(xì)節(jié),請(qǐng)閱讀原論文:

https://arxiv.org/pdf/1611.07004.pdf

Pix2pix最著名的應(yīng)用是“畫貓”,edges2cats便是基于pix2pix-tensorflow的一個(gè)實(shí)現(xiàn),請(qǐng)看效果:

而今天我們介紹的Pix2Pix for Unity更是腦洞大開,在3D模型之上“畫貓”,讓生成的貓咪動(dòng)了起來。程序員擼貓還真是方便呢!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2843

    瀏覽量

    107208
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1900

    瀏覽量

    72409
  • 圖像生成
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    6878
  • Unity
    +關(guān)注

    關(guān)注

    1

    文章

    127

    瀏覽量

    21744

原文標(biāo)題:pix2pix 3D版:幾筆線條生成超炫貓咪霹靂舞!

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Unity 3D和Vuforia制作AR人物互動(dòng)

    (vuforia-unity-android-ios-2-6-7.unitypackage文件)打開,導(dǎo)入到Unity 3D里。于是在Project欄里應(yīng)該能看到一堆東西。接著到Assets/Qualcomm
    發(fā)表于 09-21 10:30

    Grid與nvidia 3d視覺2可以結(jié)合使用嗎?

    嗨,我的組織目前正在使用Z640工作站(使用Quadro k4200圖形)。我們將3D與NVIDIA 3D VISION 2結(jié)合使用。我們正在考慮轉(zhuǎn)換為GRID。我們可以將
    發(fā)表于 09-26 15:23

    未來微信群借助AI工作會(huì)是什么樣子?

    1.我們經(jīng)常在微信上工作,我想以后的工作文檔可以自動(dòng)保存2.保存之后我還想要就能直接找到這里的要,可能是借助AI的查詢了,例如:“最近三天上傳的關(guān)于小貓咪的照片”小貓咪可以是文件名稱或者圖片里面有
    發(fā)表于 12-06 20:18

    PIX4flow使用記錄 精選資料分享

    想通過I2C直接讀取pix4flow的數(shù)據(jù),結(jié)果不好使,找原因。 找到官網(wǎng)https://pixhawk.org/modules/px4flow#i2c和http://www.pixhawk.com
    發(fā)表于 08-09 06:03

    基于PIX模塊化的底盤架構(gòu)

    基于 PIX “柔性化的生產(chǎn)線、數(shù)字制造能力、模塊化的底盤架構(gòu)”,可以為我們量身打造專屬的線控底盤,所以我們選擇了PIX?!轄栔悄苡嘘P(guān)負(fù)責(zé)人從2020年4月
    發(fā)表于 08-26 08:51

    怎樣通過I2C去直接讀取PIX4FLOW的數(shù)據(jù)呢

    PIX4FLOW返回有哪幾種數(shù)據(jù)幀呢?怎樣通過I2C去直接讀取PIX4FLOW的數(shù)據(jù)呢?
    發(fā)表于 11-12 06:00

    會(huì)眨眼的小貓咪電路圖

    會(huì)眨眼的小貓咪電路圖 T1與外圍元件組成模擬貓的音頻振蕩電路。
    發(fā)表于 11-18 18:16 ?1254次閱讀
    會(huì)眨眼的<b class='flag-5'>小貓咪</b>電路圖

    如何配置Cisco PIX防火墻

    如何配置Cisco PIX防火墻 在配置PIX防火墻之前,先來介紹一下防火墻的物理特性。防火墻通常具有至少3個(gè)接口,但許多早期的防火墻只具有
    發(fā)表于 01-13 13:26 ?578次閱讀

    Aptina DR-Pix技術(shù)白皮書

    Aptina DR-Pix技術(shù)白皮書
    發(fā)表于 01-19 21:15 ?15次下載

    PIX自動(dòng)駕駛與導(dǎo)航科技企業(yè)Fixposition達(dá)成戰(zhàn)略合作

    ? 2月25日,PIX 自動(dòng)駕駛與瑞士導(dǎo)航科技企業(yè)Fixposition 達(dá)成戰(zhàn)略合作。此次合作旨在加速無人駕駛技術(shù)在更加多樣化和復(fù)雜的環(huán)境中落地,并促進(jìn)向物流,農(nóng)業(yè)和建筑等其它行業(yè)領(lǐng)域的探索與開發(fā)
    的頭像 發(fā)表于 03-05 10:34 ?1806次閱讀

    Unity 3D引擎制作的憤怒的小鳥游戲

    Unity 3D引擎制作的憤怒的小鳥游戲
    發(fā)表于 05-12 09:37 ?2次下載

    PIX飛控電調(diào)校準(zhǔn)技術(shù)及其教程

    PIX飛控電調(diào)校準(zhǔn)技術(shù)及其教程
    發(fā)表于 07-13 09:25 ?9次下載

    適用于PIX或APM的本地升級(jí)固件方法

    適用于PIX或APM的本地升級(jí)固件方法,首先打開 http://firmware.diydrones.com/ 3DR 的固件服務(wù)器。 然后選擇適合自己的固件 如多旋翼固件
    發(fā)表于 08-20 16:34 ?0次下載

    無人機(jī)PIX固件分享

    無人機(jī)PIX固件分享
    發(fā)表于 09-09 15:59 ?0次下載

    Pix a Sketch LED矩陣上的虛擬蝕刻草圖

    電子發(fā)燒友網(wǎng)站提供《Pix a Sketch LED矩陣上的虛擬蝕刻草圖.zip》資料免費(fèi)下載
    發(fā)表于 11-10 09:36 ?0次下載
    <b class='flag-5'>Pix</b> a Sketch LED矩陣上的虛擬蝕刻草圖