0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

像在word里一樣便捷地編輯圖像中的文字

nlfO_thejiangme ? 來(lái)源:lp ? 2019-03-08 09:38 ? 次閱讀

你想像編輯word文本一樣便捷地編輯照片中的文字嗎?像這樣:

和這樣:

讓別人感覺(jué)不到任何人為編輯的跡象:

近日來(lái)自印度的研究人員們近日提出了一種基于自編碼模型的字符替換方法,通過(guò)字符生成、顏色調(diào)節(jié)和重置完成對(duì)圖像中目標(biāo)文字的修改,并且能生成十分自然的圖像,圖像中被編輯過(guò)的文字毫無(wú)違和感。圖片上的文字信息對(duì)于我們理解圖片十分重要。字符的缺失和改變有的時(shí)候會(huì)嚴(yán)重的影響我們對(duì)于圖像內(nèi)涵的理解。除了會(huì)造成忍俊不禁的錯(cuò)別字,有時(shí)候還會(huì)讓人們誤解造成嚴(yán)重的損失!

另一方面,對(duì)于不同視角、環(huán)境下得到字符缺失的圖片,如何進(jìn)行有效的編輯和修復(fù)也是視覺(jué)領(lǐng)域一個(gè)重要的問(wèn)題,甚至對(duì)于古文獻(xiàn)修復(fù)和案件偵破都有著重要意義。

像編輯文本一樣編輯圖像中的文字

如果我們能夠像文本編輯器一樣編輯圖像中的文字就好了。先前的人員提出過(guò)基于字符幾何特征的合成方法,但卻缺乏泛化性。但隨著深度學(xué)習(xí)的發(fā)展,研究人員提出了利用GAN來(lái)進(jìn)行字符生成,但基于GAN生成字符進(jìn)行編輯的方法也需要面臨一系列問(wèn)題。首先基于GAN的生成需要對(duì)目標(biāo)字符進(jìn)行精確的識(shí)別,但字符識(shí)別本身就是一個(gè)復(fù)雜的問(wèn)題,任何誤差都會(huì)在整個(gè)過(guò)程積累十分有可能造成字符編輯的錯(cuò)誤;其次,字符在同一張圖像內(nèi)具有多種字體類型,GAN模型需要對(duì)字體進(jìn)行多次觀察,并在生成前對(duì)字符進(jìn)行較為嚴(yán)格的字體去失真過(guò)程,這對(duì)于不同情況下的字符編輯來(lái)說(shuō)十分復(fù)雜。

所以研究人員聚焦字符級(jí)別的生成模型,來(lái)代替單詞級(jí)別的生成模型最大化模型的靈活性和適應(yīng)性。那么為了編輯圖像中的文字,怎樣才能又快又好呢?你需要四個(gè)步驟:定位到你要修改的字符、生成目標(biāo)字符、調(diào)整目標(biāo)字符的顏色、將字符融合回圖像中去。這一工作的核心在于解決如何生成具有相同字體的目標(biāo)字符,并為它賦予原字符相同的顏色風(fēng)格。為此,研究人員提出了下圖所示的FANet和ColorNet聯(lián)合完成。

首先選取需要修改的字符,并利用算法將原字符轉(zhuǎn)變?yōu)槎祱D像輸入網(wǎng)絡(luò)。FANet首先通過(guò)一個(gè)三層卷積和兩次全連接將輸入字符編碼到512長(zhǎng)度的向量上,其中包含了字體的風(fēng)格信息。此外,目標(biāo)字符的編碼通過(guò)26個(gè)字符的獨(dú)熱編碼轉(zhuǎn)換到512維的編碼上與先前得到的輸入字符圖像編碼拼接得到1024維的隱空間編碼。隨后利用兩個(gè)全連接和三次上采樣最終得到與原字符相同風(fēng)格的目標(biāo)字符。但這時(shí)候的字符還沒(méi)有顏色。那么就把原字符的顏色信息拿過(guò)來(lái),繼續(xù)進(jìn)行處理。通過(guò)編碼器解碼器的結(jié)構(gòu),將原字符上的顏色信息遷移到了新字符上。最后對(duì)原圖的對(duì)應(yīng)區(qū)域進(jìn)行背景去除,區(qū)域連續(xù)性處理,將得到的新字符放到合適的位置就可以得到修改后的圖片了!來(lái)看看效果~~

這本jave書(shū)有點(diǎn)厲害!

看到這些圖,你可能會(huì)覺(jué)得這些路標(biāo)好像和上次看到的不一樣了!

為了訓(xùn)練這個(gè)網(wǎng)絡(luò),研究人員們利用了谷歌字符庫(kù)中的1000中字體,其中訓(xùn)練集中包含了67.6萬(wàn)個(gè)數(shù)據(jù),驗(yàn)證集則有20.2萬(wàn)個(gè)數(shù)據(jù)。

最終的網(wǎng)絡(luò)不僅可以編輯字符,同時(shí)還能由輸入的單一字符生成出全部26個(gè)字母的新字體,下圖中的的字體都是由一個(gè)輸入字符生成出來(lái)的。

同樣顏色也可以遷移,下圖中的第二行表示輸入字符的顏色,第三行就是將第二行的顏色遷移到第一行字符的結(jié)果。

中文字符

那么按道理,我們也可以開(kāi)心的編輯照片中的漢字了。華中科技大學(xué)和曠視去年就提出了一篇可以生成各種風(fēng)格漢字書(shū)法的工作,利用生成器和判別器實(shí)現(xiàn)了中文書(shū)法字符的合成。

這是文章中的網(wǎng)絡(luò)結(jié)構(gòu):

和最后得到的結(jié)果:

我們可以基于同樣的思路將圖像中的中文字符也進(jìn)行轉(zhuǎn)換,把照片中的漢字都變成優(yōu)秀的書(shū)法作品啦。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • word
    +關(guān)注

    關(guān)注

    1

    文章

    78

    瀏覽量

    21879
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1078

    瀏覽量

    40346
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    920

    瀏覽量

    54711

原文標(biāo)題:如何如文本般順滑來(lái)編輯照片中的文字?

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門(mén)創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Word文字錄入技巧

    Word文字錄入技巧1.1.1  疊字輕松輸入在漢字中經(jīng)常遇到重疊字,比如“爸爸”、“媽媽”“歡歡喜喜”等,在Word輸入時(shí)除了利用輸入法自帶的功能快速輸入外,還有沒(méi)有其
    發(fā)表于 03-10 17:51

    word按空格自動(dòng)刪除后面的文字

    養(yǎng)成碰到問(wèn)題及時(shí)解決的習(xí)慣。原因分析:可能是不小心碰到Insert鍵了,按了這個(gè)鍵就會(huì)把平常WORD輸入文字時(shí)的插入狀態(tài)變成改寫(xiě)狀態(tài)了,在改寫(xiě)狀態(tài)下,你每輸入個(gè)字符,就會(huì)自動(dòng)把插入
    發(fā)表于 01-05 23:27

    pdf文件文字怎么進(jìn)行編輯

    文件文字怎么編輯,發(fā)現(xiàn)百度出來(lái)的步驟好多,覺(jué)著好麻煩。所以又去百度有什么pdf編輯器可以簡(jiǎn)單操作修改pdf文件今天小編就把我知道的款好
    發(fā)表于 07-10 10:29

    在Labview Communication Design System Suite如何創(chuàng)建屬性節(jié)點(diǎn),就像在labview右鍵創(chuàng)建屬性節(jié)點(diǎn)一樣?

    在Labview Communication Design System Suite如何創(chuàng)建屬性節(jié)點(diǎn),就像在labview右鍵創(chuàng)建屬性節(jié)點(diǎn)一樣
    發(fā)表于 02-03 14:40

    請(qǐng)問(wèn)怎么將WORD文字復(fù)制到虛擬機(jī)Linux的VI編輯?

    如何將WORD文字復(fù)制到虛擬機(jī)Linux的VI編輯
    發(fā)表于 03-27 07:45

    如何實(shí)現(xiàn)圖片轉(zhuǎn)Word文檔

    脫軌了,現(xiàn)在有個(gè)圖片轉(zhuǎn)word便捷方法,可以輕松幫你提取圖片中的文字信息,快來(lái)試試吧!使用工具:迅捷OCR文字識(shí)別工具;操作方法:第二步:
    發(fā)表于 04-19 15:05

    CAD圖紙的CAD文字復(fù)制到Word文檔變成了黑色框怎么辦?

    我們?cè)谑褂煤瞥紺AD制圖軟件繪制完成圖紙后,有些時(shí)候?qū)AD圖形復(fù)制到Word文檔后部分CAD文字出現(xiàn)了問(wèn)題,這個(gè)時(shí)候該怎么解決呢?接下來(lái)給大家介紹下問(wèn)題產(chǎn)生的原因以及解決方法吧!
    發(fā)表于 01-20 11:00

    有哪幾種辦法可實(shí)現(xiàn)單片機(jī)像在pc終端一樣打印log呢

    有哪幾種辦法可實(shí)現(xiàn)單片機(jī)像在pc終端一樣打印log呢?stm32實(shí)現(xiàn)printf打印log的辦法有哪些呢?
    發(fā)表于 12-01 06:39

    請(qǐng)問(wèn)在emwin TEXT控件文字可以更改嗎?

    請(qǐng)問(wèn)在 emwinTEXT控件文字可以更改嗎?如果字體不一樣,修改了字體,能不能改?謝謝
    發(fā)表于 11-06 08:22

    如何在Word怎么畫(huà)電路圖?

    如何在Word怎么畫(huà)電路圖? 編制物理試卷時(shí),很多人認(rèn)為用Word畫(huà)圖困難,喜歡用windows自帶的畫(huà)圖程序畫(huà)圖,或
    發(fā)表于 12-26 10:24 ?1.2w次閱讀
    如何在<b class='flag-5'>Word</b><b class='flag-5'>中</b>怎么<b class='flag-5'>樣</b>畫(huà)電路圖?

    年成為Emacs高手,像神一樣使用編輯

    年成為Emacs高手,像神一樣使用編輯
    發(fā)表于 10-29 11:03 ?8次下載
    <b class='flag-5'>一</b>年成為Emacs高手,像神<b class='flag-5'>一樣</b>使用<b class='flag-5'>編輯</b>器

    微軟計(jì)劃研究盲人VR導(dǎo)航系統(tǒng),讓盲人可以像在真實(shí)世界一樣行走

    VR主要還是種針對(duì)視覺(jué)上“欺騙”的技術(shù),相對(duì)而言視障人士來(lái)說(shuō)就有點(diǎn)難以領(lǐng)略VR的魅力。微軟個(gè)最新的研究項(xiàng)目能讓盲人以現(xiàn)實(shí)世界的導(dǎo)航方式在VR世界中進(jìn)行導(dǎo)航,盲人可以在VR環(huán)境像在
    發(fā)表于 08-02 14:18 ?2468次閱讀

    怎樣簡(jiǎn)單識(shí)別圖片文字轉(zhuǎn)換到Word

      工作我們經(jīng)常會(huì)處理到各種各樣的圖片文件,有時(shí)候還需要將圖片文件上的信息整理到Word類的文檔,這樣編輯起來(lái)就很方便,那怎樣簡(jiǎn)單識(shí)別
    發(fā)表于 03-27 13:50 ?827次閱讀

    如何解決MathType公式與文字錯(cuò)位的詳細(xì)資料說(shuō)明

    按鈕、在word 文檔設(shè)置。本文將詳解這三種方法的具體運(yùn)用,幫您徹底解決MathType 公式與文字錯(cuò)位的問(wèn)題。
    發(fā)表于 05-30 17:26 ?4次下載
    如何解決MathType<b class='flag-5'>中</b>公式與<b class='flag-5'>文字</b>錯(cuò)位的詳細(xì)資料說(shuō)明

    Office Word新功能“微軟編輯器”:檢查并修正語(yǔ)法錯(cuò)誤

    )和機(jī)器學(xué)習(xí)技術(shù),當(dāng)用戶使用Word或者Outlook等微軟產(chǎn)品時(shí),它能夠?qū)崟r(shí)發(fā)現(xiàn)拼寫(xiě)和語(yǔ)法錯(cuò)誤。在升級(jí)Word之后,你就可以在微軟Word打開(kāi)你的文檔,免費(fèi)的
    的頭像 發(fā)表于 12-24 17:26 ?2768次閱讀