0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像處理技術(shù)面臨哪些挑戰(zhàn)?

QQ475400555 ? 來源:機器視覺沙龍 ? 2023-01-13 15:14 ? 次閱讀

當(dāng)人類觀看圖像時,會感知物體、人物或景觀。當(dāng)機器“查看”圖像時,他們看到的只是代表單個像素的數(shù)字。假設(shè)一個灰度圖像,每個像素由一個通常在0到255之間的數(shù)字表示,其中0表示黑色(無顏色),255表示白色(全強度)。0到255之間的任何一個都是灰色陰影,如下圖所示。

b951f244-7b80-11ed-8abf-dac502259ad0.png

因此,對于任何要獲取圖像內(nèi)容的機器來說,它必須以某種方式處理這些數(shù)字。

數(shù)據(jù)量大

正如上面所說,當(dāng)涉及到圖像時,計算機得到的是很多數(shù)字,意味著需要大量的處理才能被理解。舉一個例子來說明圖像的數(shù)據(jù)量究竟有多大。如果是具有1920x1080分辨率的灰度(黑白)圖像,則表示該圖像由200萬個數(shù)字(1920*1080=2073600像素)描述,如果切換到彩色圖像,則一般需要三倍的數(shù)字。如果試圖分析來自視頻/攝像機流的圖像,假設(shè)幀率為30幀/秒(標(biāo)準(zhǔn)幀率),則每秒需要處理1.8億個數(shù)字(3*2073600*30=1.8億像素)。即使如今我們擁有強大的處理器和相對較大的內(nèi)存,也是一個巨大的挑戰(zhàn)。更何況如今幾千萬甚至上億像素的Sensor越來越普及,且其幀率更是高達上百幀/秒。

信息丟失

數(shù)字化過程中的信息丟失是造成計算機視覺難度的另一個主要因素。圖像處理的本質(zhì)是從3D世界(如果處理視頻流中的數(shù)據(jù)則是4D)投影到2D平面(即平面圖像)上獲取信息。這意味著在此過程中會丟失大量信息。人類的大腦可以非常出色的推斷出丟失的數(shù)據(jù)是什么,但是對于計算機來說卻是極其困難的挑戰(zhàn)。下圖顯示的是一個凌亂的房間。

人類可以很容易地看出,綠色健身球比桌子上的黑色平底鍋更大更遠。但是如果黑色平底鍋比綠色球占據(jù)更多的像素,機器應(yīng)該如何推斷呢?這不是一件容易的事。當(dāng)然,可以嘗試通過同時拍攝兩張照片并從中提取3D信息來模擬用兩只眼睛看到的方式,這被稱為立體視覺。然而,將圖像拼接在一起也不是一項微不足道的任務(wù),因為同樣是一個開放的研究領(lǐng)域。

伴隨噪聲

數(shù)字化過程中經(jīng)常伴隨著噪音。例如,沒有相機會拍攝出一個完美的不含噪聲的現(xiàn)實圖片,特別是當(dāng)用手機上的相機進行拍照時,他們會通過調(diào)整強度等級,色彩飽和度等去嘗試捕捉美麗的世界。同時在圖像拍攝過程中肯能會出現(xiàn)“鏡頭光暈”的現(xiàn)象,人類可以輕松的判斷光暈后面是什么場景,而對于計算機來說確實非常困難。 雖然已經(jīng)有很多去除光暈的算法,但是去除光暈的算法本身也是開放的領(lǐng)域。另外,在圖像壓縮的過程中會對圖像降低像素或者變換操作,而這樣的圖片對于人來說可以輕松的識別,而對于計算機,如果不告訴它壓縮變換的操作,它會當(dāng)作壓縮后的圖像為原圖像進行識別,從而產(chǎn)生錯誤。

ba7760f0-7b80-11ed-8abf-dac502259ad0.png

理解圖像含義困難

最后也是最重要的是就是對圖像內(nèi)容的理解。對于機器來說,這絕對是計算機視覺環(huán)境中最難處理的事情。當(dāng)人類觀看圖像時,會用累積的學(xué)習(xí)和記憶(稱為先驗知識)來分析它。例如,人類知道,可以坐在健身球上,而平底鍋通常用在廚房里,因為這些東西過去已經(jīng)了解過。如果有一些東西看起來像天空中的平底鍋,很可能它不是平底鍋,因此可以進一步仔細檢查,以確定對象可能是什么。或者如果有人圍著綠球踢球,很可能是小孩子的球而不是健身球。但機器沒有這種知識。他們不了解的世界,不了解其中固有的復(fù)雜性,以及在數(shù)千年的進化中創(chuàng)造的眾多工具、商品、設(shè)備等。也許有一天機器將能夠獲得網(wǎng)絡(luò)并從那里了解有關(guān)對象的信息,但目前離這種情況很遠。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1272

    瀏覽量

    56511
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1690

    瀏覽量

    45876

原文標(biāo)題:圖像處理技術(shù)難點

文章出處:【微信號:機器視覺沙龍,微信公眾號:機器視覺沙龍】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    淺談大數(shù)據(jù)視頻圖像處理系統(tǒng)技術(shù)

    的發(fā)展帶來機遇的同時也帶來了挑戰(zhàn)。視頻圖像處理你了解多少?關(guān)注中國電子學(xué)會2013年度盛會---圖形圖像處理技術(shù)大會。 好用的
    發(fā)表于 09-24 15:22

    移動電視射頻技術(shù)面臨什么挑戰(zhàn)

    隨著數(shù)字移動電視不斷向移動設(shè)備的應(yīng)用轉(zhuǎn)移,應(yīng)用和系統(tǒng)工程師正面臨著各種挑戰(zhàn),比如外形尺寸的小型化、更低的功耗以及信號完整性。對現(xiàn)有移動電視標(biāo)準(zhǔn)的研究重點將放在了DVB-H上。本文將從系統(tǒng)角度討論DVB-H接收器設(shè)計所面臨的機遇和
    發(fā)表于 06-03 06:28

    LTE測試技術(shù)面臨什么挑戰(zhàn)

    運營商建設(shè)LTE網(wǎng)絡(luò)的基本策略之一為LTE網(wǎng)絡(luò)、2G和3G網(wǎng)絡(luò)將長期共存,共同發(fā)展,多模、多制式、多頻的融合。LTE網(wǎng)絡(luò)測試領(lǐng)域也在業(yè)界的持續(xù)努力與實驗網(wǎng)的驗證下取得了很大的進步。但在多網(wǎng)協(xié)同的發(fā)展方向上,仍面臨諸多挑戰(zhàn),需要進一步積極應(yīng)對。
    發(fā)表于 06-10 07:48

    多點綜合技術(shù)面臨什么挑戰(zhàn)?

    隨著設(shè)計復(fù)雜性增加,傳統(tǒng)的綜合方法面臨越來越大的挑戰(zhàn)。為此,Synplicity公司開發(fā)了同時適用于FPGA或 ASIC設(shè)計的多點綜合技術(shù),它集成了“自上而下”與“自下而上”綜合方法的優(yōu)勢,能提供高結(jié)果質(zhì)量和高生產(chǎn)率,同時削減存
    發(fā)表于 10-17 06:29

    毫微安電流測量技術(shù)面臨了哪些挑戰(zhàn)?

    請問毫微安電流測量技術(shù)面臨挑戰(zhàn)有哪些?
    發(fā)表于 04-09 06:27

    SoC測試技術(shù)面臨挑戰(zhàn)是什么?其發(fā)展趨勢如何?

    SoC測試技術(shù)傳統(tǒng)的測試方法和流程面臨挑戰(zhàn)是什么?SoC測試技術(shù)一體化測試流程是怎樣的?基于光子探測的SoC測試技術(shù)是什么?有什么目的?
    發(fā)表于 04-15 06:16

    模擬電路技術(shù)在數(shù)字時代面臨挑戰(zhàn)有哪些?

    模擬技術(shù)的無可替代的優(yōu)勢是什么?模擬電路技術(shù)在數(shù)字時代面臨挑戰(zhàn)有哪些?未來,模擬技術(shù)的發(fā)展趨勢是什么?與過去相比,目前模擬
    發(fā)表于 04-21 07:11

    基于能量采集技術(shù)的BLE傳感器節(jié)點設(shè)計面臨哪些挑戰(zhàn)?

    基于能量采集技術(shù)的BLE傳感器節(jié)點設(shè)計面臨哪些挑戰(zhàn)?如何去應(yīng)對這些挑戰(zhàn)?
    發(fā)表于 05-17 06:03

    RFID原理是什么?RFID技術(shù)面臨哪些挑戰(zhàn)?

    RFID原理是什么?RFID技術(shù)面臨哪些挑戰(zhàn)?
    發(fā)表于 05-26 06:06

    無線智能IP監(jiān)控面臨技術(shù)挑戰(zhàn)是什么?怎么解決?

    無線智能IP監(jiān)控面臨技術(shù)挑戰(zhàn)是什么?怎么解決?
    發(fā)表于 05-31 06:27

    多聲道音頻技術(shù)是什么?PC音頻子系統(tǒng)面臨哪些設(shè)計挑戰(zhàn)

    多聲道音頻技術(shù)是什么?PC音頻子系統(tǒng)面臨哪些設(shè)計挑戰(zhàn)?
    發(fā)表于 06-04 07:02

    何謂Full HD?Full HD面臨哪些技術(shù)挑戰(zhàn)?

    何謂Full HD?Full HD面臨哪些技術(shù)挑戰(zhàn)?
    發(fā)表于 06-07 07:14

    ARM應(yīng)對汽車圖像處理面臨挑戰(zhàn),發(fā)布Mali-C71圖像信號處理

    ARM今天正式發(fā)布Mali-C71圖像信號處理器(ISP),應(yīng)對汽車圖像處理面臨挑戰(zhàn),包括在
    發(fā)表于 04-25 17:30 ?1128次閱讀

    如何解決高光譜圖像分類面臨挑戰(zhàn)

    高光譜圖像的分類面臨著維數(shù)問題、非線性結(jié)構(gòu)問題等諸多挑戰(zhàn),面對這些挑戰(zhàn),我們有什么辦法去解決嗎?今天,小編給大家整理了以下幾個方法: 特征挖掘技術(shù)
    的頭像 發(fā)表于 06-29 09:41 ?1454次閱讀

    機器視覺的圖像處理技術(shù)面臨挑戰(zhàn)

    機器視覺(Machine Vision)是人工智能領(lǐng)域中發(fā)展迅速的一個重要分支,目前正處于不斷突破、走向成熟的階段。
    發(fā)表于 10-19 16:49 ?1006次閱讀