0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

可在傳感器內(nèi)計(jì)算的新視覺系統(tǒng)

FPGA之家 ? 來源:新機(jī)器視覺 ? 作者:新機(jī)器視覺 ? 2021-03-29 14:59 ? 次閱讀

視覺是我們最重要的感官之一。在過去的十年中,受生物啟發(fā)的機(jī)器視覺得到了迅速的發(fā)展,以至于人工系統(tǒng)可以從圖像和視頻中“看到”有價(jià)值的信息,盡管人類的視覺仍然有效得多。Mennel等人在《自然》雜志上發(fā)表的文章報(bào)道了一種視覺系統(tǒng)的設(shè)計(jì),該視覺系統(tǒng)與大腦一樣,可以訓(xùn)練以納秒為單位對(duì)簡(jiǎn)單圖像進(jìn)行分類。

現(xiàn)代圖像傳感器,如數(shù)碼相機(jī)中的圖像傳感器,是基于半導(dǎo)體(固態(tài))技術(shù),在20世紀(jì)70年代初發(fā)展起來的;它們分為兩種主要類型,即電荷耦合器件和有源像素傳感器。這些傳感器可以忠實(shí)地從環(huán)境中捕獲視覺信息,但會(huì)生成大量冗余數(shù)據(jù)。通常將大量的光學(xué)信息轉(zhuǎn)換為數(shù)字電子格式,然后傳遞到計(jì)算單元進(jìn)行圖像處理。

在傳感器和處理單元之間產(chǎn)生的大量數(shù)據(jù)移動(dòng)導(dǎo)致延遲(延遲)和高功耗。隨著成像速度和像素?cái)?shù)量的增長,帶寬限制使得很難將所有信息迅速地發(fā)送回中央或基于云的計(jì)算機(jī),以便進(jìn)行實(shí)時(shí)處理和決策,這對(duì)于諸如無人駕駛汽車、機(jī)器人工業(yè)制造等延遲敏感應(yīng)用尤其重要。

一個(gè)更好的解決方案是將一些計(jì)算任務(wù)轉(zhuǎn)移到計(jì)算機(jī)系統(tǒng)外部邊緣的感知設(shè)備上,減少不必要的數(shù)據(jù)移動(dòng)。而且,由于傳感器通常會(huì)產(chǎn)生模擬(連續(xù)變化)輸出,模擬處理比數(shù)字處理更可?。罕娝苤?,模擬-數(shù)字轉(zhuǎn)換非常耗時(shí)耗力。

為了模仿大腦對(duì)信息的有效處理,受到生物學(xué)啟發(fā)的神經(jīng)形態(tài)工程采用了一種計(jì)算架構(gòu),該架構(gòu)具有高度互連的元素(神經(jīng)元,通過突觸連接),可以進(jìn)行并行計(jì)算(圖1a)。這些人工神經(jīng)網(wǎng)絡(luò)可以通過迭代從周圍的環(huán)境中學(xué)習(xí),例如:學(xué)習(xí)在顯示已知示例后對(duì)事物進(jìn)行分類(監(jiān)督學(xué)習(xí)),或從輸入數(shù)據(jù)中識(shí)別對(duì)象的特征結(jié)構(gòu)而無需額外信息(監(jiān)督學(xué)習(xí))。在學(xué)習(xí)過程中,算法會(huì)反復(fù)進(jìn)行預(yù)測(cè),并增強(qiáng)或削弱網(wǎng)絡(luò)中的每個(gè)突觸,直到達(dá)到最佳設(shè)置。

c76c4986-8ecb-11eb-8b86-12bb97331649.jpg

圖1 |在視覺傳感器內(nèi)進(jìn)行計(jì)算,實(shí)現(xiàn)智能,高效的預(yù)處理。a,在傳統(tǒng)的人工智能AI)視覺傳感器中,從光響應(yīng)傳感器收集信號(hào),將其從模擬形式轉(zhuǎn)換為數(shù)字形式(ADC,模數(shù)轉(zhuǎn)換器),放大后作為輸入提供給外部人工神經(jīng)網(wǎng)絡(luò)(ANN)-互連計(jì)算單元(圓圈)的層,可以調(diào)整其連接,從而可以訓(xùn)練網(wǎng)絡(luò)執(zhí)行諸如圖像分類之類的任務(wù)。ANN的輸入層接收編碼簡(jiǎn)單物理元素(此處由點(diǎn)和線表示)的信號(hào);在隨后的層中,這些被優(yōu)化為中級(jí)特征(簡(jiǎn)單形狀);并在輸出層(3D形狀)上形成精細(xì)的圖像??傮w響應(yīng)可能很慢且耗能。b,Mennel等人[3]報(bào)告了一種系統(tǒng),其中芯片上的互連傳感器(正方形)不僅可以收集信號(hào),而且還可以作為ANN來識(shí)別簡(jiǎn)單特征,從而減少了傳感器和外部電路之間的冗余數(shù)據(jù)移動(dòng)。

Mennel和同事直接在他們的圖像傳感器中實(shí)現(xiàn)了一個(gè)人工神經(jīng)網(wǎng)絡(luò)。在芯片上,他們構(gòu)建了一個(gè)光電二極管網(wǎng)絡(luò)——微小的光敏元件,每一個(gè)都由幾個(gè)鎢二硒化物原子層組成。這種半導(dǎo)體對(duì)光的響應(yīng)可以通過改變外加電壓來增加或減少,因此每個(gè)二極管的靈敏度可以單獨(dú)調(diào)諧。實(shí)際上,這將使光傳感器網(wǎng)絡(luò)變成一個(gè)神經(jīng)網(wǎng)絡(luò)(圖1b),并允許它執(zhí)行簡(jiǎn)單的計(jì)算任務(wù)。改變光電二極管的光響應(yīng)度會(huì)改變網(wǎng)絡(luò)中的連接強(qiáng)度——突觸重量。因此,該設(shè)備結(jié)合了光學(xué)傳感和神經(jīng)形態(tài)計(jì)算。

作者將光電二極管排列成9個(gè)像素的正方形陣列,每個(gè)像素有3個(gè)二極管。當(dāng)圖像投射到芯片上時(shí),產(chǎn)生、組合和讀取各種二極管電流。硬件陣列提供了一種模擬計(jì)算形式:每個(gè)光電二極管產(chǎn)生一個(gè)與入射光強(qiáng)度成比例的輸出電流,根據(jù)基爾霍夫定律(電路中電流的一個(gè)基本規(guī)則),所得電流沿行或列求和。

然后訓(xùn)練陣列執(zhí)行任務(wù)。芯片外分析陣列產(chǎn)生的電流與預(yù)測(cè)電流(如果陣列對(duì)圖像做出正確響應(yīng),對(duì)于給定任務(wù),將產(chǎn)生的電流)之間的差異,并用于調(diào)整下一個(gè)訓(xùn)練周期的突觸重量。這個(gè)學(xué)習(xí)階段占用了時(shí)間和計(jì)算資源,但是,一旦訓(xùn)練好,芯片就會(huì)快速地執(zhí)行設(shè)定的任務(wù)。

使用不同的神經(jīng)網(wǎng)絡(luò)算法,作者證明了兩個(gè)神經(jīng)形態(tài)函數(shù)。第一種是分類:他們的3?×?3像素?cái)?shù)組可以將圖像分類為對(duì)應(yīng)于三個(gè)簡(jiǎn)化字母的三個(gè)類中的一個(gè),從而以納秒為單位確定它是哪一個(gè)字母。這個(gè)相對(duì)簡(jiǎn)單的任務(wù)只是一個(gè)概念的證明,如果陣列尺寸增大,可以擴(kuò)展到識(shí)別更復(fù)雜的圖像。

第二個(gè)功能是自動(dòng)編碼:即使在存在信號(hào)噪聲的情況下,傳感器陣列中的計(jì)算也可以通過學(xué)習(xí)圖像的關(guān)鍵特征來生成處理圖像的簡(jiǎn)化表示。編碼版本只包含最基本的信息,但可以解碼以重建接近原始的圖像。

這項(xiàng)前沿技術(shù)可以用于實(shí)際應(yīng)用之前,還有許多工作要做。用于自動(dòng)駕駛車輛和機(jī)器人的神經(jīng)形態(tài)視覺系統(tǒng)將需要捕獲具有三個(gè)維度并具有廣闊視野的動(dòng)態(tài)圖像和視頻。當(dāng)前使用的圖像捕獲技術(shù)通常將3D現(xiàn)實(shí)世界轉(zhuǎn)換為2D信息,從而丟失運(yùn)動(dòng)信息和深度?,F(xiàn)有圖像傳感器陣列的平面形狀也限制了廣角相機(jī)的發(fā)展。

作者描述的設(shè)備很難在昏暗的光線下成像。需要重新設(shè)計(jì)以改善薄半導(dǎo)體中的光吸收并增加可以檢測(cè)到的光強(qiáng)度范圍。此外,所報(bào)道的設(shè)計(jì)需要高電壓并消耗大量功率。相比之下,在生物神經(jīng)網(wǎng)絡(luò)中,每項(xiàng)操作的能耗為亞飛焦耳級(jí)(10-15至10-13焦耳)。擴(kuò)展對(duì)紫外線和紅外光的響應(yīng),以捕獲可見光譜中不可用的信息也是有用的。

所使用的薄半導(dǎo)體難以在大面積上均勻地生產(chǎn),并且難以加工,因此它們可以與硅電子器件集成在一起,例如用于讀出或反饋控制的外部電路。使用這些傳感器的設(shè)備的速度和能源效率將不取決于圖像捕獲過程,而是取決于傳感器和外部電路之間的數(shù)據(jù)移動(dòng)。而且,盡管傳感器計(jì)算單元在模擬域中收集和計(jì)算數(shù)據(jù),減少了模數(shù)轉(zhuǎn)換,但是外圍電路仍然遭受其他固有延遲的困擾。傳感器和外部電路將需要共同開發(fā),以減少整個(gè)系統(tǒng)的等待時(shí)間。

Mennel及其同事的“傳感器中計(jì)算”系統(tǒng)應(yīng)激發(fā)對(duì)人工智能(AI)硬件的進(jìn)一步研究。幾家公司已經(jīng)開發(fā)了基于硅電子產(chǎn)品的AI視覺芯片,但是這些芯片的固有數(shù)字架構(gòu)會(huì)導(dǎo)致延遲和電源效率問題。

更廣泛地講,作者的策略不僅限于視覺系統(tǒng)。它可以擴(kuò)展到用于聽覺,觸覺,熱感或嗅覺的其他物理輸入。此類智能系統(tǒng)的開發(fā)以及5G快速無線網(wǎng)絡(luò)的到來,應(yīng)會(huì)在將來允許進(jìn)行實(shí)時(shí)邊緣(低延遲)計(jì)算。

原文標(biāo)題:新的視覺系統(tǒng)可以在傳感器內(nèi)計(jì)算,無需將信息轉(zhuǎn)換成數(shù)字格式

文章出處:【微信公眾號(hào):FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2542

    文章

    50269

    瀏覽量

    750176
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    161

    文章

    4304

    瀏覽量

    119885

原文標(biāo)題:新的視覺系統(tǒng)可以在傳感器內(nèi)計(jì)算,無需將信息轉(zhuǎn)換成數(shù)字格式

文章出處:【微信號(hào):zhuyandz,微信公眾號(hào):FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    機(jī)器視覺系統(tǒng)如何選擇圖像傳感器

    圖像傳感器是所有機(jī)器視覺(MV)系統(tǒng)的核心,這是負(fù)責(zé)將物理世界的信息轉(zhuǎn)換為數(shù)字?jǐn)?shù)據(jù)的基本元件,在確保機(jī)器視覺操作的準(zhǔn)確性、可靠性和高效率方面起到了關(guān)鍵作用。在這篇博文中,安森美探討了為
    的頭像 發(fā)表于 07-05 10:49 ?475次閱讀

    CCD機(jī)器視覺系統(tǒng)的工作原理和特性

    隨著科技的飛速發(fā)展,機(jī)器視覺技術(shù)已成為工業(yè)自動(dòng)化、質(zhì)量檢測(cè)、智能監(jiān)控等領(lǐng)域的重要支撐。CCD機(jī)器視覺系統(tǒng)作為機(jī)器視覺技術(shù)的核心組成部分,以其高清晰度、高可靠性、實(shí)時(shí)性強(qiáng)等特點(diǎn),得到了廣泛應(yīng)用。本文將
    的頭像 發(fā)表于 06-06 16:27 ?971次閱讀

    機(jī)器視覺系統(tǒng)與運(yùn)動(dòng)控制系統(tǒng)的區(qū)別

      在工業(yè)自動(dòng)化和智能制造的浪潮中,機(jī)器視覺系統(tǒng)和運(yùn)動(dòng)控制系統(tǒng)作為兩大關(guān)鍵技術(shù),各自扮演著不可或缺的角色。它們雖然都是為了實(shí)現(xiàn)更高效、更精確的自動(dòng)化操作,但在技術(shù)原理、功能定位、應(yīng)用領(lǐng)域等方面卻存在顯著的區(qū)別。本文將從多個(gè)維度出發(fā),詳細(xì)探討機(jī)器
    的頭像 發(fā)表于 06-06 14:10 ?625次閱讀

    機(jī)器視覺系統(tǒng)的工作原理和應(yīng)用領(lǐng)域

      隨著科技的飛速發(fā)展,機(jī)器視覺系統(tǒng)已成為工業(yè)自動(dòng)化領(lǐng)域不可或缺的一部分。機(jī)器視覺系統(tǒng),顧名思義,就是使用機(jī)器來模擬和實(shí)現(xiàn)人類視覺的功能,通過圖像攝取裝置將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),進(jìn)而利用這些信號(hào)
    的頭像 發(fā)表于 06-06 14:04 ?682次閱讀

    機(jī)器視覺系統(tǒng)五個(gè)模塊介紹

    典型的機(jī)器視覺系統(tǒng)由五個(gè)主要模塊組成:照明、鏡頭、相機(jī)、圖像采集和視覺處理。讓我們看一下這五個(gè)結(jié)構(gòu)的目的、特征和工作原理。機(jī)器視覺系統(tǒng):照明照明是影響機(jī)器
    的頭像 發(fā)表于 05-09 17:13 ?696次閱讀
    機(jī)器<b class='flag-5'>視覺系統(tǒng)</b>五個(gè)模塊介紹

    機(jī)器視覺系統(tǒng)的組成部分

    一般來說,一個(gè)完整的機(jī)器視覺系統(tǒng)由光學(xué)系統(tǒng)(光源、鏡頭、工業(yè)相機(jī))、圖像采集單元、圖像處理單元、執(zhí)行和人機(jī)界面等模塊組成。各功能模塊缺一不可、相輔相成。1.照明(光源)照明是影響機(jī)器視覺系統(tǒng)
    的頭像 發(fā)表于 04-29 14:51 ?1008次閱讀
    機(jī)器<b class='flag-5'>視覺系統(tǒng)</b>的組成部分

    淺談傳感器和鏡頭的匹配設(shè)計(jì)

    理解相機(jī)傳感器和成像鏡頭之間的相互作用是設(shè)計(jì)和實(shí)現(xiàn)機(jī)器視覺系統(tǒng)的重要部分。這種關(guān)系的優(yōu)化常常被忽視,它對(duì)系統(tǒng)整體分辨率的影響很大。
    發(fā)表于 04-07 14:33 ?1018次閱讀
    淺談<b class='flag-5'>傳感器</b>和鏡頭的匹配設(shè)計(jì)

    機(jī)器視覺系統(tǒng)中常用攝像機(jī)的分類

    攝像機(jī)是機(jī)器視覺系統(tǒng)中的一個(gè)關(guān)鍵組件,其最本質(zhì)的功能就是將光信號(hào)轉(zhuǎn)變成為有序的電信號(hào)。選擇合適的攝像機(jī)也是機(jī)器視覺系統(tǒng)設(shè)計(jì)中的重要環(huán)節(jié),攝像機(jī)的不僅是直接決定所采集到的圖像分辨率、圖像質(zhì)量等,同時(shí)也與整全系統(tǒng)的運(yùn)行模式直接相關(guān)。
    發(fā)表于 01-19 09:23 ?501次閱讀
    機(jī)器<b class='flag-5'>視覺系統(tǒng)</b>中常用攝像機(jī)的分類

    視覺傳感器的應(yīng)用有哪些?

    視覺傳感器視覺檢測(cè)系統(tǒng)提供基于圖像的自動(dòng)化檢測(cè),方便進(jìn)行各種工業(yè)和制造應(yīng)用。雖然2D和3D視覺傳感器
    的頭像 發(fā)表于 01-09 08:36 ?858次閱讀

    視覺傳感器的定義、結(jié)構(gòu)和原理、作用及應(yīng)用

    視覺傳感器是一種常見的傳感器,它可以將光學(xué)信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),用于實(shí)現(xiàn)圖像采集、處理和分析等功能。在當(dāng)今智能化的時(shí)代,視覺傳感器在各個(gè)領(lǐng)域都
    的頭像 發(fā)表于 01-04 08:44 ?3914次閱讀
    <b class='flag-5'>視覺</b><b class='flag-5'>傳感器</b>的定義、結(jié)構(gòu)和原理、作用及應(yīng)用

    視覺系統(tǒng)鏡頭介紹及選型方法

    1.鏡頭介紹 鏡頭作為機(jī)器的眼睛,其主要作用是將目標(biāo)物體的圖像聚焦在圖像傳感器(相機(jī))的光敏器件上。數(shù)據(jù)系統(tǒng)所處理的所有圖像信息均需要通過鏡頭得到,鏡頭的質(zhì)量直接影響到視覺系統(tǒng)的整體性能。 (1
    的頭像 發(fā)表于 12-15 14:36 ?1504次閱讀
    <b class='flag-5'>視覺系統(tǒng)</b>鏡頭介紹及選型方法

    傳統(tǒng)基于幀的圖像傳感器輸出和基于事件的視覺傳感器輸出對(duì)比

    2021年,索尼半導(dǎo)體解決方案公司(Sony Semiconductor Solutions Corporation,以下簡(jiǎn)稱“索尼”)發(fā)布了兩款堆疊式基于事件(Event-based)的視覺傳感器
    的頭像 發(fā)表于 11-16 10:12 ?2290次閱讀
    傳統(tǒng)基于幀的圖像<b class='flag-5'>傳感器</b>輸出和基于事件的<b class='flag-5'>視覺</b><b class='flag-5'>傳感器</b>輸出對(duì)比

    機(jī)器視覺系統(tǒng)中前光源與背光源的應(yīng)用實(shí)例

    在機(jī)器視覺系統(tǒng)中光源是關(guān)鍵組成部分之一,在機(jī)器視覺系統(tǒng)中具有十分重要的作用。
    的頭像 發(fā)表于 11-14 11:10 ?773次閱讀
    機(jī)器<b class='flag-5'>視覺系統(tǒng)</b>中前光源與背光源的應(yīng)用實(shí)例

    立體視覺系統(tǒng)的設(shè)計(jì)方案

    電子發(fā)燒友網(wǎng)站提供《立體視覺系統(tǒng)的設(shè)計(jì)方案.pdf》資料免費(fèi)下載
    發(fā)表于 11-06 10:17 ?0次下載
    立體<b class='flag-5'>視覺系統(tǒng)</b>的設(shè)計(jì)方案

    工業(yè)機(jī)器視覺系統(tǒng)中光源設(shè)計(jì)應(yīng)用

    機(jī)器視覺系統(tǒng)主要由三部分組成:圖像的獲取、圖像的處理和分析、輸出或顯示。而圖像的獲取是機(jī)器視覺的核心,圖像的獲取系統(tǒng)則是由光源、鏡頭、相機(jī)三部分組成。
    發(fā)表于 11-03 12:34 ?685次閱讀
    工業(yè)機(jī)器<b class='flag-5'>視覺系統(tǒng)</b>中光源設(shè)計(jì)應(yīng)用