0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談用于攝像頭中的各種神經(jīng)網(wǎng)絡(luò)

新思科技 ? 來源:新思科技 ? 作者:新思科技 ? 2022-07-19 11:48 ? 次閱讀

汽車、機(jī)場、火車站、馬路、工廠、電子產(chǎn)品...攝像頭可以說隨處可見。汽車上的攝像頭可以幫我們探測路況,建筑內(nèi)的攝像頭可以保護(hù)我們的安全,自動化工廠內(nèi)的攝像頭可以幫助提高貨物的質(zhì)量和吞吐量。無論是哪種應(yīng)用場景,相機(jī)制造商和發(fā)燒友們都在追求更高的圖像分辨率,也就等同于更貴的鏡頭。

人工智能(AI)算法正在為大家提供一種追求更高分辨率的全新方式。AI算法能夠顯著提高拍攝圖像的清晰度和整體質(zhì)量,而且成本更低。這項技術(shù)適用于所有攝像頭,包括普通相機(jī)、單反、汽車、無人機(jī)、監(jiān)控系統(tǒng),甚至門鈴和ATM機(jī)。

現(xiàn)在幾乎所有電子系統(tǒng)中都會嵌入攝像頭,那么在攝像頭中引入人工智能技術(shù)無疑是個好消息。今天我們將一起探討用于攝像頭中的各種神經(jīng)網(wǎng)絡(luò),以及攝像頭、鏡頭與神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)之間應(yīng)該如何匹配以達(dá)到最佳效果。

用于圖像處理的神經(jīng)網(wǎng)絡(luò)

隨著數(shù)字成像技術(shù)的出現(xiàn),比特和字節(jié)取代了膠片,像素數(shù)成為衡量圖像質(zhì)量的指標(biāo)。圖像中的微小色點越多,圖像分辨率就越高。在傳統(tǒng)相機(jī)上,鏡頭將光聚焦到膠片上,從而形成圖像。而在數(shù)碼相機(jī)中,則由圖像傳感器將光轉(zhuǎn)換為電荷,其中圖像傳感器通常為互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)或電荷耦合器件(CCD)。

CMOS圖像傳感器通常用在智能手機(jī)中,它由彩色濾光片層提供顏色,同時由光電二極管將光轉(zhuǎn)換為電信號,最終形成數(shù)字圖像。在人工視覺和圖像識別等部分應(yīng)用中,CMOS傳感器與片上圖像處理電路配合使用來生成視覺圖像。而CCD圖像傳感器多見于機(jī)器視覺系統(tǒng)中。CCD是集成電路上的晶體管光傳感器,它負(fù)責(zé)整合接收到的光,并將電子轉(zhuǎn)換為電信號,然后由相機(jī)最終以視頻或靜態(tài)圖像格式輸出。

維也納工業(yè)大學(xué)(TU Wien)研發(fā)了一款內(nèi)置神經(jīng)網(wǎng)絡(luò)的超高速圖像傳感器,在經(jīng)過訓(xùn)練后,該傳感器可在幾納秒時間內(nèi)識別某些對象。研發(fā)人員指出,該芯片無需電腦來讀取和處理任何圖像數(shù)據(jù),因而在科研或其他專業(yè)領(lǐng)域中具有很大的應(yīng)用潛力。目前,神經(jīng)網(wǎng)絡(luò)通常在嵌入式視覺處理器或神經(jīng)處理單元(NPU)上運行,用來改進(jìn)圖像質(zhì)量、面部識別等各種功能。

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)用于多種不同的應(yīng)用:智能揚聲器的語音識別、移動設(shè)備的面部識別、自動駕駛汽車的行人檢測等等。它們的價值在于能夠靈敏地識別數(shù)據(jù)集內(nèi)的模式,而且常常優(yōu)于人工方式。有多種不同類型的神經(jīng)網(wǎng)絡(luò)適用于攝像頭應(yīng)用,借助這些神經(jīng)網(wǎng)絡(luò),可讓模糊圖像變得清晰,提供更鮮明的色彩,以及消除圖像黑邊。

此外,它還有一個非常先進(jìn)的功能,即可以針對人們感興趣區(qū)域進(jìn)行分隔和自動計算,執(zhí)行特定的任務(wù),比如,在監(jiān)控系統(tǒng)中,神經(jīng)網(wǎng)絡(luò)能夠生成特征圖,突出顯示圖像的最相關(guān)部分,以及提供人臉的清晰顯示;神經(jīng)網(wǎng)絡(luò)還可以在街景圖像中對行人進(jìn)行計數(shù),而不會對天空圖像執(zhí)行這一操作。通過僅處理圖像中用戶感興趣的區(qū)域,這些算法可以幫助減少所需的內(nèi)存和計算資源數(shù)量,這也是邊緣應(yīng)用的一項重要考慮因素。

適用于視覺應(yīng)用的幾種主要神經(jīng)網(wǎng)絡(luò)包括:

卷積神經(jīng)網(wǎng)絡(luò)(CNN):作為最流行的圖像處理算法之一,CNN可以提供高精度的對象分類,其用于學(xué)習(xí)的數(shù)據(jù)集相對較小

循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN):RNN能夠從數(shù)據(jù)序列學(xué)習(xí)非常復(fù)雜的關(guān)系,以此為序列建模,同時可在圖像處理中用于圖像分類

Transformer:Transformer最初用于語音和自然語言處理,能夠通過自注意力機(jī)制,提供出色的視覺結(jié)果;與CNN相比,它能夠更詳盡地提取圖像特征;但是,它們訓(xùn)練所需的數(shù)據(jù)集要大得多(通常在云端)

對于攝像頭應(yīng)用而言,每種神經(jīng)網(wǎng)絡(luò)都各有優(yōu)劣。過去幾年的實踐表明,CNN是最適合大規(guī)模應(yīng)用的神經(jīng)網(wǎng)絡(luò),特別是在邊緣應(yīng)用中。目前,結(jié)合使用CNN和Transformer神經(jīng)網(wǎng)絡(luò)來處理感興趣區(qū)域的方案可以獲取更準(zhǔn)確的結(jié)果。

在追求質(zhì)量的同時

平衡成本和功耗

決定使用哪種類型的神經(jīng)網(wǎng)絡(luò),并選擇攝像頭鏡頭,是一個非常復(fù)雜的命題,需要在功耗和成本方面進(jìn)行一些權(quán)衡。

鏡頭價格越貴,提供的分辨率就越高。如今智能手機(jī)可以提供超過100MP+的分辯率,從而為機(jī)器視覺系統(tǒng)提供更高的精度,使其能夠在更遠(yuǎn)距離之外看到更多物體。人工智能也能夠在這個領(lǐng)域發(fā)揮作用。開發(fā)者無需采用成本高昂的100MP+分辯率鏡頭,而是可以選擇成本更低、分辨率更低的鏡頭,再結(jié)合使用神經(jīng)網(wǎng)絡(luò)來提升圖像,從而提高圖像清晰度。

在決定使用哪種神經(jīng)網(wǎng)絡(luò)和鏡頭時,可以先參考下以下幾個比較關(guān)鍵的問題:

對視覺靈敏度的要求有多高?

想要通過哪些方面的提升來放大圖像或者提高圖像的質(zhì)量?

對于最終應(yīng)用來說,低功耗是關(guān)鍵標(biāo)準(zhǔn)嗎?

通常,通過試驗和試錯,以及建模和模擬,開發(fā)者們可以選擇出最適合最終應(yīng)用的神經(jīng)網(wǎng)絡(luò)和鏡頭。

要對神經(jīng)網(wǎng)絡(luò)進(jìn)行功耗估算,首先要了解相關(guān)硬件的性能表現(xiàn)。在這方面,開發(fā)者們可以使用建模,不過要注意,建模必須盡可能接近于最終產(chǎn)品,這一點非常重要。有些開發(fā)者會運用大量的定制和行業(yè)標(biāo)準(zhǔn)算法來了解特定硬件的一系列不同功耗值。

為了更好地了解系統(tǒng)性能,原型和仿真技術(shù)能夠為建模工作提供支持。比如,新思科技的ZeBu仿真系統(tǒng)就可以為運行神經(jīng)網(wǎng)絡(luò)的SoC系統(tǒng)的功耗進(jìn)行精確建模。

神經(jīng)網(wǎng)絡(luò)的復(fù)雜度不斷提高,這些系統(tǒng)的輸入數(shù)據(jù)量也在不斷增加(例如像素數(shù)和色彩分辨率)。為了滿足對更高帶寬、高效數(shù)據(jù)傳輸、大型計算和內(nèi)存陣列的需求,新思科技憑借在人工智能開發(fā)領(lǐng)域的深厚知識,提供了一系列的底層技術(shù)產(chǎn)品組合:

高帶寬傳感器接口,如MIPI IP,以及MIPI的驗證IP

ARCEV嵌入式視覺處理器,完全可編程,有可配置的內(nèi)核,成本和功耗適合嵌入式人工智能應(yīng)用,帶有可選的高性能深度神經(jīng)網(wǎng)絡(luò)(DNN)加速器,適用于CNN和RNN

ARCNPX NPU IP,業(yè)界最領(lǐng)先的NPU IP,計算能力達(dá)到3,500 TOPS,支持高度復(fù)雜的最新神經(jīng)網(wǎng)絡(luò)模型,滿足人工智能應(yīng)用的實時計算和超低功耗要求。

DSO.ai,用于芯片開發(fā)的自主人工智能應(yīng)用程序,可在巨大的求解空間內(nèi),為復(fù)雜SoC搜索最優(yōu)目標(biāo),包括那些用于工智能應(yīng)用的SoC。

從能夠拍攝精美人像照片的智能手機(jī),到能夠密切監(jiān)控路況的汽車,再到視覺敏銳的監(jiān)控系統(tǒng),以及支持高效生產(chǎn)的自動化工廠,越來越多的應(yīng)用都要使用攝像頭。攝像頭應(yīng)用也在更多地利用人工智能算法來提高圖像質(zhì)量。各種神經(jīng)網(wǎng)絡(luò)相繼問世,以滿足各種嵌入式視覺需求,它們能夠達(dá)到以前只有高成本鏡頭才能提供的高圖像分辨率。除此之外,開發(fā)者們需要在神經(jīng)網(wǎng)絡(luò)類型、攝像頭鏡頭、傳感器、內(nèi)存接口、高效處理器和其他底層技術(shù)之間取得平衡。

人們越來越離不開高分辨率的圖像識別,而開發(fā)者們也在一直為此而努力。通過神經(jīng)網(wǎng)絡(luò)與硬件之間的優(yōu)化組合,用戶最終能夠拍攝的照片會更精美,汽車和建筑可以更安全,自動化工廠內(nèi)的貨物也能更高質(zhì)量地高效生產(chǎn)。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4726

    瀏覽量

    100327
  • 圖像傳感器
    +關(guān)注

    關(guān)注

    68

    文章

    1851

    瀏覽量

    129361
  • 攝像頭
    +關(guān)注

    關(guān)注

    59

    文章

    4782

    瀏覽量

    95126
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46397

    瀏覽量

    236600

原文標(biāo)題:以AI之力,讓世界更清晰

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)的區(qū)別

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡稱ANNs)之間的關(guān)系與區(qū)別,是神經(jīng)網(wǎng)絡(luò)領(lǐng)域中一個基礎(chǔ)且重要的話題。本文將從定義、結(jié)構(gòu)、算法、應(yīng)用及未來發(fā)展等多個方面,詳細(xì)闡述BP
    的頭像 發(fā)表于 07-10 15:20 ?608次閱讀

    rnn是遞歸神經(jīng)網(wǎng)絡(luò)還是循環(huán)神經(jīng)網(wǎng)絡(luò)

    RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡(luò),而非遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是一種具有時間序列特性的神經(jīng)網(wǎng)絡(luò),能夠處理序列數(shù)據(jù),具有記憶功能。以下是關(guān)于循環(huán)
    的頭像 發(fā)表于 07-05 09:52 ?433次閱讀

    遞歸神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)

    遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN)實際上是同一個概念,只是不同的翻譯方式
    的頭像 發(fā)表于 07-04 14:54 ?549次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

    循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域中兩種非常重要的神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-04 14:24 ?807次閱讀

    神經(jīng)網(wǎng)絡(luò)芯片和普通芯片區(qū)別

    處理神經(jīng)網(wǎng)絡(luò)算法的芯片。它通過模擬人腦神經(jīng)元的工作方式,實現(xiàn)了對大量數(shù)據(jù)的并行處理和快速學(xué)習(xí)。 普通芯片,又稱通用芯片,是指可以執(zhí)行各種計算任務(wù)的芯片,如CPU、GPU等。它們具有較高的靈活性和通用性,可以應(yīng)
    的頭像 發(fā)表于 07-04 09:30 ?704次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    網(wǎng)絡(luò)結(jié)構(gòu),分別適用于不同的應(yīng)用場景。本文將從基本概念、結(jié)構(gòu)組成、工作原理及應(yīng)用領(lǐng)域等方面對這兩種神經(jīng)網(wǎng)絡(luò)進(jìn)行深入解讀。
    的頭像 發(fā)表于 07-03 16:12 ?1639次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network,簡稱BP神經(jīng)網(wǎng)絡(luò))是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過反向傳播算法來調(diào)整網(wǎng)絡(luò)中的權(quán)重和偏置,以達(dá)到最小化誤差的
    的頭像 發(fā)表于 07-03 11:00 ?525次閱讀

    神經(jīng)網(wǎng)絡(luò)擬合的誤差怎么分析

    神經(jīng)網(wǎng)絡(luò)擬合誤差分析是一個復(fù)雜且深入的話題,涉及到多個方面,需要從數(shù)據(jù)質(zhì)量、模型結(jié)構(gòu)、訓(xùn)練過程和正則化方法等多個角度進(jìn)行綜合考慮。 引言 神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)模型,廣泛應(yīng)用于各種
    的頭像 發(fā)表于 07-03 10:36 ?420次閱讀

    bp神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)

    Network)有相似之處,但它們之間還是存在一些關(guān)鍵的區(qū)別。 一、引言 神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元結(jié)構(gòu)的計算模型,它由大量的神經(jīng)元(或稱為節(jié)點)組成,這些神經(jīng)元通過權(quán)重連接在一起
    的頭像 發(fā)表于 07-03 10:14 ?508次閱讀

    bp神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是兩種不同類型的人工神經(jīng)網(wǎng)絡(luò),它們在
    的頭像 發(fā)表于 07-03 10:12 ?736次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、語音識別、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的原理,包括其
    的頭像 發(fā)表于 07-02 14:44 ?444次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)和BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Networks,簡稱BPNN)是兩種
    的頭像 發(fā)表于 07-02 14:24 ?1802次閱讀

    神經(jīng)網(wǎng)絡(luò)建模的適用范圍有哪些

    神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù),可以用于各種不同的應(yīng)用。以下是一些神經(jīng)網(wǎng)絡(luò)建模的適用范圍: 圖像識別和分類 神經(jīng)網(wǎng)絡(luò)在圖像識別和分類方面具
    的頭像 發(fā)表于 07-02 11:40 ?496次閱讀

    神經(jīng)網(wǎng)絡(luò)在數(shù)學(xué)建模中的應(yīng)用

    數(shù)學(xué)建模是一種利用數(shù)學(xué)方法和工具來描述和分析現(xiàn)實世界問題的過程。神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元結(jié)構(gòu)和功能的計算模型,可以用于解決各種復(fù)雜問題。在數(shù)學(xué)建模中,
    的頭像 發(fā)表于 07-02 11:29 ?706次閱讀

    神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

    神經(jīng)網(wǎng)絡(luò)架構(gòu)是機(jī)器學(xué)習(xí)領(lǐng)域中的核心組成部分,它們模仿了生物神經(jīng)網(wǎng)絡(luò)的運作方式,通過復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)信息的處理、存儲和傳遞。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,各種
    的頭像 發(fā)表于 07-01 14:16 ?492次閱讀