0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何提升NPU的能效比?

佐思汽車研究 ? 來(lái)源:佐思汽車研究 ? 作者:Nathan J ? 2022-08-01 11:19 ? 次閱讀

現(xiàn)如今,深度神經(jīng)網(wǎng)絡(luò)正在以越來(lái)越大的規(guī)模部署,橫跨了從云端,自動(dòng)駕駛IoT等平臺(tái)。比如用于圖像識(shí)別,語(yǔ)音識(shí)別及翻譯,癌癥檢測(cè)以及自動(dòng)駕駛中對(duì)感知層海量數(shù)據(jù)的處理等。在很多領(lǐng)域,深度神經(jīng)網(wǎng)絡(luò)的精度已經(jīng)超越人類,它的優(yōu)越性來(lái)源于它對(duì)原始數(shù)據(jù)的特征提取,并通過(guò)對(duì)大量數(shù)據(jù)的學(xué)習(xí)來(lái)獲取輸入空間的有效表征,但是它的高精度是以超高計(jì)算復(fù)雜度為代價(jià)。因此很多廠商都在追逐NPU的算力來(lái)解決這些復(fù)雜問(wèn)題,但是隨著算力的提高,NPU設(shè)計(jì)也越來(lái)越復(fù)雜,將伴隨著面積和功耗的增加,這對(duì)于那些面積和功耗有很大限制的設(shè)備帶來(lái)了挑戰(zhàn),因此如何提升NPU的能效比就成了亟待解決的問(wèn)題。

6bdd29be-1147-11ed-ba43-dac502259ad0.png

NPU通過(guò)數(shù)據(jù)分區(qū)和有效調(diào)度,利用數(shù)據(jù)的重用以及執(zhí)行分段來(lái)提高能效比和硬件利用率,而實(shí)現(xiàn)高利用率,數(shù)據(jù)重用將直接依賴于如何調(diào)度深度神經(jīng)網(wǎng)絡(luò)的計(jì)算和如何將這些計(jì)算有效的映射到NPU的硬件單元上。以CNN為例,數(shù)據(jù)流無(wú)非包含三個(gè)方面filter(Weight),ifmap和ofmap,如下圖。

6bf2bb62-1147-11ed-ba43-dac502259ad0.png

因此在設(shè)計(jì)NPU時(shí)需要考慮如利用內(nèi)存的層次結(jié)構(gòu),決定哪些數(shù)據(jù)要讀到那一層的內(nèi)存中以及什么時(shí)候被處理,如何可以重用filter,ifmap和ofmap,將他們存放在本地內(nèi)存中,從而大大減少DRAM的訪問(wèn)次數(shù),這將在很大程度上提高NPU的硬件利用率及性能,并減少由于DRAM訪問(wèn)帶了的額外功耗。根據(jù)數(shù)據(jù)處理特征可以將數(shù)據(jù)流分為以下幾類:

1)、靜態(tài)weight

weight靜態(tài)數(shù)據(jù)流的設(shè)計(jì)是通過(guò)在PE的RF(Register File)中存取weight,來(lái)減少讀取weight產(chǎn)生的功耗。weight從DRAM讀取到RF并保持靜態(tài)以供進(jìn)一步訪問(wèn),NPU在計(jì)算時(shí)盡可能多的利用RF中的weight以達(dá)到最大程度的重用。通常的實(shí)現(xiàn)是將ifmap廣播給所有的PE,部分和(Psum)將穿過(guò)所有的PE來(lái)完成空間上的累加。

6c0593b8-1147-11ed-ba43-dac502259ad0.png

2)、靜態(tài)輸出

輸出靜態(tài)數(shù)據(jù)流的設(shè)計(jì)是通過(guò)將accumulator產(chǎn)生的Psum存放到本地的RF中,以避免將Psum剛寫入DRAM再讀回,從而減少因Psum讀寫產(chǎn)生的功耗。通常的實(shí)現(xiàn)是流式輸入Activation,并將weight廣播給所有的PE。

6c19630c-1147-11ed-ba43-dac502259ad0.png

3)、無(wú)本地重用

如果考慮到RF會(huì)增大面積,可以將所有的數(shù)據(jù)都存放到Global Buffer中,這樣沒有任何數(shù)據(jù)會(huì)留在PE的RF,也不會(huì)增設(shè)RF單元來(lái)減小面積,但是增加了PE和Global Buffer的數(shù)據(jù)交互。具體來(lái)說(shuō)是通過(guò)多廣播Activation,單廣播Weight以及Psum穿過(guò)所有的PE進(jìn)行累加來(lái)實(shí)現(xiàn)的。

6c29f104-1147-11ed-ba43-dac502259ad0.png

4)、靜態(tài)行

靜態(tài)行數(shù)據(jù)流的目標(biāo)是將所有的數(shù)據(jù)類型(Activation,weight, psum)的重用和計(jì)算都在RF中完成,來(lái)提升總體的能效。它區(qū)別于上面的靜態(tài)weight和靜態(tài)輸出,只是分別對(duì)weight和psum進(jìn)行優(yōu)化。

6c3b85a4-1147-11ed-ba43-dac502259ad0.png

具體選用哪種數(shù)據(jù)流方式要結(jié)合NPU微架構(gòu)的設(shè)計(jì)。下面總結(jié)了來(lái)自于幾個(gè)廠家的NPU,它們分別利用了不同數(shù)據(jù)流類型來(lái)提高能效比。

6c461b0e-1147-11ed-ba43-dac502259ad0.png

參考文獻(xiàn):

【1】Vivienne S. Yu-Hsin C.and etc., “Ef?cient Processing of Deep Neural Networks: A Tutorial and Survey”

關(guān)于復(fù)睿微電子

復(fù)睿微電子是世界500強(qiáng)企業(yè)復(fù)星集團(tuán)出資設(shè)立的先進(jìn)科技型企業(yè)。復(fù)睿微電子植根于創(chuàng)新驅(qū)動(dòng)的文化,通過(guò)技術(shù)創(chuàng)新改變?nèi)藗兊纳?、工作、學(xué)習(xí)和娛樂(lè)方式。公司成立于2022年1月,目標(biāo)成為世界領(lǐng)先的智能出行時(shí)代的大算力方案提供商,致力于為汽車電子、人工智能、通用計(jì)算等領(lǐng)域提供以高性能芯片為基礎(chǔ)的解決方案。

目前主要從事汽車智能座艙、ADS/ADAS芯片研發(fā),以領(lǐng)先的芯片設(shè)計(jì)能力和人工智能算法,通過(guò)底層技術(shù)賦能,推動(dòng)汽車產(chǎn)業(yè)的創(chuàng)新發(fā)展,提升人們的出行體驗(yàn)。在智能出行的時(shí)代,芯片是汽車的大腦。復(fù)星智能出行集團(tuán)已經(jīng)構(gòu)建了完善的智能出行生態(tài),復(fù)睿微是整個(gè)生態(tài)的通用大算力和人工智能大算力的基礎(chǔ)平臺(tái)。復(fù)睿微以提升客戶體驗(yàn)為使命,在后摩爾定律時(shí)代持續(xù)通過(guò)先進(jìn)封裝、先進(jìn)制程和解決方案提升算力,與合作伙伴共同面對(duì)汽車智能化的新時(shí)代。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    452

    文章

    49938

    瀏覽量

    419620
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4722

    瀏覽量

    100308
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    252

    瀏覽量

    18480

原文標(biāo)題:ADS算力芯片NPU數(shù)據(jù)流的重用性

文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    智慧水務(wù)綜合管理系統(tǒng)-提高污水廠

    簡(jiǎn)婷 安科瑞電氣股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水務(wù)管理平臺(tái) 1平臺(tái)概述 安科瑞電氣具備從終端感知、邊緣計(jì)算到管理平臺(tái)的產(chǎn)品*態(tài)體系,Acrel
    的頭像 發(fā)表于 10-21 14:14 ?43次閱讀
    智慧水務(wù)綜合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理系統(tǒng)-提高污水廠<b class='flag-5'>能</b><b class='flag-5'>效</b>

    聯(lián)發(fā)科天璣9400發(fā)布:與端側(cè)AI引領(lǐng)移動(dòng)芯片行業(yè)革新

    在AI大模型的推動(dòng)下,智能手機(jī)市場(chǎng)的高端化進(jìn)程進(jìn)一步加速,旗艦機(jī)型的競(jìng)爭(zhēng)已不再單純依賴于“大力飛磚”式的極限性能比拼,而是更加注重綜合素質(zhì)的提升。特別是在手機(jī)芯片領(lǐng)域,高性能與低功耗、高能的平衡成為了新的競(jìng)爭(zhēng)焦點(diǎn)。
    的頭像 發(fā)表于 10-12 15:56 ?410次閱讀

    什么是NPU?什么場(chǎng)景需要配置NPU?

    在人工智能(AI)技術(shù)如火如荼的今天,NPU神經(jīng)處理單元(Neural Processing Unit)作為一種新興的硬件加速器,正在成為ARM主板配置中的新寵。與傳統(tǒng)的CPU和GPU相比,NPU
    的頭像 發(fā)表于 10-11 10:13 ?431次閱讀
    什么是<b class='flag-5'>NPU</b>?什么場(chǎng)景需要配置<b class='flag-5'>NPU</b>?

    利用AI和加速計(jì)算提升天氣預(yù)報(bào)效率和

    在 NVIDIA GPU 驅(qū)動(dòng)的擴(kuò)散模型助力下,生成式 AI 在各個(gè)領(lǐng)域?qū)崿F(xiàn)新的應(yīng)用,大大提升了效率。   當(dāng)臺(tái)灣氣象員得以在一臺(tái)機(jī)器上模擬臺(tái)風(fēng)的細(xì)節(jié),他們深感其對(duì)預(yù)報(bào)任務(wù)的巨大提升
    的頭像 發(fā)表于 06-07 15:06 ?459次閱讀

    重磅!英特爾發(fā)布intel3制程至強(qiáng)6核處理器,賦數(shù)據(jù)中心升級(jí)

    、橫向擴(kuò)展工作負(fù)載帶來(lái)性能與的雙重提升,同時(shí)攜手金山云、浪潮信息、南大通用,以及記憶科技等多家生態(tài)合作伙伴,分享基于該處理器的端到端創(chuàng)新解決方案,及其在諸多領(lǐng)域的實(shí)踐成果與應(yīng)用價(jià)值。
    的頭像 發(fā)表于 06-07 10:38 ?4255次閱讀
    重磅!英特爾發(fā)布intel3制程至強(qiáng)6<b class='flag-5'>能</b><b class='flag-5'>效</b>核處理器,賦<b class='flag-5'>能</b>數(shù)據(jù)中心<b class='flag-5'>能</b><b class='flag-5'>效</b>升級(jí)

    AMD披露高效數(shù)據(jù)中心策略,預(yù)計(jì)至2027年提升超百倍

    會(huì)議期間,蘇姿豐談?wù)摿薃MD如何通過(guò)實(shí)施30x25戰(zhàn)略推動(dòng)2025年計(jì)算節(jié)點(diǎn)提升30倍的目標(biāo)。她進(jìn)一步透露,AMD已找到2026年至2027年間將能
    的頭像 發(fā)表于 05-24 17:37 ?954次閱讀

    天璣9300旗艦芯:全大核CPU架構(gòu),性能與提升

    “全大核”CPU 架構(gòu)設(shè)計(jì)打破常規(guī),摒棄小核,采用超大核(Arm Cortex-X)與大核(Arm Cortex-A)的組合,以更高時(shí)鐘頻率提升性能和,同時(shí)降低功耗,延長(zhǎng)電池壽命。
    的頭像 發(fā)表于 05-06 10:22 ?530次閱讀

    智慧水務(wù)管理平臺(tái)-為污水處理的管理提供科學(xué)、精細(xì)的解決方案

    程瑜 安科瑞電氣股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水務(wù)管理平臺(tái) 1平臺(tái)概述 安科瑞電氣具備從終端感知、邊緣計(jì)算到管理平臺(tái)的產(chǎn)品*態(tài)體系,Acrel
    的頭像 發(fā)表于 04-18 15:50 ?371次閱讀
    智慧水務(wù)<b class='flag-5'>能</b><b class='flag-5'>效</b>管理平臺(tái)-為污水處理的<b class='flag-5'>能</b><b class='flag-5'>效</b>管理提供科學(xué)、精細(xì)的解決方案

    AI PC 2024年出貨占達(dá)18%,將實(shí)現(xiàn)重大轉(zhuǎn)變

    AI PC的獨(dú)特之處在于配備了神經(jīng)處理單元(NPU)等專業(yè)人工智能處理器,可提升生產(chǎn)效率、滿足個(gè)性化需求及提升,從而改變個(gè)人電腦市場(chǎng)格局
    的頭像 發(fā)表于 03-19 10:41 ?359次閱讀

    DC電源模塊的優(yōu)化探索與應(yīng)用

    DC電源模塊的優(yōu)化探索與應(yīng)用是一項(xiàng)重要的研究領(lǐng)域。優(yōu)化可以提高電源模塊的功率轉(zhuǎn)換效率,減少能源的浪費(fèi),降低電源模塊的發(fā)熱量,延長(zhǎng)其使用壽命。以下是一些
    的頭像 發(fā)表于 12-22 14:28 ?375次閱讀
    DC電源模塊的<b class='flag-5'>能</b><b class='flag-5'>效</b>優(yōu)化探索與應(yīng)用

    DC電源模塊的優(yōu)化探索與應(yīng)用

    BOSHIDA DC電源模塊的優(yōu)化探索與應(yīng)用 DC電源模塊的優(yōu)化探索與應(yīng)用是一項(xiàng)重要的研究領(lǐng)域。
    的頭像 發(fā)表于 12-22 11:16 ?373次閱讀
    DC電源模塊的<b class='flag-5'>能</b><b class='flag-5'>效</b>優(yōu)化探索與應(yīng)用

    Cadence為電動(dòng)汽車提升注入新動(dòng)力

    的增加或在續(xù)航不變的情況下配置更小更輕的電池。為了挖掘這一潛在提升帶來(lái)的獲益,就需要依賴于能在高工作電壓下穩(wěn)定工作的電子交換系統(tǒng)和電路板(PCB)。
    的頭像 發(fā)表于 12-18 12:25 ?1292次閱讀
    Cadence為電動(dòng)汽車<b class='flag-5'>能</b><b class='flag-5'>效</b><b class='flag-5'>提升</b>注入新動(dòng)力

    安科瑞企業(yè)微電網(wǎng)管理平臺(tái):提升能源效率的新利器

    企業(yè)微電網(wǎng)管理平臺(tái)作為提升企業(yè)能源效率的新利器,已在眾多行業(yè)中得到了廣泛應(yīng)用和驗(yàn)證。該平臺(tái)通過(guò)實(shí)時(shí)監(jiān)控、數(shù)據(jù)分析等技術(shù)手段,幫助企業(yè)全面了解能源設(shè)備的運(yùn)行狀態(tài)和能耗情況,優(yōu)化能源利用效率,降低
    的頭像 發(fā)表于 11-13 17:40 ?483次閱讀
    安科瑞企業(yè)微電網(wǎng)<b class='flag-5'>能</b><b class='flag-5'>效</b>管理平臺(tái):<b class='flag-5'>提升</b>能源效率的新利器

    安科瑞數(shù)據(jù)中心管理系統(tǒng):提升,降低運(yùn)營(yíng)成本

    數(shù)據(jù)中心管理系統(tǒng)是一套功能強(qiáng)大、應(yīng)用廣泛、優(yōu)勢(shì)明顯的管理解決方案。通過(guò)該系統(tǒng),數(shù)據(jù)中心可以實(shí)現(xiàn)對(duì)能源的精細(xì)化、智能化管理,提高能源利用效率,降低運(yùn)營(yíng)成本。隨著技術(shù)的不斷進(jìn)步和應(yīng)
    的頭像 發(fā)表于 11-07 15:57 ?501次閱讀
    安科瑞數(shù)據(jù)中心<b class='flag-5'>能</b><b class='flag-5'>效</b>管理系統(tǒng):<b class='flag-5'>提升</b><b class='flag-5'>能</b><b class='flag-5'>效</b>,降低運(yùn)營(yíng)成本

    家庭遠(yuǎn)程監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

    電子發(fā)燒友網(wǎng)站提供《家庭遠(yuǎn)程監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf》資料免費(fèi)下載
    發(fā)表于 10-31 11:30 ?0次下載
    家庭<b class='flag-5'>能</b><b class='flag-5'>效</b>遠(yuǎn)程監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)