0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你知道TinyML運行效能誰說了算嗎?

jf_cVC5iyAO ? 來源:易心Microbit編程 ? 2023-08-03 16:06 ? 次閱讀

AI芯片或神經(jīng)加速處理器(Neural Network Processing Unit, NPU或Deep Learning Accelerator, DLA)領(lǐng)域中,大家也都說自家的芯片世界最棒,對手看不到車尾燈,難道沒有一個較為公正衡量芯片運行(推論)效能,就像手機(jī)跑分軟件一樣,讓大家比較信服的基準(zhǔn)嗎?

其實在AI芯片領(lǐng)域中所謂的「效能」,可能因關(guān)心的重點不同而會有不同定義和解讀。分別可從硬件每秒可執(zhí)行乘加的次數(shù)(又可細(xì)分FP32,FP16及INT8等)、對于特定模型在指定推論精度下每秒可執(zhí)行次數(shù)或推論一次所需時間(包含有無模型優(yōu)化處理)、特定模型推論功耗(推論一次耗費焦耳數(shù))、每瓦特可執(zhí)行乘加指令次數(shù)及其它特定規(guī)范時的表現(xiàn),甚至有用每塊美金獲得算力來當(dāng)成基準(zhǔn)。所以常會遇到誰也不服誰,老王賣瓜自賣自夸的現(xiàn)象。

目前較被大家接受的就是ML Commons所提出的MLPerf規(guī)范,其中包含訓(xùn)練及推論兩大項,而推論部份又可細(xì)分為數(shù)據(jù)中心(Datacenter)、邊緣(Edge)、行動(Mobile)及微型(Tiny,大多為MCU)。前不久(2023/6/27)才剛公布了Tiny v1.1測試結(jié)果報告,接下來就幫大家解讀一下這份報告,讓大家能更了解未來單芯片運行AI的方向及可行性。

評測場景及項目

目前ML Commons在Tiny部份先前已經(jīng)過三輪(v0.5, v0.7, v1.0)測試,此次公布的是v1.1結(jié)果。測試時分為封閉(Closed)及開放(Open)型式,前者依官方規(guī)范測,而后者廠商可提出依自己規(guī)范測試更優(yōu)的結(jié)果,不過不是每輪評測都會有開放型式。

目前主要評測項目如Fig.1 所示,共有四個項目,包含關(guān)鍵詞偵測(Keyword Spoting, KS)、視覺喚醒字(Visual Wake Words, VW)、影像分類(Image Classification, IC)及異常偵測(Anomaly Detection, AD)。而每個項目都是采單串流數(shù)據(jù)(Single Stream)方式進(jìn)行,即推論完一筆再取下一筆進(jìn)行推論。依照不同項目,分別使用對應(yīng)的數(shù)據(jù)集和模型,并在指定的推論質(zhì)量下進(jìn)行評量。

wKgZomTLYEaANXFwAAFCAFJOc0s385.jpg

Fig.1 MLPerf v1.1 工作場景及效能評量項目

參與評測公司、硬件及軟件

本次參與評測的項目共有32項,以下依不同項目分別介紹。

參與評測公司:共有10家,Krai, Nuvoton(新唐科技), STMicroelectronics(簡稱STM), Skymizer(臺灣發(fā)展軟件科技), cTuning, fpgaconvnet, Plumerai, Syntiant, Robert Bosh GmbH, kai-jiang(個人)。

參與評測開發(fā)板:共有14種,規(guī)格下如下所示。

STM NUCLEO-H7A3ZI-Q, Arm Cortex-M7(DSP+FPU) @280MHz

STM NUCLEO-L4R5ZI, Arm Cortex-M4(DSP+FPU) @120MHz

STM NUCLEO-U575ZI-Q, Arm Cortex-M33(DSP+FPU) @160MHz

STM NUCLEO-G0B1RE, Arm Cortex-M0+ @64MHz

STM DISCO-F746NG, Arm Cortex-M7(DSP+FPU) @216MHz

Nordic nRF5340 DK, Arm Cortex-M33(DSP+FPU) @128MHz

Nuvoton NUMAKER-M467HJ, Arm Cortex-M4F @200MHz

DIGILENT Cora Z7, Arm Cortex-A9 @667MHz

DIGILENT ZC706, Arm Cortex-A9 @650MHz

DIGILENT ZedBoard, Arm Cortex-A9 @650MHz

DIGILENT ZyBo, Arm Cortex-A9 @650MHz

Infineon CY8CPROTO-062-4343W, Arm Cortex-M4 (DSP + FPU) @150MHz

Syntiant NDP9120, HiFi3+M0 @30.7MHz/98.7MHz

ZCU106, RISC-V @20MHz

主要CPU規(guī)格:共有7大類。只有1項使用RISC-V,1項為MCU+NPU,其余皆是Arm Based。Cortex-M為單芯片(MCU)等級,Cortex-A為微處理器(MPU)等級芯片,用于手機(jī)或單板微電腦。

Arm Cortex-M0+ (1項)

Arm Cortex-M33 (4項)

Arm Cortex-M4/M4F (13項)

Arm Cortex-M7 (7項)

Arm Cortex-A9 (4項)

Syntiant HiFi3+M0 (2項)

RISC-V (1項)

主要軟件及函式庫:共有9種。

Skymizer ONNC

MicroTVM

Plumerai Inference Engine

Syntiant TDK+SDK

Bosch Hardware-Aware Lowering Engine(HALE)

STM X-CUBE-AI

fpgaConvNet(Model+Optimiser)

Arm CMSIS-5

TVM

評測結(jié)果:

由于芯片等級落差頗大,單從推論時間(毫秒ms)及能耗(微焦耳uJ 比較可能會有點不公平,所以這里依CPU等級及工作頻率來分會更清楚些。Fig. 2分別列出各等級中推論速度表現(xiàn)最好的。

wKgaomTLYEaAHbHTAAP1WwqQPI8795.jpg

Fig.2 MLPerf Tiny v1.1各等級CPU及不同應(yīng)用表現(xiàn)最佳清單。

另外從此次提交的項目亦可看出Arm Cortex-M4已成為TinyML的主流,若推論仍不夠快時,則可再提升到Cortex-M7。而新上市的Cortex-M33效能已高過Cortex-M4,略低于Cortex-M7,讓使用者有多一點性價比的選擇空間。

小結(jié)

在邊緣智能(Edge AI)裝置及智能物聯(lián)網(wǎng)(AIoT)應(yīng)用中使用單芯片(MCU)來運行AI(TinyML)已是現(xiàn)在進(jìn)行式,透過此次的評比結(jié)果,可讓大家更了解各家芯片性能及模型優(yōu)化工具的進(jìn)展,未來隨著MCU+NPU的普及,相信下一次的評比結(jié)果可能就有更大躍升,就讓大家一起期待吧!



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM處理器
    +關(guān)注

    關(guān)注

    6

    文章

    360

    瀏覽量

    41597
  • MPU
    MPU
    +關(guān)注

    關(guān)注

    0

    文章

    334

    瀏覽量

    48663
  • Cortex-M4
    +關(guān)注

    關(guān)注

    6

    文章

    89

    瀏覽量

    46472
  • 加速處理器
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    6434
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1844

    瀏覽量

    34792

原文標(biāo)題:TinyML (MCU AI) 運行效能誰說了算?

文章出處:【微信號:易心Microbit編程,微信公眾號:易心Microbit編程】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    知道影響貼片電感發(fā)熱的因素有哪些嗎?

    知道影響貼片電感發(fā)熱的因素有哪些嗎?
    的頭像 發(fā)表于 08-17 14:24 ?264次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>影響貼片電感發(fā)熱的因素有哪些嗎?

    知道貼片電感故障時可能出現(xiàn)的癥狀嗎?

    知道貼片電感故障時可能出現(xiàn)的癥狀嗎?
    的頭像 發(fā)表于 08-17 14:20 ?226次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>貼片電感故障時可能出現(xiàn)的癥狀嗎?

    全新Linux環(huán)境PCAN驅(qū)動程序發(fā)布!CAN/CAN FD通信體驗全面升級!

    ”。想要體驗字符模式設(shè)備驅(qū)動接口(chardev)的便捷,還是SocketCAN設(shè)備驅(qū)動接口(netdev)的高效?都由您說了算
    的頭像 發(fā)表于 04-19 10:38 ?790次閱讀

    知道激光鉆孔技術(shù)有多牛嗎?看完這篇文章就明白了

    知道激光鉆孔技術(shù)有多牛嗎?看完這篇文章就明白了
    的頭像 發(fā)表于 02-29 17:09 ?738次閱讀

    弘信電子與AI力服務(wù)器合資,助力國產(chǎn)力芯片落地

    此外,弘信電子近期在AI力業(yè)務(wù)上取得了突破性進(jìn)展,這并非源自本土化的積累,而是依賴于團(tuán)隊敏銳的戰(zhàn)略眼光和強烈的創(chuàng)新動力。此次投資是弘信電子在AI力領(lǐng)域布局的關(guān)鍵步驟,通過整合各方力量,效能勢必提高,利潤實現(xiàn)最大化。
    的頭像 發(fā)表于 12-25 09:30 ?714次閱讀

    【先楫HPM5361EVK開發(fā)板試用體驗】:4、TinyML測試(1)

    1、TinyML簡介 TinyML是指在邊緣設(shè)備上運行的機(jī)器學(xué)習(xí)模型,通常是在資源受限的嵌入式系統(tǒng)上運行的輕量級模型。這些設(shè)備可以是智能手機(jī)、傳感器、微控制器或其他嵌入式設(shè)備。
    發(fā)表于 12-22 10:12

    揭秘pcb是什么物質(zhì):知道的“化學(xué)戰(zhàn)士”

    揭秘pcb是什么物質(zhì):知道的“化學(xué)戰(zhàn)士”
    的頭像 發(fā)表于 12-14 10:27 ?873次閱讀

    運算放大器的種類都有哪些?知道嗎?

    運算放大器的種類都有哪些?知道嗎?
    的頭像 發(fā)表于 12-13 15:14 ?691次閱讀
    運算放大器的種類都有哪些?<b class='flag-5'>你</b><b class='flag-5'>知道</b>嗎?

    人工智能時代何時到來?這個問題誰說了”?

    不過,與機(jī)械時代工具的改良類似,隨著算籌的軟件,也就是運算法則的發(fā)展越來越快,算籌的硬件,也就是“籌”雖然也一直在改進(jìn),但終究跟不上算法的進(jìn)展,最終被更為方便的算盤取代了。
    的頭像 發(fā)表于 12-10 16:29 ?1217次閱讀

    5大高精密多層pcb的特點知道

    5大高精密多層pcb的特點知道
    的頭像 發(fā)表于 12-08 16:10 ?798次閱讀

    電阻的秘密——必須知道的電阻參數(shù)

    電阻的秘密——必須知道的電阻參數(shù)
    的頭像 發(fā)表于 12-06 14:31 ?754次閱讀
    電阻的秘密——<b class='flag-5'>你</b>必須<b class='flag-5'>知道</b>的電阻參數(shù)

    知道pcb電路板怎么刪除覆銅嗎?

    知道pcb電路板怎么刪除覆銅嗎?
    的頭像 發(fā)表于 11-30 16:33 ?1813次閱讀

    知道smt排阻有無方向性嗎?

    知道smt排阻有無方向性嗎?
    的頭像 發(fā)表于 11-28 15:23 ?1158次閱讀

    能想象嗎,傳輸線能控到多少阻抗還要看隔壁信號線的臉色?

    的事情,是差一二十歐姆哦! 所以說,遇到這種旁邊也是信號線的場景,自己的阻抗就由不得說了算了,自己是多少歐姆的阻抗就很看旁邊走線的“心情”了,旁邊信號跑的碼型和狀態(tài)對
    發(fā)表于 11-02 14:00

    無源與有源器件的這些區(qū)別知道嗎?

    無源與有源器件的這些區(qū)別知道嗎?
    的頭像 發(fā)表于 10-26 15:27 ?4608次閱讀
    無源與有源器件的這些區(qū)別<b class='flag-5'>你</b>都<b class='flag-5'>知道</b>嗎?