0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TOPS 與現(xiàn)實世界的性能:AI 加速器的基準(zhǔn)性能

juju宇哥 ? 來源:juju宇哥 ? 作者:juju宇哥 ? 2022-07-14 17:17 ? 次閱讀

蓬勃發(fā)展的機器學(xué)習(xí)人工智能新興用例有望通過加速信息處理和提高決策準(zhǔn)確性為行業(yè)創(chuàng)造重大價值。但機器學(xué)習(xí)模型是計算密集型、需要高頻和實時 AI 分析場景,這導(dǎo)致企業(yè)依賴于使用每秒萬億次操作 (TOPS) 指標(biāo)的性能指導(dǎo)。TOPS 捕捉到“加速器在一秒鐘內(nèi)可以提供多少數(shù)學(xué)運算?” 比較和確定給定推理任務(wù)的最佳加速器。

雖然 TOPS 是一個“容易”計算的指標(biāo),但它通常無法為實際工作負(fù)載提供可靠的性能指標(biāo)。受限于加速器中乘法器和加法器的數(shù)量,該指標(biāo)無法考慮處理神經(jīng)網(wǎng)絡(luò)模型的計算硬件結(jié)構(gòu)。隨著數(shù)據(jù)網(wǎng)絡(luò)模型更快地處理數(shù)據(jù),企業(yè)如何通過更快、更可靠的決策進(jìn)行擴展,尤其是在邊緣?

在這篇文章中,我們將回顧 TOPS、它在測量延遲方面的挑戰(zhàn)以及它與現(xiàn)實世界的性能計算有何不同,并提供一種通過基準(zhǔn)測試來計算性能的替代方法,它提供了一種更可靠的方法來解釋計算硬件結(jié)構(gòu)。

TOPS 作為績效衡量標(biāo)準(zhǔn)的現(xiàn)實

TOPS 是一個簡化指標(biāo):它告訴您 AI 加速器在一秒鐘內(nèi)可以處理多少計算操作,并且利用率為 100%。本質(zhì)上,它著眼于加速器可以在很短的時間內(nèi)解決多少數(shù)學(xué)運算問題。

例如,如果一個 AI 加速器提供 5 TOPS,另一個提供 15 TOPS,則推斷后者比前者快三倍。但是,就像 CPU 速度的兆赫茲和千兆赫茲一樣,TOPS 也失去了確定整體計算機性能的相關(guān)性。隨著人們對 AI 應(yīng)用的興趣日益濃厚,最新的 AI 加速器可以比簡單的算術(shù)更快地處理數(shù)據(jù),并且更復(fù)雜。

然而,TOPS 很少準(zhǔn)確地捕捉到 AI 處理器在整個硬件設(shè)備中的重要性。如今,相機、邊緣服務(wù)器和計算機中的 AI 處理器通常是決定計算能力和能源效率的關(guān)鍵組件之一。事實上,TOPS 未能考慮到現(xiàn)實世界的工作量。通常,由于諸如空閑計算機單元等待來自內(nèi)存的數(shù)據(jù)、加速器不同部分之間的同步開銷和控制開銷等因素,實際性能可能會顯著低于 TOPS 值。根據(jù)加速器的架構(gòu)和工作負(fù)載特性,

更高的 TOPS 不等于更高的性能

雖然較高的 TOPS 值可以表示具有更多計算元素的更大 AI 加速器,但現(xiàn)實情況可能恰恰相反。更高的 TOPS 通常會導(dǎo)致更大的加速器具有更多的計算元素和內(nèi)存塊,以將數(shù)據(jù)饋送到這些計算單元,這會導(dǎo)致更高的成本和功耗。另一方面,高效的加速器使用較少數(shù)量的計算資源提供更高的性能,因此 TOPS 評級較低。最終,理想的 AI 加速器是使用低 TOPS 提供高性能的加速器。

TOPS 不包括所有計算類型

TOPS 指標(biāo)考慮了加速器的乘法器和加法器,這通常會導(dǎo)致性能指標(biāo)不準(zhǔn)確,因為加速器可以擁有除此之外的其他計算資源。例如,Kinara 的架構(gòu)采用歸約樹而不是加法器陣列,從而顯著降低能耗。由于在此計算中未捕獲歸約樹的計算能力,TOPS 指標(biāo)將不夠準(zhǔn)確。ResNet50、MobileNet V1 和 YOLO_v3 等標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)在比較不同的加速器時非常有用,因為它們也可以用作“猜測”給定加速器是否能夠滿足開發(fā)人員自身工作負(fù)載需求的代理。

推理延遲是評估 AI 加速器性能的指標(biāo)

對于在 Edge AI 上進(jìn)行投資的企業(yè),通過基準(zhǔn)測試計算性能提供了一種可靠的方法來計算計算硬件結(jié)構(gòu)與 TOPS。由于大多數(shù)實際應(yīng)用程序需要極快的推理時間,因此衡量性能的最佳方法是運行特定的工作負(fù)載,通常是 ResNet-50、EfficientDet、Transformer 或自定義模型,以了解加速器的效率。使用不同類型、大小、拓?fù)浜洼斎敕直媛实木W(wǎng)絡(luò)進(jìn)行實時處理,可以得出推理延遲度量。該指標(biāo)計算加速器完成一個特定 AI 模型的干擾的執(zhí)行時間。

隨著 AI 工作負(fù)載及其支持計算架構(gòu)的發(fā)展,通過準(zhǔn)確的性能測量確保其可預(yù)測性具有重大影響,可以引導(dǎo)開發(fā)人員做出更優(yōu)化的決策。通過使用推理延遲計算,它有助于處理和預(yù)測現(xiàn)代 AI 工作負(fù)載中的數(shù)據(jù)流,即使這些工作負(fù)載碎片化并且新架構(gòu)的發(fā)展導(dǎo)致更多的不可預(yù)測性。最終,基準(zhǔn)測試應(yīng)用程序提供了一種可信且更可靠的 TOPS 替代方案,而 AI 加速器支持更有效的評估。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    788

    瀏覽量

    37555
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29357

    瀏覽量

    267633
收藏 人收藏

    評論

    相關(guān)推薦

    SiFive發(fā)布MX系列高性能AI加速器IP

    AI技術(shù)日新月異的今天,RISC-V IP設(shè)計領(lǐng)域的領(lǐng)軍企業(yè)SiFive再次引領(lǐng)行業(yè)潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。這
    的頭像 發(fā)表于 09-24 14:46 ?253次閱讀

    TDA4 Edge AI處理性能和效率基準(zhǔn)測試

    電子發(fā)燒友網(wǎng)站提供《TDA4 Edge AI處理性能和效率基準(zhǔn)測試.pdf》資料免費下載
    發(fā)表于 09-11 09:21 ?0次下載
    TDA4 Edge <b class='flag-5'>AI</b>處理<b class='flag-5'>器</b>的<b class='flag-5'>性能</b>和效率<b class='flag-5'>基準(zhǔn)</b>測試

    刷新AI PC NPU算力,AMD銳龍AI 9 HX 375領(lǐng)銜55 TOPS

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)最近AMD官網(wǎng)上線了銳龍AI 300系列中的最新成員銳龍AI 9 HX 375處理。原本Ryzen AI 9 HX 370的NPU達(dá)到了50
    的頭像 發(fā)表于 08-07 00:28 ?3044次閱讀
    刷新<b class='flag-5'>AI</b> PC NPU算力,AMD銳龍<b class='flag-5'>AI</b> 9 HX 375領(lǐng)銜55 <b class='flag-5'>TOPS</b>

    NPU和AI TOPS是什么?它們有哪些性能?

    可運行AI模型的性能、準(zhǔn)確性和效率。如今,TOPS(每秒萬億次運算)是衡量處理AI性能的主要方
    的頭像 發(fā)表于 06-13 10:33 ?652次閱讀

    Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

    滿足更高性能和更復(fù)雜的 AI 工作負(fù)載。Ethos-U NPU系列是業(yè)界首款 AI加速器,英飛凌、恩智浦半導(dǎo)體、奇景光電 (Himax)、Alif Semiconductor 和
    的頭像 發(fā)表于 04-16 09:10 ?4416次閱讀
    Arm推動生成式<b class='flag-5'>AI</b>落地邊緣!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>支持Transformer 架構(gòu),<b class='flag-5'>性能</b>提升四倍

    Hitek Systems開發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求

    Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網(wǎng)絡(luò)、計算和高容量存儲應(yīng)用的需求。
    的頭像 發(fā)表于 03-22 14:02 ?511次閱讀
    Hitek Systems開發(fā)基于PCIe的高<b class='flag-5'>性能</b><b class='flag-5'>加速器</b>以滿足行業(yè)需求

    瑞薩發(fā)布下一代動態(tài)可重構(gòu)人工智能處理加速器

    瑞薩最新發(fā)布的動態(tài)可重構(gòu)人工智能處理(DRP-AI加速器,在業(yè)界引起了廣泛關(guān)注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳
    的頭像 發(fā)表于 03-08 13:45 ?649次閱讀

    瑞薩電子宣布推出一款面向高性能機器人應(yīng)用的新產(chǎn)品—RZ/V2H

    具有10TOPS/W能效的新一代AI加速器無需冷卻風(fēng)扇即可提供高達(dá)80TOPSAI推理性能
    的頭像 發(fā)表于 03-01 10:41 ?729次閱讀
    瑞薩電子宣布推出一款面向高<b class='flag-5'>性能</b>機器人應(yīng)用的新產(chǎn)品—RZ/V2H

    家居智能化,推動AI加速器的發(fā)展

    電子發(fā)燒友網(wǎng)報道(文/黃山明)AI加速芯片,也稱為人工智能加速器AI Accelerator),是一種專為執(zhí)行機器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計的ASIC或定制化處理
    的頭像 發(fā)表于 02-23 00:18 ?4465次閱讀

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強磁場中的運動。本文將詳細(xì)介紹回旋加速器的原理以及影響因素。 一、回旋
    的頭像 發(fā)表于 01-30 10:02 ?3271次閱讀

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一種重要的實驗設(shè)備,用于研究粒子物理學(xué)、核物理學(xué)等領(lǐng)域。其主要原理是通過電場和磁場的作用,對帶電粒子進(jìn)行加速,在高速運動過程中使其獲得較大的動
    的頭像 發(fā)表于 12-18 13:52 ?1847次閱讀

    英特爾Gaudi 3系列AI加速器明年上市

    英特爾總裁帕特·基辛格(Pat Gelsinger)認(rèn)為,鑒于英特爾Gaudi3具備的持續(xù)加強的性能優(yōu)勢和極具競爭性的TCO及定價機制,預(yù)測該產(chǎn)品有望在2024年憑借領(lǐng)先的AI加速器套件占據(jù)更大的市場份額。
    的頭像 發(fā)表于 12-15 11:07 ?719次閱讀

    PCIe在AI加速器中的作用

    從線上購物時的“猜你喜歡”、到高等級自動駕駛汽車上的實時交通信息接收,再到在線視頻游戲,所有的這些都離不開人工智能(AI加速器。AI加速器是一種高
    的頭像 發(fā)表于 11-18 10:36 ?1905次閱讀
    PCIe在<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>中的作用

    Hailo拓展Hailo-8人工智能加速器產(chǎn)品陣列,助力邊緣設(shè)備實現(xiàn)高性能人工智能

    摘要:新的Hailo-8 Century和Hailo-8L AI加速器通過廣泛的人工智能平臺擴展了Hailo-8產(chǎn)品陣列,可在入門級和高要求邊緣設(shè)備中實現(xiàn)高性能人工智能。 邊緣人工智能處理
    的頭像 發(fā)表于 11-07 10:16 ?478次閱讀

    低功耗下,高能效AI加速器如何設(shè)計?

    如果在數(shù)據(jù)中心和邊緣設(shè)備中部署上人工智能(AI加速器,那么它們將能夠快速處理PB級的數(shù)據(jù)量,還能幫助克服傳統(tǒng)的馮·諾依曼瓶頸。
    的頭像 發(fā)表于 10-26 09:18 ?1350次閱讀