0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NPU和AI TOPS是什么?它們有哪些性能?

高通中國 ? 來源:高通中國 ? 2024-06-13 10:33 ? 次閱讀

在當(dāng)今快速發(fā)展的技術(shù)環(huán)境中,AI正在變革各行各業(yè)并推動(dòng)創(chuàng)新,理解AI性能指標(biāo)的復(fù)雜性至關(guān)重要。過去許多AI模型需要在云端運(yùn)行。當(dāng)我們走向由終端側(cè)生成式AI處理定義的未來時(shí),我們必須能夠評(píng)估計(jì)算平臺(tái)可運(yùn)行AI模型的性能、準(zhǔn)確性和效率。如今,TOPS(每秒萬億次運(yùn)算)是衡量處理器AI性能的主要方式之一。TOPS是基于處理器所需的架構(gòu)和頻率,衡量處理器潛在AI推理峰值性能的方法,比如神經(jīng)網(wǎng)絡(luò)處理器(NPU)。下面我們將深入探討。

NPU是什么?

在深入探討TOPS的具體內(nèi)容之前,讓我們先看看NPU的重要性。對(duì)于終端側(cè)AI處理,NPU在提高效率、為個(gè)人用戶和企業(yè)提供創(chuàng)新的應(yīng)用體驗(yàn)方面發(fā)揮著關(guān)鍵作用。評(píng)估這些專用處理器的性能需要全面了解其能力背后的關(guān)鍵指標(biāo)。

NPU的演進(jìn)改變了人們處理計(jì)算的方式。傳統(tǒng)上,CPU負(fù)責(zé)執(zhí)行AI算法。隨著對(duì)處理性能的需求飆升,專用NPU應(yīng)運(yùn)而生,成為處理AI相關(guān)軟件應(yīng)用的專用解決方案。NPU旨在高效處理AI任務(wù)所需的復(fù)雜數(shù)學(xué)計(jì)算,提供出色的效率、性能和能效。

AI TOPS是什么?

TOPS作為展示處理器計(jì)算能力的指標(biāo),是衡量NPU性能的核心。

TOPS通過以萬億單位測(cè)量一秒鐘內(nèi)執(zhí)行的運(yùn)算(加法、乘法等)次數(shù)來量化NPU處理能力。

這種標(biāo)準(zhǔn)化測(cè)量方式非常明確地顯示了NPU的性能,可作為比較不同處理器和架構(gòu)AI性能的關(guān)鍵指標(biāo)。因?yàn)門OPS是針對(duì)NPU的基礎(chǔ)性能指標(biāo),探索TOPS的計(jì)算參數(shù)以及它們?nèi)绾螞Q定性能至關(guān)重要,這有助于更深入地了解NPU的能力。

乘法累加(MAC)運(yùn)算執(zhí)行AI工作負(fù)載中的核心數(shù)學(xué)公式。矩陣乘法由兩類基礎(chǔ)運(yùn)算組成:累加器的乘法和加法。例如,一個(gè)MAC單元可在每個(gè)時(shí)鐘周期內(nèi)運(yùn)行兩類基礎(chǔ)運(yùn)算各一次,意味著它在每個(gè)時(shí)鐘周期內(nèi)執(zhí)行兩個(gè)運(yùn)算。一個(gè)給定的NPU有一定數(shù)量的MAC單元,能夠在不同精度級(jí)別進(jìn)行運(yùn)算,這取決于NPU架構(gòu)。

頻率決定NPU及其MAC單元(以及CPU或GPU)運(yùn)算的時(shí)鐘速度(或每秒周期數(shù)),直接影響整體性能。更高的頻率允許在單位時(shí)間內(nèi)執(zhí)行更多運(yùn)算,從而提高處理速度。但是,提高頻率也會(huì)導(dǎo)致更高功耗和發(fā)熱,影響電池續(xù)航和用戶體驗(yàn)。處理器TOPS計(jì)算通常使用峰值運(yùn)行頻率。

精度指計(jì)算的顆粒度,通常精度越高模型準(zhǔn)確性就越高,需要的計(jì)算強(qiáng)度也越高。最常見的高精度AI模型為32位和16位浮點(diǎn)精度,而速度更快的低精度低功耗模型通常使用8位和4位整數(shù)精度。當(dāng)前行業(yè)標(biāo)準(zhǔn)為以INT8精度評(píng)估AI推理性能TOPS。

計(jì)算TOPS要從計(jì)算OPS開始,OPS等于MAC單元數(shù)乘以運(yùn)行頻率的兩倍。TOPS數(shù)量是OPS除以一萬億的值,將公式更簡單地列出,即TOPS = 2×MAC單元數(shù)×頻率/1萬億。

TOPS和實(shí)際性能

盡管TOPS提供了探索NPU能力的重要信息,我們?nèi)员仨殞⒗碚撝笜?biāo)和實(shí)際應(yīng)用聯(lián)系起來。畢竟,僅僅有高TOPS值并不能保證最佳的AI性能;各種因素協(xié)同作用的結(jié)果才能真正決定NPU實(shí)力。

因此評(píng)估NPU性能時(shí)要考慮內(nèi)存帶寬、軟件優(yōu)化和系統(tǒng)集成等方面的因素。基準(zhǔn)測(cè)試可以幫助我們超越數(shù)字,了解NPU在實(shí)際場(chǎng)景中的表現(xiàn),其中時(shí)延、吞吐量和能效尤為重要。

Procyon AI基準(zhǔn)測(cè)試使用真實(shí)工作負(fù)載來幫助將理論性的TOPS評(píng)估轉(zhuǎn)化為用戶在使用AI推理的真實(shí)應(yīng)用中對(duì)響應(yīng)和處理能力的預(yù)期。它以多個(gè)精度運(yùn)行六個(gè)模型,提供NPU不同性能表現(xiàn)的詳細(xì)洞察。類似模型在生產(chǎn)力、媒體、創(chuàng)作者和其他應(yīng)用中越來越常見。在Procyon AI和其他基準(zhǔn)測(cè)試中有更快的性能表現(xiàn),與實(shí)現(xiàn)更快推理和更好用戶體驗(yàn)息息相關(guān)。

為此,分析實(shí)際性能可以為NPU的能力和局限性提供寶貴洞察。必須從可行性和實(shí)用性角度檢驗(yàn)性能指標(biāo)。

未來NPU性能指標(biāo)

隨著技術(shù)不斷快速發(fā)展,數(shù)字化轉(zhuǎn)型需求持續(xù)影響各行各業(yè),NPU性能指標(biāo)格局將進(jìn)一步演進(jìn)。盡管新興趨勢(shì)正在更廣泛地定義和評(píng)估NPU性能與計(jì)算的方式,TOPS仍是很好的性能指標(biāo),將在很長一段時(shí)間內(nèi)繼續(xù)作為重要參考。

隨著各種AI新技術(shù)在未來幾年受到關(guān)注并重新定義無數(shù)行業(yè),對(duì)能夠反應(yīng)不同技術(shù)獨(dú)特特征的可靠性能指標(biāo)的需求將不斷凸顯。適應(yīng)性、可擴(kuò)展性和實(shí)際應(yīng)用相關(guān)性將定義未來的NPU性能指標(biāo)。

根據(jù)用戶需求評(píng)估NPU性能

應(yīng)對(duì)快速變化的NPU性能評(píng)估領(lǐng)域或許會(huì)讓人望而生畏,但隨著數(shù)字化轉(zhuǎn)型(尤其是在AI領(lǐng)域)持續(xù)快速發(fā)展,深入了解TOPS對(duì)行業(yè)和個(gè)人來說都很重要。

最終,選擇合適的系統(tǒng)級(jí)芯片(SoC)取決于用戶、客戶或組織的工作負(fù)載和優(yōu)先級(jí),而這一決策很可能需要取決于SoC中的NPU。

無論用戶是優(yōu)先考慮原始算力、能效還是模型準(zhǔn)確度,驍龍X系列平臺(tái)面向筆記本電腦,配備高達(dá)45TOPS的NPU,能夠強(qiáng)力賦能PC,并將實(shí)際可用的AI體驗(yàn)引入用戶的工作流程。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 高通
    +關(guān)注

    關(guān)注

    76

    文章

    7353

    瀏覽量

    190062
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29347

    瀏覽量

    267630
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    252

    瀏覽量

    18477

原文標(biāo)題:AI TOPS和NPU性能指標(biāo)指南

文章出處:【微信號(hào):Qualcomm_China,微信公眾號(hào):高通中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Lunar Lake:NPU性能全面提升,能耗也大幅降低,綜合AI算力提升至120TOPS

    英特爾CEO帕特·基辛格在COMPUTEX 2024上發(fā)表主題演講,正式公布了下一代面向AI PC的移動(dòng)處理器Lunar Lake,不僅CPU、GPU、NPU性能全面提升,能耗也大幅降低,綜合
    的頭像 發(fā)表于 06-05 15:54 ?8171次閱讀
    Lunar Lake:<b class='flag-5'>NPU</b><b class='flag-5'>性能</b>全面提升,能耗也大幅降低,綜合<b class='flag-5'>AI</b>算力提升至120<b class='flag-5'>TOPS</b>

    刷新AI PC NPU算力,AMD銳龍AI 9 HX 375領(lǐng)銜55 TOPS

    NPU性能第一梯隊(duì)。而此次推出的Ryzen AI 9 HX 375算力進(jìn)一步提升至55 TOPS。在NPU算力這條路上AMD甚是積極。 ?
    的頭像 發(fā)表于 08-07 00:28 ?3044次閱讀
    刷新<b class='flag-5'>AI</b> PC <b class='flag-5'>NPU</b>算力,AMD銳龍<b class='flag-5'>AI</b> 9 HX 375領(lǐng)銜55 <b class='flag-5'>TOPS</b>

    BananaPi BPI-M2S 是新設(shè)計(jì)的一款單板計(jì)算機(jī),采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲(chǔ)

    G52 MP4(6EE) GPU,NPU for AI 支持 5.0 TOPS算力,支持?jǐn)z像頭和MIPI-CSI接口,HDMI輸出,2個(gè)全千兆接口。板載4G內(nèi)存和16gb eMMC存儲(chǔ)
    發(fā)表于 09-30 12:41

    BananaPi BPI-M2S 采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲(chǔ)

    G52 MP4(6EE) GPU,NPU for AI 支持 5.0 TOPS算力,支持?jǐn)z像頭和MIPI-CSI接口,HDMI輸出,2個(gè)全千兆接口。板載4G內(nèi)存和16gb eMMC存儲(chǔ)
    發(fā)表于 09-30 14:37

    基于RKNN程序開發(fā)和模型轉(zhuǎn)換的NPU簡要說明

    /16bit 運(yùn)算,運(yùn)算性能高達(dá) 3.0TOPS。相較于 GPU 作為 AI 運(yùn)算單元的大型芯片方案,功耗不到 GPU 所需要的 1%。可直接加載 Caffe / Mxnet / TensorFlow 模型
    發(fā)表于 05-31 11:10

    AIO-3399ProC NPU開發(fā)相關(guān)資料推薦

    “USB3.0方式連接的NPU”,具體使用方法和注意事項(xiàng)請(qǐng)查看補(bǔ)丁注釋。注意:PCIE-NPU加速補(bǔ)丁默認(rèn)沒有啟用,具體啟用方法和注意事項(xiàng)請(qǐng)查看補(bǔ)丁注釋。NPU特性支持 8bit/16bit 運(yùn)算,運(yùn)算
    發(fā)表于 07-01 17:38

    恩智浦最新的應(yīng)用處理器 i.MX 95采用專有NPU IP進(jìn)行片上AI加速

    恩智浦最新的應(yīng)用處理器 i.MX 95 使用恩智浦專有的 NPU IP 進(jìn)行片上 AI 加速,這與之前使用第三方 IP 的 i.MX 系列產(chǎn)品有所不同。實(shí)際上,越來越多的嵌入式處理器公司正在使用自己
    發(fā)表于 02-16 11:20

    瑞芯微首款AI芯片RK3399Pro:NPU性能達(dá)2.4TOPs!

    NPU性能達(dá)2.4TOPs! 首先在CES 2018年消費(fèi)電子展前夜,瑞芯微就宣布,向全球正式推出旗下首款性能超強(qiáng)的AI處理器RK3399
    發(fā)表于 01-11 01:53 ?5184次閱讀
    瑞芯微首款<b class='flag-5'>AI</b>芯片RK3399Pro:<b class='flag-5'>NPU</b><b class='flag-5'>性能</b>達(dá)2.4<b class='flag-5'>TOPs</b>!

    TOPS 與現(xiàn)實(shí)世界的性能AI 加速器的基準(zhǔn)性能

    蓬勃發(fā)展的機(jī)器學(xué)習(xí)和人工智能新興用例有望通過加速信息處理和提高決策準(zhǔn)確性為行業(yè)創(chuàng)造重大價(jià)值。但機(jī)器學(xué)習(xí)模型是計(jì)算密集型、需要高頻和實(shí)時(shí) AI 分析場(chǎng)景,這導(dǎo)致企業(yè)依賴于使用每秒萬億次操作 (TOPS
    的頭像 發(fā)表于 07-14 17:17 ?1790次閱讀

    BananaPi BPI-M2S 采用Amlogic A311D開發(fā)的AI開發(fā)板,NPU AI 支持 5.0 TOPS算力,

    BananaPi BPI-M2S 是香蕉派開源社區(qū)新設(shè)計(jì)的一款單板計(jì)算機(jī),采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲(chǔ)
    的頭像 發(fā)表于 08-22 16:00 ?972次閱讀
    BananaPi BPI-M2S 采用Amlogic A311D開發(fā)的<b class='flag-5'>AI</b>開發(fā)板,<b class='flag-5'>NPU</b> <b class='flag-5'>AI</b> 支持 5.0 <b class='flag-5'>TOPS</b>算力,

    npu是什么意思?npu芯片是什么意思?npu到底什么用?

    npu是什么意思?npu芯片是什么意思?npu到底什么用?? NPU的概念 NPU(Neura
    的頭像 發(fā)表于 08-27 17:03 ?4.1w次閱讀

    驍龍X Elite處理器在AI生成圖片性能超群,英特爾亦被超越

    高通公司稱,該款處理器內(nèi)置AI協(xié)處理器(NPU),性能達(dá)到驚人的45 TOPS(每秒萬億次運(yùn)算)。視頻通過實(shí)例對(duì)比英特爾酷睿 Ultra 7同樣具有
    的頭像 發(fā)表于 02-28 14:09 ?636次閱讀

    AI PC市場(chǎng)爭霸:英特爾、AMD、高通芯片算力誰主沉???

    目前英特爾的Meteor Lake處理器NPU只能提供10 TOPS性能,沒有達(dá)到下一代AI PC的標(biāo)準(zhǔn)。而 Lunar Lake 的 NPU
    發(fā)表于 04-18 14:29 ?347次閱讀

    AI PC引發(fā)的NPU大戰(zhàn)?英特爾:僅30%開發(fā)者選擇NPU

    隨著COMPUTEX 2024的日益臨近,關(guān)于人工智能(AI)個(gè)人計(jì)算機(jī)(PC)的話題開始變得愈發(fā)熱門和受關(guān)注。據(jù)微軟公司近期發(fā)布的相關(guān)技術(shù)規(guī)范要求,所有運(yùn)行Windows操作系統(tǒng)的AI PC必須配備本地運(yùn)行Copilot的功能機(jī)制,并安裝容量至少為40
    的頭像 發(fā)表于 06-03 17:24 ?792次閱讀

    40+TOPS NPU,AI PC處理器開卷算力

    的人工智能任務(wù)。同時(shí),微軟還提出,這款全新電腦搭配擁有全新神經(jīng)處理單元NPU的芯片,可實(shí)現(xiàn)每秒超過40萬億次即40+TOPS的運(yùn)算。那么也就是說,若要符合微軟給出的AI PC的定義,NPU
    的頭像 發(fā)表于 07-14 01:11 ?4108次閱讀
    40+<b class='flag-5'>TOPS</b> <b class='flag-5'>NPU</b>,<b class='flag-5'>AI</b> PC處理器開卷算力