0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何透過(guò)數(shù)字直剖本質(zhì)評(píng)估AI芯片的真實(shí)性能?

地平線HorizonRobotics ? 來(lái)源:地平線HorizonRobotics ? 作者:地平線HorizonRobot ? 2021-05-03 18:11 ? 次閱讀

特斯拉 Hardware 3.0 的效率之謎

特斯拉在其推出的 Hardware 3.0 自動(dòng)駕駛平臺(tái)中,采用自研芯片替代了Nvidia Drive PX2,其理論算力直線提升了 3 倍,而以 MAPS 方式來(lái)評(píng)估,其真實(shí) AI 性能更是驚人的提升了 21 倍。具體而言,Hardware 2.0 時(shí)每秒只能處理 110 幀圖像,而現(xiàn)在則高達(dá) 2300 幀。

那么,Hardware 的效率提升應(yīng)該如何認(rèn)識(shí)呢?在“算力至上”的今天,如何透過(guò)數(shù)字直剖本質(zhì)評(píng)估 AI 芯片的真實(shí)性能?

算力攀升,為什么卻看不到實(shí)用性?

隨著芯片制程技術(shù)的演進(jìn),摩爾定律的發(fā)展卻逐漸進(jìn)入瓶頸期,這與當(dāng)下計(jì)算 AI 計(jì)算需求量爆發(fā)式的增長(zhǎng)顯得格格不入。追求純算力突破并不可持續(xù),同時(shí)算力也并不代表汽車智能芯片“真實(shí)性能”,芯片計(jì)算效率也同樣需要關(guān)注。于是,軟硬結(jié)合、算法加持的 AI 芯片接過(guò)了跑贏新場(chǎng)景的接力棒。

當(dāng)前,行業(yè)普遍以“TOPS”為單位來(lái)評(píng)估AI的理論峰值算力。盡管在目前主流的AI芯片性能基準(zhǔn)測(cè)試( MLPerf )下很多頂級(jí)廠商頻繁刷新榜單記錄,但在實(shí)際場(chǎng)景下的算力有效利用率卻差強(qiáng)人意。

2b80db88-9572-11eb-8b86-12bb97331649.png

人們逐漸認(rèn)識(shí)到,AI 芯片理論峰值算力并不一定能在實(shí)際運(yùn)行中完全釋放。例如,一款擁有理論峰值算力為 16 TOPS 的芯片,在計(jì)算不同模型時(shí)甚至?xí)薪咏?80% 的差異。此外,在卷積神經(jīng)網(wǎng)絡(luò)任務(wù)實(shí)測(cè)中,從 2014 年到 2019 年,最好的神經(jīng)網(wǎng)絡(luò)計(jì)算效率相差了 100 倍,相當(dāng)于計(jì)算效率每 9 個(gè)月翻一倍,遠(yuǎn)快于每 18 個(gè)月翻倍的摩爾定律。因此在模型算法演進(jìn)速度遠(yuǎn)快于芯片性能提升的速度的現(xiàn)在,不僅需要算力更高的芯片,也需要更合理的性能評(píng)估方法幫助用戶選擇適合的 AI 芯片。

對(duì)這些 AI 時(shí)代出現(xiàn)的新變化,以地平線為代表的 AI 芯片企業(yè)認(rèn)為,單純依賴于 PPA 芯片設(shè)計(jì)指標(biāo),很容易陷入算力至上的“誤區(qū)”,但算力并不是完全反應(yīng)芯片性能唯一評(píng)估標(biāo)準(zhǔn)。因此,地平線提出了 MAPS(Mean Accuracy-guaranteed Processing Speed)概念和評(píng)估方法,以此作為檢驗(yàn) AI 性能的真正標(biāo)準(zhǔn)。通俗來(lái)說(shuō),就是在特定的 AI 應(yīng)用領(lǐng)域,看芯片處理 AI 任務(wù)的速度和精度,即“多快”和“多準(zhǔn)”。

MAPS 動(dòng)態(tài)評(píng)估芯片真實(shí) AI 性能

隨著 AI 算法的不斷演進(jìn),幾乎每 10-14 個(gè)月,相同的計(jì)算精度計(jì)算量可以下降一半。這種提升與算法設(shè)計(jì)的精妙程度息息相關(guān),但算法的快速演進(jìn)也對(duì)計(jì)算架構(gòu)提出巨大的挑戰(zhàn),尤其是對(duì)傳統(tǒng)通用的并行架構(gòu)而言,例如亟需高效AI專用處理器的自動(dòng)駕駛場(chǎng)景。

MAPS 其實(shí)是在物理算力的基礎(chǔ)上,通過(guò)對(duì)大量模型的測(cè)試,綜合各個(gè)模型的速度(正比與物理算力*實(shí)際利用率)和準(zhǔn)確率得到的最佳方案的量化結(jié)果。它更聚焦于使用戶能夠通過(guò)可視化的圖表直觀的感知 AI 芯片真實(shí)算力。正如對(duì)于汽車來(lái)說(shuō),馬力(單位: HP)不如百公里加速時(shí)間(單位:秒)更真實(shí)反映整車動(dòng)力性能;算力(單位: TOPS)并不反映汽車智能芯片實(shí)際性能,而每秒準(zhǔn)確識(shí)別幀率 MAPS(單位: FPS)才是更真實(shí)的性能指標(biāo)。

2bb9df64-9572-11eb-8b86-12bb97331649.png

MAPS=最佳模型多邊形面積/(精度上界—精度下界),其中橫軸反應(yīng)幀率,縱軸反應(yīng)精度

此外,在自動(dòng)駕駛中應(yīng)該如何對(duì)速度和精度做取舍呢?現(xiàn)實(shí)生活中我們經(jīng)常遇到一些極端的案例,例如當(dāng)汽車遭遇小孩子橫穿馬路的突發(fā)狀況時(shí),如果自動(dòng)駕駛識(shí)別延時(shí)過(guò)高,會(huì)剎車不及時(shí);如果精度不夠,則會(huì)造成無(wú)法識(shí)別。在很多類似的場(chǎng)景中,我們往往面臨既要“快”,又要兼顧“準(zhǔn)”的境況。而在 MAPS 評(píng)估方法下,我們可以清晰看到幀率和精度之間的動(dòng)態(tài)關(guān)系,這也是其對(duì)實(shí)際場(chǎng)景的重要價(jià)值之一。

更高級(jí)別自動(dòng)駕駛需要多少“FPS”?

軟件定義的汽車的趨勢(shì)下,未來(lái)汽車正逐步成為四個(gè)輪子上的超級(jí)計(jì)算機(jī)??梢郧逦A(yù)見(jiàn)的是,電動(dòng)車賣點(diǎn)不是車,而是「智能」,這是一個(gè)堪比計(jì)算機(jī)誕生級(jí)別的創(chuàng)新。

特斯拉在 Hardware 3.0 中,采用其自研 AI 芯片 FSD Chip 替代了 Hardware 2.5 中的 Nvidia Drive PX2,算力從 24 TOPS 提升到了 72 TOPS,但運(yùn)行同樣模型的精度卻驚人的提升了 21 倍。具體而言,Hardware 2.0 時(shí)每秒只能處理 110 幀圖像,而現(xiàn)在則高達(dá) 2300 幀。除了絕對(duì)算力的提升,額外提升則來(lái)自于利用率的提升。同時(shí)特斯拉也宣布針對(duì) Hardware 3.0 重寫自動(dòng)駕駛軟件,從而在 2020 年 10 月推出了 FSD beta,這是唯一不受場(chǎng)地限制、大規(guī)模測(cè)試的自動(dòng)駕駛方案。

特斯拉革命性技術(shù)的重構(gòu)與 MAPS背后體現(xiàn)的理念有相通之處:提升物理算力(HW 3.0 提升 3 倍)、提升利用率(提升近 2 倍),找到最佳的速度和準(zhǔn)確率提升(重寫自動(dòng)駕駛軟件),使得特斯拉從簡(jiǎn)單場(chǎng)景的 NOA 一步步突破到不受限的自動(dòng)駕駛。而地平線在芯片設(shè)計(jì)之中一直貫徹 MAPS 背后的技術(shù)理念,關(guān)注提升物理算力的同時(shí)關(guān)注利用率的提升,并且不斷把算法發(fā)展趨勢(shì),使得軟硬件可以協(xié)同共振,發(fā)揮最高效能。

為了助力汽車廠商突破“特斯拉困境”,實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛的落地。地平線即將推出的征程 5 MAPS 整體跑分高達(dá) 3020 FPS,其中 MAPS@COCO (檢測(cè)任務(wù)COCO MAPS) 跑分可高達(dá) 116,而 Nvidia Xavier MAPS@COCO 為 41 FPS (GPU&DLA@32W mode ),如此高的性能將助力車廠加速實(shí)現(xiàn)自動(dòng)駕駛方案的落地。

驅(qū)動(dòng)新基建數(shù)字底座,需要有算力也要有效率。自成立以來(lái),地平線便致力于兼?zhèn)渌懔εc效率的高性能芯片。未來(lái),地平線將推出性能更強(qiáng)大的征程6,其不僅在功耗、面積優(yōu)化的基礎(chǔ)上,同時(shí)在MAPS上繼續(xù)提升一個(gè)數(shù)量級(jí),助力全行業(yè)共同努力進(jìn)一步大幅提升自動(dòng)駕駛的安全性。

原文標(biāo)題:不看算力看效率,更高級(jí)別的自動(dòng)駕駛需要多少 “FPS”?

文章出處:【微信公眾號(hào):地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 特斯拉
    +關(guān)注

    關(guān)注

    66

    文章

    6265

    瀏覽量

    126369
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29438

    瀏覽量

    267759
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    782

    文章

    13550

    瀏覽量

    165776

原文標(biāo)題:不看算力看效率,更高級(jí)別的自動(dòng)駕駛需要多少 “FPS”?

文章出處:【微信號(hào):horizonrobotics,微信公眾號(hào):地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    2.5D/3D封裝技術(shù)升級(jí),拉高AI芯片性能天花板

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)一以來(lái),提升芯片性能主要依靠先進(jìn)制程的突破。但現(xiàn)在,人工智能對(duì)算力的需求,將芯片封裝技術(shù)的重要性提升至前所未有的高度。為了提升
    的頭像 發(fā)表于 07-11 01:12 ?6275次閱讀

    如何評(píng)估AI大模型的效果

    評(píng)估AI大模型的效果是一個(gè)復(fù)雜且多維度的過(guò)程,涉及多個(gè)方面的考量。以下是一些關(guān)鍵的評(píng)估方法和步驟: 一、基準(zhǔn)測(cè)試(Benchmarking) 使用標(biāo)準(zhǔn)數(shù)據(jù)集和任務(wù)來(lái)評(píng)估模型的
    的頭像 發(fā)表于 10-23 15:21 ?136次閱讀

    光學(xué)透過(guò)率測(cè)量?jī)x的技術(shù)原理和應(yīng)用場(chǎng)景

    :在建筑行業(yè)中,光學(xué)透過(guò)率測(cè)量?jī)x被用于測(cè)試建筑材料(如窗戶、天窗和其他透明部件)的透明度,以確保它們符合質(zhì)量和性能標(biāo)準(zhǔn)。這對(duì)于需要控制光線進(jìn)入量的建筑物尤為重要,如展覽館、圖書館等。此外,它還
    發(fā)表于 10-16 14:38

    天璣9400權(quán)威測(cè)試AI性能跑分第一,領(lǐng)跑行業(yè)

    的技術(shù),一在端側(cè)AI領(lǐng)域穩(wěn)步前進(jìn),持續(xù)拓展AI能力及生態(tài)系統(tǒng)。NPU性能稱霸,以最強(qiáng)端側(cè)AI構(gòu)筑“智能體化”堅(jiān)實(shí)基底首先看天璣9400的
    的頭像 發(fā)表于 10-14 14:57 ?272次閱讀
    天璣9400權(quán)威測(cè)試<b class='flag-5'>AI</b><b class='flag-5'>性能</b>跑分第一,領(lǐng)跑行業(yè)

    過(guò)數(shù)字隔離器將SPI轉(zhuǎn)換為GPIO

    電子發(fā)燒友網(wǎng)站提供《通過(guò)數(shù)字隔離器將SPI轉(zhuǎn)換為GPIO.pdf》資料免費(fèi)下載
    發(fā)表于 09-21 10:20 ?0次下載
    通<b class='flag-5'>過(guò)數(shù)字</b>隔離器將SPI轉(zhuǎn)換為GPIO

    3D DRAM內(nèi)嵌AI芯片,AI計(jì)算性能暴增

    當(dāng)前高帶寬內(nèi)存(HBM)中的DRAM芯片,通過(guò)在3D DRAM中實(shí)現(xiàn)AI處理來(lái)解決數(shù)據(jù)總線問(wèn)題。 ? 通常來(lái)說(shuō),當(dāng)前的 AI芯片架構(gòu)將數(shù)據(jù)存儲(chǔ)在高帶寬內(nèi)存中,并通
    的頭像 發(fā)表于 08-16 00:08 ?3035次閱讀
    3D DRAM內(nèi)嵌<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,<b class='flag-5'>AI</b>計(jì)算<b class='flag-5'>性能</b>暴增

    AI芯片哪里買?

    AI芯片
    芯廣場(chǎng)
    發(fā)布于 :2024年05月31日 16:58:19

    知存科技助力AI應(yīng)用落地:WTMDK2101-ZT1評(píng)估板實(shí)地評(píng)測(cè)與性能揭秘

    資料后博主自己總結(jié):存內(nèi)計(jì)算技術(shù)的發(fā)展對(duì)于提高計(jì)算設(shè)備的整體性能、降低能耗并改善數(shù)據(jù)處理效率具有重要意義。值得一提的是,我國(guó)知存科技推出的 WTM2101 芯片即采用存內(nèi)計(jì)算這種方式。 近存計(jì)算和存內(nèi)
    發(fā)表于 05-16 16:38

    risc-v多核芯片AI方面的應(yīng)用

    得RISC-V多核芯片能夠更好地適應(yīng)AI算法的不同需求,包括深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等,從而提高芯片性能和效率,降低成本,使AI邊緣計(jì)算晶片更具
    發(fā)表于 04-28 09:20

    英偉達(dá)將用AI設(shè)計(jì)AI芯片

    AI芯片行業(yè)資訊
    深圳市浮思特科技有限公司
    發(fā)布于 :2024年02月19日 17:54:43

    數(shù)字功放推薦-家庭影院常用的數(shù)字功放芯片

    隨著科技的不斷發(fā)展,數(shù)字功放芯片在家庭影院領(lǐng)域的應(yīng)用越來(lái)越廣泛;作為家庭影院的核心組件之一,其性能和質(zhì)量對(duì)家庭影院的音質(zhì)和畫質(zhì)有著至關(guān)重要的影響;其高效、穩(wěn)定、音質(zhì)優(yōu)良等特點(diǎn),為家庭影院帶來(lái)了更加
    的頭像 發(fā)表于 01-26 11:15 ?1499次閱讀

    IBM的新型模擬內(nèi)存芯片能否證明AI操作的性能和能源效率呢?

    IBM 的新型模擬內(nèi)存芯片證明了 AI 操作的性能和能源效率都是可能的。
    的頭像 發(fā)表于 12-18 10:09 ?614次閱讀

    電阻上的數(shù)字是什么意思?如何通過(guò)數(shù)字辨別電阻值?

    電阻上的數(shù)字是什么意思?如何通過(guò)數(shù)字辨別電阻值? 電阻是電子元件中常見(jiàn)的一種,它用于控制電流的流動(dòng),限制電路中的電流大小。而電阻上的數(shù)字則是用來(lái)標(biāo)示電阻的阻值的。阻值是電阻對(duì)電流的阻礙程度的度量
    的頭像 發(fā)表于 12-07 13:53 ?4441次閱讀

    數(shù)字隔離器可應(yīng)用在本質(zhì)安全應(yīng)用中

    電子發(fā)燒友網(wǎng)站提供《數(shù)字隔離器可應(yīng)用在本質(zhì)安全應(yīng)用中.pdf》資料免費(fèi)下載
    發(fā)表于 11-24 10:24 ?1次下載
    <b class='flag-5'>數(shù)字</b>隔離器可應(yīng)用在<b class='flag-5'>本質(zhì)</b>安全應(yīng)用中

    #芯片 #AI 世界最強(qiáng)AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月15日 15:54:37