欧美日韩国产原创,青青青免费高清在线观看一区二区

特斯拉 Hardware 3.0 的效率之謎

特斯拉在其推出的 Hardware 3.0 自動(dòng)駕駛平臺(tái)中，采用自研芯片替代了Nvidia Drive PX2，其理論算力直線提升了 3 倍，而以 MAPS 方式來(lái)評(píng)估，其真實(shí) AI 性能更是驚人的提升了 21 倍。具體而言，Hardware 2.0 時(shí)每秒只能處理 110 幀圖像，而現(xiàn)在則高達(dá) 2300 幀。

那么，Hardware 的效率提升應(yīng)該如何認(rèn)識(shí)呢？在“算力至上”的今天，如何透過(guò)數(shù)字直剖本質(zhì)評(píng)估 AI 芯片的真實(shí)性能？

算力攀升，為什么卻看不到實(shí)用性？

隨著芯片制程技術(shù)的演進(jìn)，摩爾定律的發(fā)展卻逐漸進(jìn)入瓶頸期，這與當(dāng)下計(jì)算 AI 計(jì)算需求量爆發(fā)式的增長(zhǎng)顯得格格不入。追求純算力突破并不可持續(xù)，同時(shí)算力也并不代表汽車智能芯片“真實(shí)性能”，芯片計(jì)算效率也同樣需要關(guān)注。于是，軟硬結(jié)合、算法加持的 AI 芯片接過(guò)了跑贏新場(chǎng)景的接力棒。

當(dāng)前，行業(yè)普遍以“TOPS”為單位來(lái)評(píng)估AI的理論峰值算力。盡管在目前主流的AI芯片性能基準(zhǔn)測(cè)試（ MLPerf ）下很多頂級(jí)廠商頻繁刷新榜單記錄，但在實(shí)際場(chǎng)景下的算力有效利用率卻差強(qiáng)人意。

人們逐漸認(rèn)識(shí)到，AI 芯片理論峰值算力并不一定能在實(shí)際運(yùn)行中完全釋放。例如，一款擁有理論峰值算力為 16 TOPS 的芯片，在計(jì)算不同模型時(shí)甚至?xí)薪咏?80% 的差異。此外，在卷積神經(jīng)網(wǎng)絡(luò)任務(wù)實(shí)測(cè)中，從 2014 年到 2019 年，最好的神經(jīng)網(wǎng)絡(luò)計(jì)算效率相差了 100 倍，相當(dāng)于計(jì)算效率每 9 個(gè)月翻一倍，遠(yuǎn)快于每 18 個(gè)月翻倍的摩爾定律。因此在模型算法演進(jìn)速度遠(yuǎn)快于芯片性能提升的速度的現(xiàn)在，不僅需要算力更高的芯片，也需要更合理的性能評(píng)估方法幫助用戶選擇適合的 AI 芯片。

對(duì)這些 AI 時(shí)代出現(xiàn)的新變化，以地平線為代表的 AI 芯片企業(yè)認(rèn)為，單純依賴于 PPA 芯片設(shè)計(jì)指標(biāo)，很容易陷入算力至上的“誤區(qū)”，但算力并不是完全反應(yīng)芯片性能唯一評(píng)估標(biāo)準(zhǔn)。因此，地平線提出了 MAPS（Mean Accuracy-guaranteed Processing Speed）概念和評(píng)估方法，以此作為檢驗(yàn) AI 性能的真正標(biāo)準(zhǔn)。通俗來(lái)說(shuō)，就是在特定的 AI 應(yīng)用領(lǐng)域，看芯片處理 AI 任務(wù)的速度和精度，即“多快”和“多準(zhǔn)”。

MAPS 動(dòng)態(tài)評(píng)估芯片真實(shí) AI 性能

隨著 AI 算法的不斷演進(jìn)，幾乎每 10-14 個(gè)月，相同的計(jì)算精度計(jì)算量可以下降一半。這種提升與算法設(shè)計(jì)的精妙程度息息相關(guān)，但算法的快速演進(jìn)也對(duì)計(jì)算架構(gòu)提出巨大的挑戰(zhàn)，尤其是對(duì)傳統(tǒng)通用的并行架構(gòu)而言，例如亟需高效AI專用處理器的自動(dòng)駕駛場(chǎng)景。

MAPS 其實(shí)是在物理算力的基礎(chǔ)上，通過(guò)對(duì)大量模型的測(cè)試，綜合各個(gè)模型的速度（正比與物理算力*實(shí)際利用率）和準(zhǔn)確率得到的最佳方案的量化結(jié)果。它更聚焦于使用戶能夠通過(guò)可視化的圖表直觀的感知 AI 芯片真實(shí)算力。正如對(duì)于汽車來(lái)說(shuō)，馬力（單位: HP）不如百公里加速時(shí)間（單位：秒）更真實(shí)反映整車動(dòng)力性能；算力（單位: TOPS）并不反映汽車智能芯片實(shí)際性能，而每秒準(zhǔn)確識(shí)別幀率 MAPS（單位: FPS）才是更真實(shí)的性能指標(biāo)。

MAPS=最佳模型多邊形面積/（精度上界—精度下界），其中橫軸反應(yīng)幀率，縱軸反應(yīng)精度

此外，在自動(dòng)駕駛中應(yīng)該如何對(duì)速度和精度做取舍呢？現(xiàn)實(shí)生活中我們經(jīng)常遇到一些極端的案例，例如當(dāng)汽車遭遇小孩子橫穿馬路的突發(fā)狀況時(shí)，如果自動(dòng)駕駛識(shí)別延時(shí)過(guò)高，會(huì)剎車不及時(shí)；如果精度不夠，則會(huì)造成無(wú)法識(shí)別。在很多類似的場(chǎng)景中，我們往往面臨既要“快”，又要兼顧“準(zhǔn)”的境況。而在 MAPS 評(píng)估方法下，我們可以清晰看到幀率和精度之間的動(dòng)態(tài)關(guān)系，這也是其對(duì)實(shí)際場(chǎng)景的重要價(jià)值之一。

更高級(jí)別自動(dòng)駕駛需要多少“FPS”？

軟件定義的汽車的趨勢(shì)下，未來(lái)汽車正逐步成為四個(gè)輪子上的超級(jí)計(jì)算機(jī)?？梢郧逦A(yù)見(jiàn)的是，電動(dòng)車賣點(diǎn)不是車，而是「智能」，這是一個(gè)堪比計(jì)算機(jī)誕生級(jí)別的創(chuàng)新。

特斯拉在 Hardware 3.0 中，采用其自研 AI 芯片 FSD Chip 替代了 Hardware 2.5 中的 Nvidia Drive PX2，算力從 24 TOPS 提升到了 72 TOPS，但運(yùn)行同樣模型的精度卻驚人的提升了 21 倍。具體而言，Hardware 2.0 時(shí)每秒只能處理 110 幀圖像，而現(xiàn)在則高達(dá) 2300 幀。除了絕對(duì)算力的提升，額外提升則來(lái)自于利用率的提升。同時(shí)特斯拉也宣布針對(duì) Hardware 3.0 重寫自動(dòng)駕駛軟件，從而在 2020 年 10 月推出了 FSD beta，這是唯一不受場(chǎng)地限制、大規(guī)模測(cè)試的自動(dòng)駕駛方案。

特斯拉革命性技術(shù)的重構(gòu)與 MAPS背后體現(xiàn)的理念有相通之處：提升物理算力（HW 3.0 提升 3 倍）、提升利用率（提升近 2 倍），找到最佳的速度和準(zhǔn)確率提升（重寫自動(dòng)駕駛軟件），使得特斯拉從簡(jiǎn)單場(chǎng)景的 NOA 一步步突破到不受限的自動(dòng)駕駛。而地平線在芯片設(shè)計(jì)之中一直貫徹 MAPS 背后的技術(shù)理念，關(guān)注提升物理算力的同時(shí)關(guān)注利用率的提升，并且不斷把算法發(fā)展趨勢(shì)，使得軟硬件可以協(xié)同共振，發(fā)揮最高效能。

為了助力汽車廠商突破“特斯拉困境”，實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛的落地。地平線即將推出的征程 5 MAPS 整體跑分高達(dá) 3020 FPS，其中 MAPS@COCO （檢測(cè)任務(wù)COCO MAPS）跑分可高達(dá) 116，而 Nvidia Xavier MAPS@COCO 為 41 FPS （GPU&DLA@32W mode ），如此高的性能將助力車廠加速實(shí)現(xiàn)自動(dòng)駕駛方案的落地。

驅(qū)動(dòng)新基建數(shù)字底座，需要有算力也要有效率。自成立以來(lái)，地平線便致力于兼?zhèn)渌懔εc效率的高性能芯片。未來(lái)，地平線將推出性能更強(qiáng)大的征程6，其不僅在功耗、面積優(yōu)化的基礎(chǔ)上，同時(shí)在MAPS上繼續(xù)提升一個(gè)數(shù)量級(jí)，助力全行業(yè)共同努力進(jìn)一步大幅提升自動(dòng)駕駛的安全性。

原文標(biāo)題：不看算力看效率，更高級(jí)別的自動(dòng)駕駛需要多少 “FPS”？

文章出處：【微信公眾號(hào)：地平線HorizonRobotics】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

特斯拉

特斯拉

+關(guān)注

關(guān)注
66

文章
6265

瀏覽量
126369
AI

AI

+關(guān)注

關(guān)注
87

文章
29438

瀏覽量
267759
自動(dòng)駕駛

自動(dòng)駕駛

+關(guān)注

關(guān)注
782

文章
13550

瀏覽量
165776

原文標(biāo)題：不看算力看效率，更高級(jí)別的自動(dòng)駕駛需要多少 “FPS”？

文章出處：【微信號(hào)：horizonrobotics，微信公眾號(hào)：地平線HorizonRobotics】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

2.5D/3D封裝技術(shù)升級(jí)，拉高AI芯片性能天花板

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）一直以來(lái)，提升芯片性能主要依靠先進(jìn)制程的突破。但現(xiàn)在，人工智能對(duì)算力的需求，將芯片封裝技術(shù)的重要性提升至前所未有的高度。為了提升

發(fā)表于 07-11 01:12 ?6275次閱讀

如何評(píng)估AI大模型的效果

評(píng)估AI大模型的效果是一個(gè)復(fù)雜且多維度的過(guò)程，涉及多個(gè)方面的考量。以下是一些關(guān)鍵的評(píng)估方法和步驟：一、基準(zhǔn)測(cè)試（Benchmarking）使用標(biāo)準(zhǔn)數(shù)據(jù)集和任務(wù)來(lái)評(píng)估模型的

發(fā)表于 10-23 15:21 ?136次閱讀

光學(xué)透過(guò)率測(cè)量?jī)x的技術(shù)原理和應(yīng)用場(chǎng)景

：在建筑行業(yè)中，光學(xué)透過(guò)率測(cè)量?jī)x被用于測(cè)試建筑材料（如窗戶、天窗和其他透明部件）的透明度，以確保它們符合質(zhì)量和性能標(biāo)準(zhǔn)。這對(duì)于需要控制光線進(jìn)入量的建筑物尤為重要，如展覽館、圖書館等。此外，它還

發(fā)表于 10-16 14:38

天璣9400權(quán)威測(cè)試AI性能跑分第一，領(lǐng)跑行業(yè)

的技術(shù)，一直在端側(cè)AI領(lǐng)域穩(wěn)步前進(jìn)，持續(xù)拓展AI能力及生態(tài)系統(tǒng)。NPU性能稱霸，以最強(qiáng)端側(cè)AI構(gòu)筑“智能體化”堅(jiān)實(shí)基底首先看天璣9400的

發(fā)表于 10-14 14:57 ?272次閱讀

天璣9400權(quán)威測(cè)試<b class='flag-5'>AI</b><b class='flag-5'>性能</b>跑分第一，領(lǐng)跑行業(yè)

通過(guò)數(shù)字隔離器將SPI轉(zhuǎn)換為GPIO

電子發(fā)燒友網(wǎng)站提供《通過(guò)數(shù)字隔離器將SPI轉(zhuǎn)換為GPIO.pdf》資料免費(fèi)下載

發(fā)表于 09-21 10:20 ?0次下載

通<b class='flag-5'>過(guò)數(shù)字</b>隔離器將SPI轉(zhuǎn)換為GPIO

3D DRAM內(nèi)嵌AI芯片，AI計(jì)算性能暴增

當(dāng)前高帶寬內(nèi)存(HBM)中的DRAM芯片，通過(guò)在3D DRAM中實(shí)現(xiàn)AI處理來(lái)解決數(shù)據(jù)總線問(wèn)題。 ? 通常來(lái)說(shuō)，當(dāng)前的 AI芯片架構(gòu)將數(shù)據(jù)存儲(chǔ)在高帶寬內(nèi)存中，并通

發(fā)表于 08-16 00:08 ?3035次閱讀

3D DRAM內(nèi)嵌<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>，<b class='flag-5'>AI</b>計(jì)算<b class='flag-5'>性能</b>暴增

AI芯片哪里買？

AI芯片

芯廣場(chǎng)

發(fā)布于 :2024年05月31日 16:58:19

知存科技助力AI應(yīng)用落地：WTMDK2101-ZT1評(píng)估板實(shí)地評(píng)測(cè)與性能揭秘

資料后博主自己總結(jié)：存內(nèi)計(jì)算技術(shù)的發(fā)展對(duì)于提高計(jì)算設(shè)備的整體性能、降低能耗并改善數(shù)據(jù)處理效率具有重要意義。值得一提的是，我國(guó)知存科技推出的 WTM2101 芯片即采用存內(nèi)計(jì)算這種方式。近存計(jì)算和存內(nèi)

發(fā)表于 05-16 16:38