0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

挑戰(zhàn)英偉達,索尼AFEELA里的高通數(shù)字底盤

佐思汽車研究 ? 來源:佐思汽車研究 ? 2024-01-14 10:35 ? 次閱讀

2024年CES展上,索尼用自家的PS5游戲機遙控原型車AFEELA登臺頗為驚艷,預計AFEELA在2025年上市,起售價約為45000美元,首選發(fā)售地據(jù)悉是北美。AFEELA是高通數(shù)字底盤的典型代表。

AFEELA具備800TOPS的算力。

76159edc-b279-11ee-8b88-92fbcf53809c.png

圖片來源:SHM

762b18e8-b279-11ee-8b88-92fbcf53809c.png

圖片來源:SHM

AFEELA顯然是采用了兩套SnapdragonRide級聯(lián),推測SoC是高通的SA8650,加速器是基于Cloud AI 100 Ultra的車載版。

AFEELA的AD/ADAS架構

763e7280-b279-11ee-8b88-92fbcf53809c.png

圖片來源:SHM

上圖是AFEELA的AD/ADAS架構,不要質疑CNN做感知,即便是2000TOPS的英偉達也支撐不起全Transformer,車載感知的Backbone網(wǎng)絡還是基于CNN的,包括特斯拉,特斯拉是Regnet。只有Head才能用得上Transformer,這里的環(huán)境模型基本可等同于BEV加占用網(wǎng)絡。全Transformer估計得用8張英偉達H200顯卡,價格是整車的好幾倍了。

SA8650之前筆者已介紹過,高通第一代Snapdragon Ride即SA8540P+SA9000P似乎是過渡產(chǎn)品,SA8540P和高通的SA8295P幾乎完全一致,與高通筆記本電腦領域的8cx Gen3即SC8280P也幾乎完全一致。

高通自動駕駛一直在英偉達和Mobileye的夾縫中,英偉達憑借超高性能幾乎壟斷高端市場,而Mobileye以40-70美元的超低價格壟斷中低端市場。對大部分廠家,包括保時捷這樣的高端品牌,對自動駕駛都缺乏興趣和重視度,自動駕駛是可有可無,錦上添花的配置,只有Mobileye不到100美元的芯片能滿足這些廠家的成本需求,Mobileye牢牢占據(jù)全球70%的智能駕駛芯片市場,地位穩(wěn)如泰山,短期的客戶庫存調整不會影響Mobileye的未來。高通無意與Mobileye競爭,可能是利潤太微薄,高通主要競爭對手就是英偉達,但高通主要市場還是手機,技術核心還在手機上,所以高通的AI加速器是分離的,高通主打的是低功耗和高性價比。

今天我們主要來看高通AI加速器的新產(chǎn)品,即AI 100 Ultra,這是高通2023年11月底推出的產(chǎn)品,就是要挑戰(zhàn)英偉達的H100,高通號稱單張AI 100 Ultra可以對應1000億參數(shù)的大模型,兩張可以對應1750億參數(shù)的ChatGPT 3,功耗和價格遠低于英偉達的H100,惠普和聯(lián)想已經(jīng)有基于AI 100 Ultra的服務器銷售。

7655cc46-b279-11ee-8b88-92fbcf53809c.png

上表是高通2020年9月推出AI 100的各個版本的性能表現(xiàn)。高通目前只有這兩款AI加速器,車載的AI加速器毫無疑問是基于AI 100設計的。

766c8918-b279-11ee-8b88-92fbcf53809c.png

從參數(shù)上看,當然無法和英偉達H100相提并論,并且H100主打的是FP16精度,高通主打的是INT8精度,高通主要的信心來自其軟件優(yōu)化,即Polyhedral Mapper。

76802bc6-b279-11ee-8b88-92fbcf53809c.png

特色主要是核心/線程的并行性,明確的數(shù)據(jù)傳輸,以及SIMD的并行性。

7692dd48-b279-11ee-8b88-92fbcf53809c.png

上圖是一個具體的BERT優(yōu)化。

76aac80e-b279-11ee-8b88-92fbcf53809c.png

主要的挑戰(zhàn)一是如何讓核心、線程和矢量單元都處于最大利用狀態(tài),二是如何利用好本地內存,而不是外部昂貴的HBM內存,三是減少數(shù)據(jù)搬運。

高通AI加速器架構

76c9cb46-b279-11ee-8b88-92fbcf53809c.png

高通AI 100內核

76e31ae2-b279-11ee-8b88-92fbcf53809c.png

高通AI 100內核是16個,AI 100Ultra是64個,不過考慮到功耗,性能沒有增加4倍。

每個AI核心內部架構

76f6c114-b279-11ee-8b88-92fbcf53809c.jpg

大多數(shù)車載AI加速器只有張量Tensor計算單元,且只有INT8,高通的不僅包括張量還有標量Scalar和矢量Vector單元。張量分INT8和FP16兩種,INT8有8192個MAC,F(xiàn)P16有4096個MAC。標量與矢量單元都是VLIW指令集,跟高通手機芯片中的DSP完全一致。

每核心有1MB的L2緩存,有8MB的VTCM存儲,所謂VTCM是VectorTightly-Coupled Memory緊耦合矢量存儲,合計每個AI核心有9MB的SRAM,64個內核就是576MB的SRAM,SRAM的成本每MB約5美元,也就是2880美元,AI 100 Ultra至少一半以上的die size是SRAM,一半以上的成本也來自SRAM,估計AI 100 Ultra售價是6000美元左右。

矢量計算需要頻繁搬運數(shù)據(jù),特別是矢量矩陣運算,Transformer里主要延遲都來自矢量矩陣運算。

770b91d4-b279-11ee-8b88-92fbcf53809c.png

上圖是三星對GPT大模型workload分析,在運算操作數(shù)量上,GEMV矩陣矢量乘法所占的比例高達86.53%,在大模型運算延遲分析上,82.27%的延遲都來自GEMV;GEMM矩陣通用乘法所占僅為2.12%,非線性運算也就是神經(jīng)元激活部分占的比例也遠高于GEMM。

77269f2e-b279-11ee-8b88-92fbcf53809c.png

上圖是三星對GPU利用率的分析,可以看出在GEMV算子時,GPU的利用率很低,一般不超過20%,換句話說80%的時間GPU都是在等待存儲數(shù)據(jù)的搬運。所以芯片內部的TCAM非常有必要,其效果要比芯片外部的HBM更好,缺點是容量遠不能和HBM比,用于訓練和汽車級模型推理比較好。

AI 100 Ultra的存儲系統(tǒng)升級不少,從原來的137GB/s升級至576GB/s,但還是用了老舊的LPDDR4,實際就是內存控制器增加到了4路,每路128bit,合計512bit。接口方面,PCIe提升到第四代,Lane增加到16。

AI加速器硬件似乎已走到了盡頭,能做文章的只有存儲部分和制造工藝,更先進的制造工藝容納更多的計算單元,更高bit的內存控制器增加存儲帶寬或者升級HBM,像英偉達的H200,只是存儲部分更換成了HBM3,其余與H100完全一致。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    788

    瀏覽量

    37560
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4631

    瀏覽量

    128440
  • AI
    AI
    +關注

    關注

    87

    文章

    29359

    瀏覽量

    267641
  • 自動駕駛
    +關注

    關注

    782

    文章

    13525

    瀏覽量

    165730

原文標題:挑戰(zhàn)英偉達,索尼AFEELA里的高通數(shù)字底盤

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    英偉管解讀Q2財報 但是英偉市值暴跌1.4萬億元

    英偉正式發(fā)布了2025財年第二季度報告,英偉公司在Q2營收達到了300.4億美元,這個營收超過了市場預期的287億美元,同比增長122%;凈利潤為166億美元,同比增長168%,也
    的頭像 發(fā)表于 08-30 13:03 ?627次閱讀

    英偉Blackwell架構揭秘:下一個AI計算里程碑?# 英偉# 英偉Blackwell

    英偉行業(yè)資訊
    jf_02331860
    發(fā)布于 :2024年08月26日 10:58:09

    英偉面臨雙重反壟斷調查挑戰(zhàn)

    英偉,這家在人工智能芯片領域占據(jù)領先地位的科技公司,近期遭遇了前所未有的挑戰(zhàn)。在享受了數(shù)月由AI芯片需求激增帶來的股價暴漲和市場樂觀情緒后,英偉
    的頭像 發(fā)表于 08-14 11:45 ?487次閱讀

    科技看點:摩根大通詳解“英偉芯片問題”馬斯克560億薪酬方案引爭議

    設計和系統(tǒng)級別的問題;主要應該是主板過熱和電壓。產(chǎn)量的挑戰(zhàn)依然是英偉要頭疼的問題;這也是英偉
    的頭像 發(fā)表于 08-05 16:18 ?571次閱讀

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    英偉AI霸主地位遭巨頭聯(lián)手挑戰(zhàn),CUDA壟斷遭破局

    據(jù)最新外媒報道,科技界的巨頭們——通、谷歌和英特爾等,已經(jīng)聯(lián)手向英偉發(fā)起了一場挑戰(zhàn),意圖打破其在CUDA平臺上的壟斷局面。
    的頭像 發(fā)表于 03-28 14:39 ?864次閱讀

    英偉壟斷地位遭挑戰(zhàn),谷歌、通聯(lián)手打破

    然而,一家名為UXL的聯(lián)合體正在努力打破這一局面。該機構由通、谷歌、英特爾、ARM等諸多知名科技巨頭構成,意欲引導開發(fā)者從對英偉芯片的依賴中走出,降低英偉
    的頭像 發(fā)表于 03-26 15:24 ?407次閱讀

    英偉為什么越漲越便宜?英偉的市盈率一直在下降?

    英偉為什么越漲越便宜?英偉的市盈率一直在下降? 在2023年英偉的股價漲了兩倍多;龍年開年
    的頭像 發(fā)表于 03-12 18:02 ?1522次閱讀

    英偉市值超過2.3萬億美元

    英偉(NVIDIA)近日在美股市場表現(xiàn)出色,市值再創(chuàng)新高。上周四,英偉股價收4.47%,成功突破900美元大關,市值更是達到驚人的23
    的頭像 發(fā)表于 03-11 11:12 ?681次閱讀

    “網(wǎng)紅”芯片Groq讓英偉蒸發(fā)5600億

    鑒于ChatGPT的廣泛應用,引發(fā)了AI算力需求的迅猛增長,使得英偉的AI芯片供不應求,出現(xiàn)大規(guī)模短缺。如今,英偉似乎在面對更多挑戰(zhàn)。
    的頭像 發(fā)表于 02-27 15:10 ?1000次閱讀
    “網(wǎng)紅”芯片Groq讓<b class='flag-5'>英偉</b><b class='flag-5'>達</b>蒸發(fā)5600億

    英偉CEO表示華為好公司 英偉將華為認定為最大競爭對手

    本周提交給美國證券交易委員會的文件中列舉了競爭對手包括有英特爾、超微、博通、通、亞馬遜和微軟等;而且首度將華為認定為“最大競爭對手”。 英偉CEO黃仁勛表示華為好公司 在一次采訪中英偉
    的頭像 發(fā)表于 02-25 15:18 ?759次閱讀

    英偉市值1.96萬億美元

    英偉市值1.96萬億美元 英偉股價一天之內大漲16%;英偉股價漲到785.38美元,市值1
    的頭像 發(fā)表于 02-24 15:22 ?870次閱讀

    英偉與中國市場的博弈 英偉特供芯片遇冷

    英偉在面臨美國新規(guī)的挑戰(zhàn)時,迅速為中國市場開發(fā)了特供版AI芯片,旨在滿足中國對尖端人工智能技術的需求。
    的頭像 發(fā)表于 01-08 17:07 ?1020次閱讀

    英偉股價暴跌 英偉市值一夜驟減2214億

    人民幣大約2214億元)。 在英偉股票出現(xiàn)大幅波動的同時,有數(shù)據(jù)顯示出在11月英偉的內部人員出售及申請拋售股份數(shù)量達到驚人的37萬股,創(chuàng)下6年上市公司拋售之最。
    的頭像 發(fā)表于 12-05 09:16 ?910次閱讀

    #英偉 #顯卡 英偉全新旗艦顯卡RTX 5090性能暴漲70%

    顯卡英偉
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月20日 14:19:25