0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Dojo對標(biāo)A100性能強(qiáng)勁,AI應(yīng)用場景拓展

智能計算芯世界 ? 來源:智能計算芯世界 ? 2023-09-23 09:45 ? 次閱讀

D1 芯片對標(biāo)英偉達(dá) A100。D1采用臺積電 7nm 制程,面積約為 645mm2,包含 500 億顆晶體管,BF16、CFP8 算力可達(dá) 362TFLOPS,F(xiàn)P32 算力可達(dá) 22.6TFLOPS。特斯拉D1芯片對標(biāo)英偉達(dá) A100,英偉達(dá) A100 同樣采用臺積電 7nm 制程,面積為 826mm2,晶體管數(shù)量達(dá) 542 億顆,F(xiàn)P32 峰值算力為 19.5TFLOPS。

59ad8a8e-59a0-11ee-939d-92fbcf53809c.png

D1 芯片依次組成 Tranining tile、Tray、機(jī)柜、ExaPOD。特斯拉并未將 SoC 從晶圓上切下來,而是將所有 SoC 連接。25 個 D1 芯片組成了一個 Training Tile 多晶片模組(MCM),每個 D1 芯片功耗 400W,一個 Training Tile 功耗為 15kW。此外,6 個 Training Tile 組成一個 tray,再由兩個 Tray 組成一個機(jī)柜,10 個機(jī)柜組成 ExaPOD,BF16/CFP8 峰值算力達(dá)到 1.1EFLOPS(百億億次浮點(diǎn)運(yùn)算),并擁有 1.3TB 高速 SRAM 和 13TB 高帶寬 DRAM。

59cb210c-59a0-11ee-939d-92fbcf53809c.png

59f03168-59a0-11ee-939d-92fbcf53809c.png

Dojo 的設(shè)計思想是通過較高的對稱性來實現(xiàn) scale out 能力。在單個 Training tile 上,由于并未將芯片切下,為了提高效率和降低成本,特斯拉并未在片上集成 DRAM 等器件,這與許多通用 GPU 有所不同。集群節(jié)點(diǎn)之間以 2D mesh 連接,邊緣則通過 Interface-processors負(fù)責(zé)內(nèi)存池數(shù)據(jù)搬運(yùn)。

5a1509c0-59a0-11ee-939d-92fbcf53809c.png

顯而易見,D1 芯片需要高速的互聯(lián)來實現(xiàn),臺積電 SoW 封裝技術(shù)提供了這一條件。InFO_SoW 取消了襯底和 PCB 的使用,使得多個芯片陣列使解決方案獲得晶圓級優(yōu)勢,以獲得低延時、高帶寬等優(yōu)勢。此外除了異構(gòu)芯片集成外,其 wafer-field 處理能力還支持基于小芯片的設(shè)計,以實現(xiàn)更大的成本節(jié)約和設(shè)計靈活性。

5a35090a-59a0-11ee-939d-92fbcf53809c.png

在部分模型上,Dojo 能實現(xiàn)相對 A100 更高的性能。例如在圖像分類模型 ResNet-50 上,Dojo 可以實現(xiàn)比英偉達(dá) A100 更高的幀率。而在用于預(yù)測汽車周圍物體所占空間的神經(jīng)網(wǎng)絡(luò)模型 Occupancy Networks 上,相比英偉達(dá) A100,Dojo 能實現(xiàn)性能的倍增。

5a55532c-59a0-11ee-939d-92fbcf53809c.png

特斯拉將大力投資基礎(chǔ)設(shè)施,2024 年有望達(dá) 100Exa-Flops 算力。特斯拉目前 AI 基礎(chǔ)設(shè)施較少,僅約 4000 個 V100 和約 16000 個 A100。而 Microsoft 和 Meta 等公司擁有超過 10萬個 GPU。據(jù)特斯拉規(guī)劃,2024 年有望達(dá) 100Exa-Flops 算力。

特斯拉擁有海量數(shù)據(jù)庫,數(shù)據(jù)價值亟待挖掘。Model3 傳包含 8 個攝像頭,1 個毫米波雷達(dá),12 個超聲波雷達(dá),位置分別為:1-車牌的上方裝有一個攝像頭;2-超聲波傳感器(如果配備)位于前后保險杠中;3-各門柱均裝有一個攝像頭;4-后視鏡上方的擋風(fēng)玻璃上裝有三個攝像頭;5-每塊前翼子板上裝有一個攝像頭;6-雷達(dá)(如果配備)安裝在前保險杠后面。特斯拉車型銷量形勢良好,通過傳感器件建立了龐大的數(shù)據(jù)庫,但受限于硬件限制,無法充分挖掘數(shù)據(jù)價值,Dojo 量產(chǎn)有望突破瓶頸。

自建 AI 基礎(chǔ)設(shè)施,AI 或賦能特斯拉快速成長。特斯拉 Dojo 性能強(qiáng)大,我們認(rèn)為,除加速自身智駕進(jìn)程外,或可拓展至其他應(yīng)用領(lǐng)域,如機(jī)器人等。此外,特斯拉也可能成為一家云服務(wù)提供商,向相關(guān)廠商提供自身算力或模型服務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2542

    文章

    50277

    瀏覽量

    750184
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29397

    瀏覽量

    267691
  • 毫米波雷達(dá)
    +關(guān)注

    關(guān)注

    106

    文章

    1019

    瀏覽量

    64151

原文標(biāo)題:Dojo對標(biāo)A100性能強(qiáng)勁,AI應(yīng)用場景拓展

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    英偉達(dá)a100和h100哪個強(qiáng)?英偉達(dá)A100和H100的區(qū)別

    英偉達(dá)a100和h100哪個強(qiáng)? 就A100和H100這兩個產(chǎn)品來說,它們雖然都是英偉達(dá)公司的高性能計算產(chǎn)品,但是面向的市場和應(yīng)
    的頭像 發(fā)表于 08-09 17:31 ?4.6w次閱讀

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    能耗并提高數(shù)據(jù)安全性。本文將對 NanoEdge AI 的技術(shù)原理、應(yīng)用場景以及優(yōu)勢進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)包括邊緣計算、神經(jīng)網(wǎng)絡(luò)壓縮和低功耗硬件設(shè)計。邊緣計算
    發(fā)表于 03-12 08:09

    新一代AI ISP視頻處理模組,對標(biāo)Hi3559A、Hi3519A平臺性能

    照度全彩視頻處理模組SOM928及配套的IVP928智能視頻處理開發(fā)套件,對標(biāo)Hi3559A、Hi3519A平臺性能;除了同樣優(yōu)秀的編解碼能力外,更擁有關(guān)鍵的
    發(fā)表于 06-07 15:12

    NVIDIA推出了基于A100的DGX A100

    在發(fā)布A100 80GB加速卡之后,NVIDIA也更新了自家的DGX A100產(chǎn)品線,最多可達(dá)640GB HBM2e顯存了。此外,還有全新的DGX Station A100工作站,配備了4個A
    的頭像 發(fā)表于 11-17 10:26 ?4293次閱讀

    英偉達(dá)a100和h100哪個強(qiáng)?

    英偉達(dá)a100和h100哪個強(qiáng)? 英偉達(dá)A100比H100更強(qiáng)。英偉達(dá)A100在處理大型模型和數(shù)據(jù)集時可能比V
    的頭像 發(fā)表于 08-07 17:32 ?1.4w次閱讀

    英偉達(dá)a100a800的區(qū)別

    的浮點(diǎn)性能為19.5 TFLOPS,而A800為10.6 TFLOPS。 3. 存儲容量不同:A100的顯存最大為80 GB,而A800為48 GB。 4.
    的頭像 發(fā)表于 08-07 17:57 ?4.2w次閱讀

    英偉達(dá)a100a800參數(shù)對比

    | | 尺寸(L x H) | 26.7 x 11.2 cm | 26.7 x 11.2 cm | | 適用領(lǐng)域 | AI、機(jī)器學(xué)習(xí)、高性能計算 | 虛擬桌面、虛擬應(yīng)用、多媒體、游戲 | 總體而言,A100的核心數(shù)量
    的頭像 發(fā)表于 08-07 18:00 ?1.3w次閱讀
    英偉達(dá)<b class='flag-5'>a100</b>和<b class='flag-5'>a</b>800參數(shù)對比

    英偉達(dá)A100和3090的區(qū)別

    英偉達(dá)A100和3090的區(qū)別 英偉達(dá)A100是一款面向數(shù)據(jù)中心的計算加速器,其主要優(yōu)勢是支持?jǐn)?shù)據(jù)中心最新的AI、機(jī)器學(xué)習(xí)和高性能計算工作負(fù)載。它配備了專門的張量核心和加速器,可以比普
    的頭像 發(fā)表于 08-07 18:54 ?4087次閱讀

    英偉達(dá)A100和4090的區(qū)別

    英偉達(dá)A100和4090的區(qū)別 英偉達(dá)A100和4090都是英偉達(dá)的高性能計算卡型號。它們之間的主要區(qū)別在于: 1. 架構(gòu):英偉達(dá)A100采用的是Ampere架構(gòu),而4090采用的是V
    的頭像 發(fā)表于 08-08 11:59 ?2.9w次閱讀

    英偉達(dá)A100是什么系列?

    被暴搶。 英偉達(dá)A100是英偉達(dá)推出的一款數(shù)據(jù)中心GPU系列,采用了全新的Ampere架構(gòu)。它是一款專為深度學(xué)習(xí)、科學(xué)計算、超級計算等工作負(fù)載設(shè)計的高性能計算解決方案,擁有更高的計算能力、更大的顯存容量和更快的數(shù)據(jù)傳輸速度等優(yōu)勢。 英偉達(dá)
    的頭像 發(fā)表于 08-08 15:13 ?2987次閱讀

    英偉達(dá)A100的簡介

    達(dá)A100是英偉達(dá)公司推出的一款面向高性能計算(HPC)和人工智能(AI)的加速計算卡。它采用了全球首個基于7nm工藝的數(shù)據(jù)中心GPU架構(gòu)Ampere,擁有6912個CUDA核心和432個張量核心
    的頭像 發(fā)表于 08-08 15:17 ?8919次閱讀

    英偉達(dá)A100的優(yōu)勢分析

    HBM2顯存。 英偉達(dá)A100是一款高性能的GPU,其主要優(yōu)勢如下: 1. 支持高效的AI計算:A100采用了新一代的Tensor Core技術(shù),能夠在
    的頭像 發(fā)表于 08-08 15:25 ?3177次閱讀

    英偉達(dá)a100有國產(chǎn)替代嗎?

    和昇騰920芯片均具有AI處理能力。另外,國內(nèi)企業(yè)紫光展銳、寒武紀(jì)等也在不斷推出性能與英偉達(dá)A100相近的AI芯片。雖然目前這些芯片還無法完全替代英偉達(dá)
    的頭像 發(fā)表于 08-08 15:37 ?4316次閱讀

    英偉達(dá)v100A100的差距有哪些?

    英偉達(dá)v100A100的差距有哪些? 在當(dāng)今人工智能和深度學(xué)習(xí)技術(shù)日益發(fā)展的時代,高性能計算機(jī)顯卡已成為支持這些技術(shù)發(fā)展的關(guān)鍵。英偉達(dá)是高性能計算機(jī)顯卡領(lǐng)域的領(lǐng)導(dǎo)者之一,其v
    的頭像 發(fā)表于 08-22 16:46 ?2.2w次閱讀

    英偉達(dá)H200和A100的區(qū)別

    英偉達(dá)H200和A100兩款芯片在性能、架構(gòu)、內(nèi)存以及應(yīng)用場景等多個方面存在顯著的區(qū)別。
    的頭像 發(fā)表于 03-07 16:23 ?3085次閱讀