0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達發(fā)布超強AI加速卡,性能大幅提升,可支持1.8萬億參數模的訓練

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-03-19 12:04 ? 次閱讀

3月19日消息,NVIDIA宣布成功研發(fā)AI加速卡——Blackwell GB200,預計年內開始交付。這是NVIDIA在GTC開發(fā)者大會上所公布的最新成果。

GB200創(chuàng)新性的運用了NVIDIA獨創(chuàng)的新一代AI圖形處理器架構Blackwell。NVIDIA CEO黃仁勛明確指出:“盡管Hopper已然優(yōu)秀,但我們需要更強的GPU推動發(fā)展?!?/p>

得益于NVIDIA每兩年進行一次GPU架構升級以提高性能的策略,全新的基于Blackwell的加速卡比之前的H100更為強大,尤其適用于AI相關任務。

Blackwell GPU卓越表現(xiàn)使得AI性能達到驚人的20PetaFLOPS。相比之下,基于Hoper架構的H100僅為4PetaFLOPS。NVIDIA強調,這種額外的處理能力將極大地便利人工智能廠商順利培訓復雜且大規(guī)模的模型。

Blackwell GPU大大刷新了人們的認知,其龐大身形由臺積電4納米(4NP)工藝制成,包含兩個獨立制造的裸晶(Die),共有2080億個晶體管。為了方便捆綁芯片,它采用NVLink 5.0技術。兩枚Blackwell芯片在同一封裝中,相較以往的GPU而言,整體性能顯著提升達2.5倍,若處理FP4八精度浮點運算,則性能甚至可飆升至5倍之多。校園秘

關于GB200,NVIDIA宣稱,其合成物包括兩個B200 Blackwell GPU以及一個基于Arm的Grace CPU。很多人驚訝地發(fā)現(xiàn) NvTech的首批量產計算機將其性能獲得了提升超過30倍,同時降低成本和能耗。根據NVIDIA的數據分析,他們現(xiàn)有的硬件只用2000個Blackwell GPU就夠再去完成諸如1.8萬億個參數模型這樣的運算任務,且只消耗4兆瓦的電力。在參數為1,750億的GPT-3 LLM基準測試中,Nvidia的GB200的性能甚至超越了H100 7倍。規(guī)律紀律意識

對于致力于擁有龐大需求企業(yè)的成品服務,NVIDA推出了包含36個CPU及72個Blackwell GPU的NVL72服務器,并附贈一體式水冷散熱解決方案,產能可實現(xiàn)高達720 PetaFLOPS的AI訓練性能,或者達到驚人的1,440 PetaFlops。另外,還有144個壁搏立帆、576個GPU以及240TB的內存。單據一份官方報道顯示,早先以至于要運行一帶有1.8萬億個參數模型的堆棧,原先需要8000個 Hopper GPU,外加15兆瓦的電力。

英偉達透露,同類機型已被亞馬遜、谷歌、微軟和甲骨文計劃納入他們的云服務產品之中,由于對具體采購量的保密,外界暫無確切消息。但據Nvidia表示,已經接到了Amazon AWS對于采用2萬片 Blackwell芯片建成的服務器集群的購買計劃。通過Node-to-Node NVLink 5.0,每個機架將被18塊GB200芯片和9塊交換機裝滿。而不同于此,英偉達的 Skeeter InfiniBand可連接多達144個節(jié)點,Quantum-X800 InfiniBand則最高可支持64個節(jié)點。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4814

    瀏覽量

    102629
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4631

    瀏覽量

    128439
  • AI
    AI
    +關注

    關注

    87

    文章

    29357

    瀏覽量

    267633
收藏 人收藏

    評論

    相關推薦

    大模型向邊端側部署,AI加速卡朝高算力、小體積發(fā)展

    電子發(fā)燒友網報道(文/李彎彎)AI加速卡是專門用于處理人工智能應用中的大量計算任務的模塊。它集成了高性能的計算核心和大量的內存,旨在加速機器學習、深度學習等算法的計算過程。當前,
    的頭像 發(fā)表于 09-17 00:18 ?2701次閱讀

    EPSON差分晶振SG3225VEN頻點312.5mhz應用于AI加速卡

    AI加速卡,通常也被稱為AI算力,是一種專為加速人工智能(AI)應用和算法而設計的硬件設備。
    發(fā)表于 09-10 14:56 ?0次下載

    英偉Blackwell支持10萬億參數模AI訓練,實時大語言模型推理

    、NVLink交換機、Spectrum以太網交換機和Quantum InfiniBand交換機。 ? 英偉稱,Blackwell擁有6項革命性技術,支持多達10
    的頭像 發(fā)表于 09-04 09:10 ?2733次閱讀

    YXC高頻差分晶振,頻點312.5mhz,高精度.高穩(wěn)定性,應用于AI加速卡

    在一些AI加速卡中,揚興推薦的YXC差分晶振YSO210PR系列,該系列頻率范圍為10MHz ~1500MHz,滿足高精度、高穩(wěn)定度的需求,支持差分信號(LVDS/LVPECL)輸出
    的頭像 發(fā)表于 08-21 14:03 ?228次閱讀
    YXC高頻差分晶振,頻點312.5mhz,高精度.高穩(wěn)定性,應用于<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    蘋果AI模型訓練新動向:攜手谷歌,未選英偉

    近日,蘋果公司發(fā)布的最新研究報告揭示了其在人工智能領域的又一重要戰(zhàn)略選擇——采用谷歌設計的芯片來訓練AI模型,而非行業(yè)巨頭英偉的產品。這
    的頭像 發(fā)表于 08-01 18:11 ?856次閱讀

    NVIDIA突破美國禁令,將在中東部署其高性能AI/HPC GPU加速卡

    Ooredoo達成合作協(xié)議,將在中東地區(qū)部署其高性能AI/HPC GPU加速卡。這一舉動不僅標志著NVIDIA在中東市場的戰(zhàn)略布局取得了重大突破,也引發(fā)了外界對于如何防止這些先進技術流向中國的廣泛討論。
    的頭像 發(fā)表于 06-24 14:47 ?754次閱讀

    進一步解讀英偉 Blackwell 架構、NVlink及GB200 超級芯片

    計算工作負載、釋放百億億次計算能力和萬億參數人工智能模型的全部潛力提供關鍵基礎。 NVLink釋放數萬億參數AI模型的
    發(fā)表于 05-13 17:16

    英偉發(fā)布最強AI加速卡Blackwell GB200

    英偉在最近的GTC開發(fā)者大會上發(fā)布了其最新、最強大的AI加速卡——GB200。這款加速卡采用了
    的頭像 發(fā)表于 03-20 11:38 ?976次閱讀

    英偉發(fā)布性能大幅提升的新款B200 AI GPU

    英偉宣稱,B200在性能上比以往最好的GPU快30倍不止。由它構成的服務器集群相比上一代,運算能力飛躍性提升,甚至能使大語言模型的訓練速度
    的頭像 發(fā)表于 03-20 09:37 ?671次閱讀

    英偉發(fā)布最強AI加速卡GB200,開啟新一代AI圖形處理時代

    英偉正式發(fā)布了其最新、也是迄今為止最強大的AI加速卡——GB200。這一重大發(fā)布標志著
    的頭像 發(fā)表于 03-19 11:26 ?1022次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>發(fā)布</b>最強<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>GB200,開啟新一代<b class='flag-5'>AI</b>圖形處理時代

    今日看點丨英偉發(fā)布最強 AI 加速卡--Blackwell GB200;三星面臨罷工 存儲市場供需引關注

    1. 英偉發(fā)布最強 AI 加速卡--Blackwell GB200 ,今年發(fā)貨 ? 3 月 19 日,
    發(fā)表于 03-19 11:08 ?1135次閱讀

    英偉發(fā)布最強AI加速卡

    行業(yè)芯事行業(yè)資訊
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年03月19日 09:16:43

    英偉市值1.96萬億美元

    英偉市值1.96萬億美元 英偉股價一天之內大漲16%;英偉
    的頭像 發(fā)表于 02-24 15:22 ?869次閱讀

    寧暢參與發(fā)布AI加速卡液冷設計白皮書

    近日,由寧暢參與起草的《基于標準PCIe接口的人工智能加速卡液冷設計》白皮書正式發(fā)布。該技術白皮書由開放計算標準工作委員會(OCTC)歸口,旨在為冷板式人工智能加速卡的設計提供重要指導。
    的頭像 發(fā)表于 01-09 11:28 ?687次閱讀

    瞬變對AI加速卡供電的影響

    ,尤其是在學習和推理時。這種需求不斷地將供電網絡的邊界推向前所未有的新水平。這些高密度工作負載變得愈加復雜,更高的瞬態(tài)需求推動配電網絡的每個部分都必須高效運行。AI加速卡嚴格的功耗要求對系統(tǒng)性能也有影響。本文將討論
    的頭像 發(fā)表于 12-01 18:10 ?360次閱讀
    瞬變對<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>供電的影響