0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI訓(xùn)練不可或缺的存儲,HBM3 DRAM再升級

花茶晶晶 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2023-04-23 00:01 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/黃晶晶) SK海力士近日發(fā)布全球首次實現(xiàn)垂直堆疊12個單品DRAM芯片,成功開發(fā)出最高容量24GB的HBM3 DRAM新產(chǎn)品。


圖源:SK海力士


目前已向數(shù)多全球客戶公司提供了24GB HBM3 DRAM樣品正在進(jìn)行性能驗證,預(yù)計從今年下半年起將其推向市場。而現(xiàn)有HBM3 DRAM的最大容量是垂直堆疊8個單品DRAM芯片的16GB。無論是堆疊數(shù)量還是容量上,此次發(fā)布的新品都有顯著提升。

HBM(高帶寬存儲器)是高價值、高性能存儲器,垂直互連多個DRAM芯片。目前SK海力士在HBM市場處于領(lǐng)先地位,約有60%-70%的份額。


圖源:SK海力士


SK海力士于2013年首次開發(fā)HBM DRAM(第一代)產(chǎn)品,隨后以HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)的順序開發(fā)。早在去年6月,SK海力士宣布其HBM3將與NVIDIA H100Tensor CoreGPU結(jié)合用于加速計算,SK hynix于2022年第三季度開始發(fā)貨。今年年初隨著ChatGPT的火爆,HBM訂單激增。那么SK海力士有哪些技術(shù)來提升HBM的性能呢,以下結(jié)合SK海力士多位技術(shù)專家的分享進(jìn)行一些解讀。

訓(xùn)練計算需匹配高性能存儲

訓(xùn)練GPT-3、Megatron-Turing NLG 530B等超大語言模型所要求的算力提升速度呈數(shù)倍到數(shù)百倍的增長。尤其是ChatGPT的訓(xùn)練,ChatGPT人工智能語言模型的背后就是Transformer架構(gòu)。這個架構(gòu)突破了傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和長短時記憶網(wǎng)絡(luò)(LSTM)的局限性,能夠在大規(guī)模數(shù)據(jù)集上進(jìn)行高效訓(xùn)練。為了實現(xiàn)高效訓(xùn)練計算,就需要有與之匹配的高性能存儲。


圖源:SK海力士


SK海力士于2021年10月推出全球首款HBM3,并在2022年6月實現(xiàn)量產(chǎn)。據(jù)介紹,該款HBM3每個引腳傳輸速率達(dá)6.4Gbps,1024位寬接口,最高帶寬可達(dá)819GB/s,較HBM2E(460GB/s)高約78%。16Gb內(nèi)核密度、尖端的TSV垂直堆疊技術(shù),滿足了系統(tǒng)對更高密度的要求,該技術(shù)可實現(xiàn)12層堆疊內(nèi)存立方體,從而實現(xiàn)最大24GB封裝密度。HBM3配備On-die ECC(糾錯碼)可靠性功能,可自我檢測和糾正數(shù)據(jù)錯誤,從而在SoC和DRAM之間實時傳輸海量數(shù)據(jù)。


圖源:SK海力士

先進(jìn)的封裝技術(shù)

此次新產(chǎn)品采用了先進(jìn)(Advanced)MR-MUF和TSV技術(shù)。SK海力士表示,通過先進(jìn)MR-MUF技術(shù)加強了工藝效率和產(chǎn)品性能的穩(wěn)定性,又利用TSV技術(shù)將12個比現(xiàn)有芯片薄40%的單品DRAM芯片垂直堆疊,實現(xiàn)了與16GB產(chǎn)品相同的高度。這兩項技術(shù)也是SK海力士先進(jìn)封裝技術(shù)的重要組成。

首先來看先進(jìn)MR-MUF技術(shù)。根據(jù)SK海力士的官方資料,MR-MUF(Mass Reflow Molded Underfill, 批量回流模制底部填充)將半導(dǎo)體芯片貼附在電路上,并在堆疊芯片時使用“EMC (Epoxy Molding Compound, 液態(tài)環(huán)氧樹脂模塑料”填充芯片之間或芯片與凸塊之間間隙的工藝。這種新的工藝主要是比之前的NCF技術(shù)工藝有了很大提升。此前的NCF技術(shù)是在芯片之間使用薄膜進(jìn)行堆疊。與NCF相比,MR-MUF導(dǎo)熱率高出兩倍左右,工藝速度和良率都有提升。

圖源:SK海力士

另一個是TSV(Through Silicon Via, 硅通孔技術(shù))。TSV技術(shù)是在DRAM芯片打上數(shù)千個細(xì)微的孔,并通過垂直貫通的電極連接上下芯片的先進(jìn)封裝技術(shù)。這種技術(shù)已經(jīng)成為一種提升DRAM性能和密度的重要手段,可以應(yīng)用于3D-TSV DRAM和HBM。

圖源:SK海力士

HBM主要用于彌補SoC高帶寬需求與主存儲器最大帶寬供應(yīng)能力之間的帶寬缺口。SK海力士專家表示,特別是在AI應(yīng)用中,每個SoC的帶寬需求可能都會超過幾TB/s,這是常規(guī)主存儲器無法滿足的。例如具有3200Mbps DDR4 DIMM的單個主存儲器通道只能提供25.6GB/s的帶寬。即使是具有8個存儲器通道的CPU平臺,其速度也只能達(dá)到204.8GB/s。而圍繞單個SoC的4個HBM2堆疊可提供大于1TB/s的帶寬。根據(jù)不同的應(yīng)用程序,HBM既可以單獨用作緩存,也可以用作兩層存儲中的第一層。

圖源:SK海力士

實際上除了GPU搭載了HBM之外,CPU也實現(xiàn)了封裝HBM。去年底,英特爾就正式推出了全球首款配備 HBM 內(nèi)存的 x86 CPU——Intel Xeon Max 系列。根據(jù)下圖介紹,它具有64 GB的HBM2e 內(nèi)存,分為4個16 GB的集群,總內(nèi)存帶寬為1 TB / s,每個內(nèi)核的HBM都超過1 GB。


圖源:Intel

當(dāng)前HBM的技術(shù)方向主要是在速度、密度、功耗、占板空間等方面的提升。SK海力士通過提高引腳數(shù)據(jù)速率、I/O總線位寬等方式提升速率;通過擴展Die堆疊層數(shù)和物理堆疊高度,以及增加核心Die密度以優(yōu)化堆疊密度。通過評估內(nèi)存結(jié)構(gòu)和操作方案,最大限度地降低每帶寬擴展的絕對功耗;為了實現(xiàn)總內(nèi)存Die尺寸最小化,則是通過在不擴大現(xiàn)有物理尺寸的情況下增加存儲單元數(shù)量和功能。

小結(jié)

顯然,人工智能、數(shù)據(jù)中心的應(yīng)用還將拉動HBM的需求,但從成本來看,HBM的平均售價至少是DRAM的三倍,前不久受ChatGPT的拉動,HBM的價格更是水漲船高,消息人士稱,與性能最高的DRAM相比HBM3的價格上漲了五倍。不過,這一市場前景也正是DRAM存儲廠商投入技術(shù)和產(chǎn)品的動力。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 塊存儲
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    2299
  • HBM3
    +關(guān)注

    關(guān)注

    0

    文章

    74

    瀏覽量

    132
收藏 人收藏

    評論

    相關(guān)推薦

    HBM4到來前夕,HBM熱出現(xiàn)兩極分化

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)高帶寬存儲HBM由于生成式AI的到來而異軍突起,成為AI訓(xùn)練不可或缺
    的頭像 發(fā)表于 09-23 12:00 ?2448次閱讀

    HBM格局生變!傳三星HBM3量產(chǎn)供貨英偉達(dá),國內(nèi)廠商積極布局

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)根據(jù)韓媒sedaily 的最新報道,三星華城17號產(chǎn)線已開始量產(chǎn)并向英偉達(dá)供應(yīng)HBM3內(nèi)存。同時,美光已經(jīng)為英偉達(dá)供應(yīng)HBM3E。至此,高端HBM內(nèi)存的供應(yīng)由SK海力士
    的頭像 發(fā)表于 07-23 00:04 ?3520次閱讀

    DRAM存儲器的基本單元

    DRAM(Dynamic Random Access Memory),即動態(tài)隨機存取存儲器,是現(xiàn)代計算機系統(tǒng)中不可或缺的內(nèi)存組件。其基本單元的設(shè)計簡潔而高效,主要由一個晶體管(MOSFET)和一個電容組成,這一組合使得
    的頭像 發(fā)表于 09-10 14:42 ?467次閱讀

    3D DRAM內(nèi)嵌AI芯片,AI計算性能暴增

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)盡管當(dāng)前AI訓(xùn)練主要采用GPU+HBM的方案,不過一些新的技術(shù)仍然希望進(jìn)一步打破存儲數(shù)據(jù)傳輸帶來的瓶頸問題。最近,NEO半導(dǎo)體宣布開發(fā)其
    的頭像 發(fā)表于 08-16 00:08 ?3025次閱讀
    <b class='flag-5'>3</b>D <b class='flag-5'>DRAM</b>內(nèi)嵌<b class='flag-5'>AI</b>芯片,<b class='flag-5'>AI</b>計算性能暴增

    三星電子與SK海力士加大DRAMHBM產(chǎn)能,應(yīng)對AI熱潮下的存儲需求

    的先進(jìn)制造基地加大投入,提升DRAM(動態(tài)隨機存取存儲器)及高帶寬存儲器(HBM)的產(chǎn)量,力求在AI市場的浪潮中占據(jù)更有利的位置。
    的頭像 發(fā)表于 07-08 12:54 ?422次閱讀

    中國AI芯片和HBM市場的未來

     然而,全球HBM產(chǎn)能幾乎被SK海力士、三星和美光壟斷,其中SK海力士占據(jù)AI GPU市場80%份額,是Nvidia HBM3內(nèi)存獨家供應(yīng)商,且已于今年3月啟動
    的頭像 發(fā)表于 05-28 09:40 ?704次閱讀

    SK海力士成功量產(chǎn)超高性能AI存儲HBM3E

    HBM3E的推出,標(biāo)志著SK海力士在高性能存儲器領(lǐng)域取得了重大突破,將現(xiàn)有DRAM技術(shù)推向了新的高度。
    的頭像 發(fā)表于 03-20 15:23 ?954次閱讀

    SK海力士HBM3E正式量產(chǎn),鞏固AI存儲領(lǐng)域的領(lǐng)先地位

    SK海力士作為HBM3E的首發(fā)玩家,預(yù)計這款最新產(chǎn)品的大批量投產(chǎn)及其作為業(yè)內(nèi)首家供應(yīng)HBM3制造商所累積的經(jīng)驗,將進(jìn)一步強化公司在AI存儲器市場的領(lǐng)導(dǎo)者地位。
    的頭像 發(fā)表于 03-19 15:18 ?890次閱讀

    HBMHBM2、HBM3HBM3e技術(shù)對比

    AI服務(wù)器出貨量增長催化HBM需求爆發(fā),且伴隨服務(wù)器平均HBM容量增加,經(jīng)測算,預(yù)期25年市場規(guī)模約150億美元,增速超過50%。
    發(fā)表于 03-01 11:02 ?1044次閱讀
    <b class='flag-5'>HBM</b>、<b class='flag-5'>HBM</b>2、<b class='flag-5'>HBM3</b>和<b class='flag-5'>HBM3</b>e技術(shù)對比

    AMD發(fā)布HBM3e AI加速器升級版,2025年推新款I(lǐng)nstinct MI

    目前,只有英偉達(dá)的Hopper GH200芯片配備了HBM3e內(nèi)存。與現(xiàn)有的HBM3相比,HBM3e的速度提升了50%,單個平臺可以達(dá)到10TB/s的帶寬,單顆芯片能夠?qū)崿F(xiàn)5TB/s的傳輸速率,內(nèi)存容量高達(dá)141GB。
    的頭像 發(fā)表于 02-25 11:22 ?501次閱讀

    SK海力士第四季轉(zhuǎn)虧為盈 HBM3營收增長5倍

    韓國存儲芯片巨頭SK海力士在2023年12月31日公布的第四季度財報中,展現(xiàn)出強大的增長勢頭。數(shù)據(jù)顯示,公司的主力產(chǎn)品DDR5 DRAMHBM3的營收較2022年分別增長了4倍和5倍以上,成為推動公司營收增長的主要力量。
    的頭像 發(fā)表于 01-26 16:32 ?1112次閱讀

    AI大模型不斷拉高上限,內(nèi)存控制器IP提早部署,力拱HBM3E的到來

    數(shù)據(jù)量、復(fù)雜度在增加,HBM內(nèi)存被徹底帶火。這種高帶寬高速的內(nèi)存十分適合于AI訓(xùn)練場景。最近,內(nèi)存芯片廠商已經(jīng)不約而同地切入HBM3E競爭當(dāng)中。內(nèi)存控制器IP廠商Rambus也率先發(fā)布
    的頭像 發(fā)表于 12-13 15:33 ?1346次閱讀
    <b class='flag-5'>AI</b>大模型不斷拉高上限,內(nèi)存控制器IP提早部署,力拱<b class='flag-5'>HBM3</b>E的到來

    Rambus通過9.6 Gbps HBM3內(nèi)存控制器IP大幅提升AI性能

    Gbps 的性能,可支持 HBM3 標(biāo)準(zhǔn)的持續(xù)演進(jìn)。相比 HBM3 Gen1 6.4 Gbps 的數(shù)據(jù)速率,Rambus HBM3 內(nèi)存控制器的數(shù)據(jù)速率提高了 50%,總內(nèi)存吞吐量超過 1.2 TB/s,適用于推薦系統(tǒng)的
    的頭像 發(fā)表于 12-07 14:16 ?662次閱讀

    Rambus通過9.6 Gbps HBM3內(nèi)存控制器IP大幅提升AI性能

    為增強AI/ML及其他高級數(shù)據(jù)中心工作負(fù)載打造的 Rambus 高性能內(nèi)存 IP產(chǎn)品組合 高達(dá)9.6 Gbps的數(shù)據(jù)速率,支持HBM3內(nèi)存標(biāo)準(zhǔn)的未來演進(jìn) 實現(xiàn)業(yè)界領(lǐng)先的1.2 TB/s以上內(nèi)存吞吐量
    發(fā)表于 12-07 11:01 ?222次閱讀
     Rambus通過9.6 Gbps <b class='flag-5'>HBM3</b>內(nèi)存控制器IP大幅提升<b class='flag-5'>AI</b>性能

    追趕SK海力士,三星、美光搶進(jìn)HBM3E

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)新型存儲HBM隨著AI訓(xùn)練需求的攀升顯示出越來越重要的地位。從2013年SK海力士推出第一代HBM來看,
    的頭像 發(fā)表于 10-25 18:25 ?2898次閱讀
    追趕SK海力士,三星、美光搶進(jìn)<b class='flag-5'>HBM3</b>E