0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度解析HBM內(nèi)存技術(shù)

架構(gòu)師技術(shù)聯(lián)盟 ? 來源:架構(gòu)師技術(shù)聯(lián)盟 ? 2024-01-02 09:59 ? 次閱讀

HBM作為基于3D堆棧工藝的高性能DRAM,打破內(nèi)存帶寬及功耗瓶頸。HBM(High Bandwidth Memory)即高帶寬存儲(chǔ)器,通過使用先進(jìn)封裝(如TSV硅通孔、微凸塊)將多個(gè)DRAM芯片進(jìn)行堆疊,并與GPU一同進(jìn)行封裝,形成大容量、高帶寬的DDR組合陣列。

HBM通過與處理器相同的“Interposer”中間介質(zhì)層與計(jì)算芯片實(shí)現(xiàn)緊湊連接,一方面既節(jié)省了芯片面積,另一方面又顯著減少了數(shù)據(jù)傳輸時(shí)間;此外HBM采用TSV工藝進(jìn)行3D堆疊,不僅顯著提升了帶寬,同時(shí)降低了功耗,實(shí)現(xiàn)了更高的集成度。

6c359f5a-a623-11ee-8b88-92fbcf53809c.png

HBM性能遠(yuǎn)超GDDR,成為當(dāng)前GPU存儲(chǔ)單元理想解決方案。GPU顯存一般采用GDDR或者HBM兩種方案,但HBM性能遠(yuǎn)超GDDR。

根據(jù)AMD數(shù)據(jù),從顯存位寬來看,GDDR5為32-bit,HBM為其四倍,達(dá)到了1024-bit;從時(shí)鐘頻率來看,HBM為500MHz,遠(yuǎn)遠(yuǎn)小于GDDR5的1750MHz;從顯存帶寬來看,HBM的一個(gè)stack大于100GB/s,而GDDR5的一顆芯片才25GB/s,所以HBM的數(shù)據(jù)傳輸速率遠(yuǎn)遠(yuǎn)高于GDDR5。

從空間利用角度來看,HBM由于與GPU封裝在一塊,從而大幅度減少了顯卡PCB的空間,而GDDR5芯片面積為HBM芯片三倍,這意味著HBM能夠在更小的空間內(nèi),實(shí)現(xiàn)更大的容量。因此,HBM可以在實(shí)現(xiàn)高帶寬和高容量的同時(shí)節(jié)約芯片面積和功耗,被視為GPU存儲(chǔ)單元理想解決方案。

6c443ace-a623-11ee-8b88-92fbcf53809c.png

在高性能GPU需求推動(dòng)下,HBM目前已經(jīng)成為AI服務(wù)器的搭載標(biāo)配。AI大模型的興起催生了海量算力需求,而數(shù)據(jù)處理量和傳輸速率大幅提升使得AI服務(wù)器對(duì)芯片內(nèi)存容量和傳輸帶寬提出更高要求。

HBM具備高帶寬、高容量、低延時(shí)和低功耗優(yōu)勢(shì),目前已逐步成為AI服務(wù)器中GPU的搭載標(biāo)配。英偉達(dá)推出的多款用于AI訓(xùn)練的芯片A100、H100和H200,都采用了HBM顯存。

其中,A100和H100芯片搭載了40GB的HBM2e和80GB的HBM3顯存,最新的H200芯片搭載了速率更快、容量更高的HBM3e。AMD的MI300系列也都采用了HBM3技術(shù),MI300A的容量與前一代相同為128GB,而更高端的MI300X則將容量提升至192GB,增長了50%,相當(dāng)于H100容量的2.4倍。

HBM市場競爭激烈,HBM產(chǎn)品向低能耗、高帶寬、高容量加速迭代。從2016年第一代HBM1發(fā)布開始,HBM目前已經(jīng)迭代到第五代產(chǎn)品——HBM3e,縱觀五代HBM產(chǎn)品性能變化,可以發(fā)現(xiàn)HBM在帶寬、I/O速率、容量、工藝節(jié)點(diǎn)等方面取得較大突破,其中帶寬由初代的128GB/s迭代至HBM3e的1TB/s,I/O速率由1Gbps迭代至8Gbps,容量從1GB增至最高36GB,制造工藝則取得進(jìn)一步突破,達(dá)到5nm級(jí)別。

最新一代HBM3e數(shù)據(jù)處理速度最高可達(dá)到1.15TB/s,HBM系列產(chǎn)品的更新迭代將在低能耗、高帶寬、高容量上持續(xù)發(fā)力,以高性能牽引AI技術(shù)進(jìn)一步革新。

6c481310-a623-11ee-8b88-92fbcf53809c.png

HBM產(chǎn)品迭代助力AI芯片性能升級(jí)。當(dāng)?shù)貢r(shí)間2023年11月13日,英偉達(dá)發(fā)布了首款搭載最先進(jìn)存儲(chǔ)技術(shù)HBM3e的GPU芯片H200。H200作為首款搭載最先進(jìn)存儲(chǔ)技術(shù)HBM3e的GPU,擁有141GB顯存容量和4.8TB/s顯存帶寬,與H100的80GB和3.35TB/s相比,顯存容量增加76%,顯存帶寬增加43%。

盡管GPU核心未升級(jí),但H200憑借更大容量、更高帶寬的顯存,依舊在人工智能大模型計(jì)算方面實(shí)現(xiàn)顯著提升。根據(jù)英偉達(dá)官方數(shù)據(jù),在單卡性能方面,H200相比H100,在Llama2的130億參數(shù)訓(xùn)練中速度提升40%,在GPT-3的1750億參數(shù)訓(xùn)練中提升60%,在Llama2的700億參數(shù)訓(xùn)練中提升90%;在降低能耗、減少成本方面,H200的TCO(總擁有成本)達(dá)到了新水平,最高可降低一半的能耗。

6c5d14d6-a623-11ee-8b88-92fbcf53809c.png

HBM市場目前被三大原廠占據(jù),其中海力士份額領(lǐng)先,占據(jù)HBM市場主導(dǎo)地位。據(jù)TrendForce數(shù)據(jù),三大原廠海力士、三星、美光2022年HBM市占率分別為50%、40%、10%。2023年年初至今,生成式AI市場呈爆發(fā)式增長,大模型參數(shù)量、預(yù)訓(xùn)練數(shù)據(jù)量攀升,驅(qū)動(dòng)AI服務(wù)器對(duì)高帶寬、高容量的HBM需求迅速增加。

作為最先開發(fā)出HBM芯片的海力士,在AIGC行業(yè)迅速發(fā)展背景下得以搶占先機(jī),率先實(shí)現(xiàn)HBM3量產(chǎn),搶占市場份額。2023年下半年英偉達(dá)高性能GPUH100與AMD MI300將搭載海力士生產(chǎn)的HBM3,海力士市占率將進(jìn)一步提升,預(yù)計(jì)2023年海力士、三星、美光市占率分別為53%、38%、9%。

6c60d3b4-a623-11ee-8b88-92fbcf53809c.png

6c79aed4-a623-11ee-8b88-92fbcf53809c.png

TSV技術(shù)通過垂直堆疊多個(gè)DRAM,能顯著提升存儲(chǔ)容量、帶寬并降低功耗。TSV(硅通孔)技術(shù)通過在芯片與芯片之間、晶圓和晶圓之間制作垂直導(dǎo)通,并通過銅、鎢、多晶硅等導(dǎo)電物質(zhì)的填充,實(shí)現(xiàn)硅通孔的垂直電氣互聯(lián)。

作為實(shí)現(xiàn)3D先進(jìn)封裝的關(guān)鍵技術(shù)之一,對(duì)比wire bond疊層封裝,TSV可以提供更高的互連密度和更短的數(shù)據(jù)傳輸路徑,因此具有更高的性能和傳輸速度。隨著摩爾定律放緩,芯片特征尺寸接近物理極限,半導(dǎo)體器件的微型化也越來越依賴于集成TSV的先進(jìn)封裝。目前DRAM行業(yè)中,3D-TSVDRAM和HBM已經(jīng)成功生產(chǎn)TSV,克服了容量和帶寬的限制。

6c8cd018-a623-11ee-8b88-92fbcf53809c.png

TSV為HBM核心工藝,在HBM3D封裝成本中占比約30%。根據(jù)SAMSUNG,3D TSV工藝較傳統(tǒng)POP封裝形式節(jié)省了35%的封裝尺寸,降低了50%的功耗,并且對(duì)比帶來了8倍的帶寬提升。對(duì)4層存儲(chǔ)芯片和一層邏輯裸芯進(jìn)行3D堆疊的成本進(jìn)行分析,TSV形成和顯露的成本合計(jì)占比,對(duì)應(yīng)99.5%和99%兩種鍵合良率的情形分別為30%和28%,超過了前/后道工藝的成本占比,是HBM3D封裝中成本占比最高的部分。

6c9ee028-a623-11ee-8b88-92fbcf53809c.png

TSV技術(shù)主要涉及深孔刻蝕、沉積、減薄拋光等關(guān)鍵工藝。TSV首先利用深反應(yīng)離子刻蝕(DRIE)法制作通孔;然后使用化學(xué)氣相沉積(PECVD)的方法沉積制作介電層、使用物理氣相沉積(PVD)的方法沉積制作阻擋層和種子層;再選擇電鍍銅(Cu)進(jìn)行填孔;最后使用化學(xué)和機(jī)械拋光(CMP)法去除多余的銅。另外,由于芯片堆疊集成的需要,在完成銅填充后,還需要晶圓減薄和鍵合。

6ca42ad8-a623-11ee-8b88-92fbcf53809c.png

HBM多層堆疊結(jié)構(gòu)提升工序步驟,帶動(dòng)封裝設(shè)備需求持續(xù)提升。(1)前道環(huán)節(jié):HBM需要通過TSV進(jìn)行垂直方向連接,增加了TSV刻蝕設(shè)備需求,同時(shí)HBM中TSV、微凸點(diǎn)、硅中介層等工藝大量增加了前道工序,給前道檢、量測設(shè)備帶來增量;(2)后道環(huán)節(jié):HBM堆疊結(jié)構(gòu)增多,要求晶圓厚度不斷降低,這意味著對(duì)減薄、鍵合等設(shè)備的需求提升;HBM多層堆疊結(jié)構(gòu)依靠超薄晶圓和銅銅混合鍵合工藝增加了對(duì)臨時(shí)鍵合/解鍵合等設(shè)備的需求;(3)各層DRAM Die的保護(hù)材料也非常關(guān)鍵,對(duì)注塑或壓塑設(shè)備提出了較高要求。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7402

    瀏覽量

    163385
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4631

    瀏覽量

    128440
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    2942

    瀏覽量

    73726
  • 內(nèi)存技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    25

    瀏覽量

    9813
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    0

    文章

    351

    瀏覽量

    14655

原文標(biāo)題:HBM內(nèi)存技術(shù)全面對(duì)比分析

文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    簡述HBM技術(shù)的重要性

    眾所周知,數(shù)據(jù)處理需求呈指數(shù)級(jí)增長,芯片技術(shù)正奮力攀登至性能極限的巔峰。高帶寬內(nèi)存HBM)以其開創(chuàng)性的內(nèi)存堆疊技術(shù)獨(dú)占鰲頭,導(dǎo)致其容量需求
    的頭像 發(fā)表于 09-23 11:48 ?563次閱讀
    簡述<b class='flag-5'>HBM</b><b class='flag-5'>技術(shù)</b>的重要性

    追求性能提升 使用8GB HBM2顯存

    2015年AMD推出了Fiji核心的Fury家族顯卡,率先使用了HBM顯存,由此給GPU市場帶來了一場革命,盡管Fury系列顯卡市場上不算成功,但AMD在技術(shù)探索上勇氣可嘉,值得稱贊。不過在新一代
    發(fā)表于 12-07 15:54

    AUTOSAR架構(gòu)深度解析 精選資料推薦

    AUTOSAR架構(gòu)深度解析本文轉(zhuǎn)載于:AUTOSAR架構(gòu)深度解析目錄AUTOSAR架構(gòu)深度解析A
    發(fā)表于 07-28 07:40

    AUTOSAR架構(gòu)深度解析 精選資料分享

    AUTOSAR架構(gòu)深度解析本文轉(zhuǎn)載于:AUTOSAR架構(gòu)深度解析AUTOSAR的分層式設(shè)計(jì),用于支持完整的軟件和硬件模塊的獨(dú)立性(Independence),中間RTE(Runtime
    發(fā)表于 07-28 07:02

    C語言深度解析

    C語言深度解析,本資料來源于網(wǎng)絡(luò),對(duì)C語言的學(xué)習(xí)有很大的幫助,有著較為深刻的解析,可能會(huì)對(duì)讀者有一定的幫助。
    發(fā)表于 09-28 07:00

    全面解構(gòu)FuzionSC如何高速組裝HBM內(nèi)存

    環(huán)球儀器旗下的FuzionSC半導(dǎo)體貼片機(jī)系列,能以表面貼裝速度實(shí)現(xiàn)半導(dǎo)體封裝的精準(zhǔn)技術(shù)。FuzionSC貼片機(jī)之所以能精確高組裝HBM內(nèi)存,皆因配備以下神器:
    的頭像 發(fā)表于 09-04 09:28 ?2229次閱讀
    全面解構(gòu)FuzionSC如何高速組裝<b class='flag-5'>HBM</b><b class='flag-5'>內(nèi)存</b>

    HBM內(nèi)存:韓國人的游戲

    HBM技術(shù)之下,DRAM芯片從2D轉(zhuǎn)變?yōu)?D,可以在很小的物理空間里實(shí)現(xiàn)高容量、高帶寬、低延時(shí)與低功耗,因而HBM被業(yè)界視為新一代內(nèi)存解決方案。
    的頭像 發(fā)表于 06-30 16:31 ?926次閱讀
    <b class='flag-5'>HBM</b><b class='flag-5'>內(nèi)存</b>:韓國人的游戲

    深度解析三星內(nèi)存處理技術(shù)(PIM)

    在Hot Chips 2023上,三星展示了內(nèi)存技術(shù)內(nèi)存的主要成本是將數(shù)據(jù)從各種存儲(chǔ)和內(nèi)存位置傳輸?shù)綄?shí)際的計(jì)算引擎。
    發(fā)表于 10-07 11:03 ?936次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>解析</b>三星<b class='flag-5'>內(nèi)存</b>處理<b class='flag-5'>技術(shù)</b>(PIM)

    一文解析HBM技術(shù)原理及優(yōu)勢(shì)

    HBM技術(shù)是一種基于3D堆疊工藝的高性能DRAM,它可以為高性能計(jì)算、人工智能、數(shù)據(jù)中心等領(lǐng)域提供高帶寬、高容量、低延遲和低功耗的存儲(chǔ)解決方案。本文將介紹HBM技術(shù)的原理、優(yōu)勢(shì)、應(yīng)用和
    發(fā)表于 11-09 12:32 ?1.4w次閱讀

    Rambus通過9.6 Gbps HBM3內(nèi)存控制器IP大幅提升AI性能

    為增強(qiáng)AI/ML及其他高級(jí)數(shù)據(jù)中心工作負(fù)載打造的 Rambus 高性能內(nèi)存 IP產(chǎn)品組合 高達(dá)9.6 Gbps的數(shù)據(jù)速率,支持HBM3內(nèi)存標(biāo)準(zhǔn)的未來演進(jìn) 實(shí)現(xiàn)業(yè)界領(lǐng)先的1.2 TB/s以上內(nèi)存
    發(fā)表于 12-07 11:01 ?222次閱讀
     Rambus通過9.6 Gbps <b class='flag-5'>HBM</b>3<b class='flag-5'>內(nèi)存</b>控制器IP大幅提升AI性能

    英偉達(dá)斥資預(yù)購HBM3內(nèi)存,為H200及超級(jí)芯片儲(chǔ)備產(chǎn)能

    據(jù)最新傳聞,英偉達(dá)正在籌劃發(fā)布兩款搭載HBM3E內(nèi)存的新品——包括141GB HBM3E的H200 GPU及GH200超級(jí)芯片,這也進(jìn)一步說明了對(duì)于HBM
    的頭像 發(fā)表于 01-02 09:27 ?657次閱讀

    什么是HBM3E內(nèi)存?Rambus HBM3E/3內(nèi)存控制器內(nèi)核

    Rambus HBM3E/3 內(nèi)存控制器內(nèi)核針對(duì)高帶寬和低延遲進(jìn)行了優(yōu)化,以緊湊的外形和高能效的封裝為人工智能訓(xùn)練提供了最大的性能和靈活性。
    發(fā)表于 03-20 14:12 ?2093次閱讀
    什么是<b class='flag-5'>HBM</b>3E<b class='flag-5'>內(nèi)存</b>?Rambus <b class='flag-5'>HBM</b>3E/3<b class='flag-5'>內(nèi)存</b>控制器內(nèi)核

    英偉達(dá)CEO贊譽(yù)三星HBM內(nèi)存,計(jì)劃采購

     提及此前有人預(yù)測英偉達(dá)可能向三星購買HBM3或HBM3E等內(nèi)存,黃仁勛在會(huì)上直接認(rèn)可三星實(shí)力,稱其為“極具價(jià)值的公司”。他透露目前已對(duì)三星HBM內(nèi)
    的頭像 發(fā)表于 03-20 16:17 ?744次閱讀

    SK海力士將采用臺(tái)積電7nm制程生產(chǎn)HBM4內(nèi)存基片

    HBM內(nèi)存基礎(chǔ)裸片即DRAM堆疊基座,兼具與處理器通信的控制功能。SK海力士近期與臺(tái)積電簽訂HBM內(nèi)存合作協(xié)議,首要任務(wù)便是提升HBM基礎(chǔ)邏
    的頭像 發(fā)表于 04-23 16:41 ?701次閱讀

    SK海力士加速HBM4E內(nèi)存研發(fā),預(yù)計(jì)2026年面市

    HBM 制造商 Kim Gwi-wook 宣布,由于市場需求,SK海力士將提速研發(fā)進(jìn)程,預(yù)計(jì)最快在 2026 年推出 HBM4E 內(nèi)存在內(nèi)存帶寬上比 HBM4 提升 1.4 倍。
    的頭像 發(fā)表于 05-14 10:23 ?364次閱讀