0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HBM的未來(lái)

sakobpqhz ? 來(lái)源:算力基建 ? 2023-11-15 15:50 ? 次閱讀

01.HBM

高帶寬內(nèi)存(HBM)正在成為超大規(guī)模廠商的首選內(nèi)存,但其在主流市場(chǎng)的最終命運(yùn)仍然存在疑問(wèn)。雖然它在數(shù)據(jù)中心中已經(jīng)很成熟,并且由于人工智能/機(jī)器學(xué)習(xí)的需求導(dǎo)致使用量不斷增加,但其基本設(shè)計(jì)固有的缺陷阻礙了更廣泛的采用。另一方面,HBM 提供結(jié)構(gòu)緊湊的 2.5D 結(jié)構(gòu)尺寸,可大幅減少延遲。

Rambus產(chǎn)品營(yíng)銷(xiāo)高級(jí)總監(jiān) Frank Ferro 在 Rambus 設(shè)計(jì)展會(huì)上發(fā)表演講時(shí)表示:“HBM 的優(yōu)點(diǎn)在于,可以在可變的范圍內(nèi)獲得所有這些帶寬,并且表示獲得了非常好的功耗?!?/p>

8e238020-8371-11ee-939d-92fbcf53809c.png

圖1:實(shí)現(xiàn)最大數(shù)據(jù)吞吐量的HBM堆棧

“目前困擾高帶寬內(nèi)存的問(wèn)題之一是成本,”Cadence IP 團(tuán)隊(duì)產(chǎn)品營(yíng)銷(xiāo)總監(jiān) Marc Greenberg 說(shuō)道?!?D 成本相當(dāng)高,相當(dāng)于有一個(gè)邏輯芯片位于芯片的底部,這是你必須支付的額外硅片。然后是硅層,它位于CPUGPU以及HBM內(nèi)存的下面。然后,你需要一個(gè)更大的封裝,等等。目前現(xiàn)存的HBM切割了消費(fèi)者領(lǐng)域,并更早放置在服務(wù)器機(jī)房或數(shù)據(jù)中心,存在許多系統(tǒng)成本。相比之下,GDDR6等圖形內(nèi)存雖然無(wú)法提供與HBM一樣多的性能,但成本卻顯著降低。GDDR6的單位成本性能實(shí)際上比 HBM 好,但 GDDR6 器件的最大帶寬與 HBM 的最大帶寬不匹配?!?/p>

Greenberg表示,這些差異為公司選擇 HBM 提供了令人信服的理由,即使它可能不是他們的第一選擇。“HBM 提供充足的帶寬,并且每比特傳輸?shù)哪芰繕O低。使用 HBM 是因?yàn)槟惚仨氝@樣做,因?yàn)闆](méi)有其他解決方案可以為你提供所需的帶寬或所需的功率?!?/p>

而且 HBM 只會(huì)變得越來(lái)越快?!拔覀冾A(yù)計(jì) HBM3 Gen2 的帶寬將提高 50%,”美光計(jì)算產(chǎn)品事業(yè)部副總裁兼總經(jīng)理 Praveen Vaidyanathan 說(shuō)道?!皬拿拦獾慕嵌葋?lái)看,我們預(yù)計(jì) HBM3 Gen2產(chǎn)品將在2024財(cái)年實(shí)現(xiàn)量產(chǎn)。在2024日歷年初,我們預(yù)計(jì)隨著時(shí)間的流逝,它將開(kāi)始為收入做出貢獻(xiàn)。此外,我們預(yù)測(cè)美光的HBM3將貢獻(xiàn)比DRAM更高利潤(rùn)?!?/p>

盡管如此,成本因素可能會(huì)像許多設(shè)計(jì)團(tuán)隊(duì)一樣考慮更有性價(jià)比的替代方案。

Greenberg指出:“如果有任何方法可以將大問(wèn)題解析為更小的部分,你可能會(huì)發(fā)現(xiàn)它提高了成本效益。例如,面對(duì)一個(gè)巨大的問(wèn)題并且必須在一個(gè)硬件上執(zhí)行所有這些操作,而且我必須在那里使用 HBM,也許我可以將其中斷兩個(gè)部分。讓兩個(gè)進(jìn)程任務(wù)運(yùn)行,另外一部分可能連接到 DDR6。如果我能夠?qū)?wèn)題闡釋為更小的部分,那么我可能會(huì)以更小成本完成相同數(shù)量的計(jì)算。但如果你需要那么大的帶寬,那么 HBM 就是你唯一的選擇。”

另一個(gè)主要缺點(diǎn)是HBM 的 2.5D 結(jié)構(gòu)會(huì)積聚熱量,而其放置在接近 CPU 和 GPU 的位置會(huì)加劇這種情況。事實(shí)上,在嘗試給出不良設(shè)計(jì)的理論樣本時(shí),很難想出比當(dāng)前樣本更糟糕的東西,當(dāng)前布局將 HBM及其熱敏 DRAM 堆棧放置在計(jì)算密集型熱源附近,導(dǎo)致散熱很難處理。

“最大的挑戰(zhàn)是數(shù)據(jù),”Greenberg說(shuō)?!澳阌幸粋€(gè)CPU,根據(jù)定義它會(huì)生成大量數(shù)據(jù)。你通過(guò)這個(gè)接口每秒T bits,即使每次消耗只有皮焦耳熱,但每秒都會(huì)執(zhí)行十億次計(jì)算,因此你的CPU會(huì)非常熱。它不僅僅是移動(dòng)周?chē)臄?shù)據(jù)。它也必須進(jìn)行計(jì)算。最重要的是最不喜歡熱的半導(dǎo)體組件,即DRAM。85 ℃左右它開(kāi)始忘記東西,125℃左右則心不在焉。這是兩個(gè)完全不同的事情?!?/p>

還有一個(gè)可取之處?!皳碛?.5D堆棧的優(yōu)勢(shì)在于,CPU很熱,但可以間隔一定物理距離把HBM位于CPU旁邊,這樣會(huì)犧牲延時(shí)性能?!彼f(shuō)。

但是Synopsys 內(nèi)存接口 IP 解決方案產(chǎn)品線總監(jiān) Brett Murdock說(shuō)道,“在延遲和熱量之間的權(quán)衡中,延遲是不能變的。我沒(méi)有看到任何人犧牲延遲,我希望他們推動(dòng)物理團(tuán)隊(duì)尋找更多好的冷卻方式,或者更好的放置方式,以保持較低的延遲?!?/p>

02.HBM和AI

雖然很容易想象計(jì)算是 AI/ML 最密集的部分,但如果沒(méi)有良好的內(nèi)存架構(gòu),這一切都不會(huì)發(fā)生。需要內(nèi)存來(lái)存儲(chǔ)和檢索數(shù)萬(wàn)億次計(jì)算。事實(shí)上,在某種程度上添加更多 CPU 并不會(huì)提高系統(tǒng)性能,因?yàn)閮?nèi)存帶寬無(wú)法支持它們。這就是臭名昭著的“內(nèi)存墻”瓶頸。

Quadric首席營(yíng)銷(xiāo)官 Steve Roddy 表示,從最廣泛的定義來(lái)看,學(xué)習(xí)機(jī)器只是曲線函數(shù)?!霸谟?xùn)練運(yùn)行的每次迭代中,你都在努力越來(lái)越接近曲線的最佳函數(shù)。這是一個(gè)XY圖,就像高中幾何課一樣。大型語(yǔ)言模型基本上是同一件事,但是是100億維,而不是2維?!?/p>

因此,計(jì)算相對(duì)簡(jiǎn)單,但內(nèi)存架構(gòu)可能非常驚人。

Roddy 解釋說(shuō):“其中一些模型擁有 1000 億字節(jié)的數(shù)據(jù),對(duì)于每次重新訓(xùn)練迭代,你都必須通過(guò)數(shù)據(jù)中心的背板從磁盤(pán)上取出 1000 億字節(jié)的數(shù)據(jù)并放入計(jì)算箱中?!薄霸趦蓚€(gè)月的訓(xùn)練過(guò)程中,你必須將這組巨大的內(nèi)存值來(lái)回移動(dòng)數(shù)百萬(wàn)次。限制因素是數(shù)據(jù)的移入和移出,這就是為什么人們對(duì) HBM 或光學(xué)互連從內(nèi)存?zhèn)鬏數(shù)接?jì)算結(jié)構(gòu)的東西感興趣。所有這些都是人們投入數(shù)億美元風(fēng)險(xiǎn)投資的地方,因?yàn)槿绻隳苓M(jìn)行每周距離或時(shí)間,你就可以最大程度地簡(jiǎn)化每周訓(xùn)練過(guò)程,無(wú)論是切斷電源還是加快速度?!?/p>

由于所有這些原因,高帶寬內(nèi)存被認(rèn)為是 AI/ML 的首選內(nèi)存?!八峁┝艘恍┯?xùn)練算法所需的最大帶寬,”Rambus 的 Ferro 說(shuō)?!皬目梢該碛卸鄠€(gè)內(nèi)存堆棧從角度來(lái)看,它是可配置的,這提供了非常高的帶寬?!?/p>

這就是人們對(duì) HBM 如此感興趣的原因。Synopsys的大多數(shù)客戶都是人工智能客戶,所以他們正在 LPDDR5X 接口和 HBM 接口之間進(jìn)行一項(xiàng)重大的基本權(quán)衡。他們忽略了成本。他們真的很渴望 HBM。這是他們對(duì)技術(shù)的渴望,因?yàn)橥ㄟ^(guò)HBM能夠在一個(gè) SoC 周?chē)鷦?chuàng)建可以足夠大的帶寬量?,F(xiàn)在,他們可以在SoC 周?chē)胖昧?6 個(gè) HBM 堆棧。

然而,人工智能的需求如此之高,以至于HBM減少延遲的前沿特征又推動(dòng)了下一代HBM的發(fā)展。

“延遲正在成為一個(gè)真正的問(wèn)題,”Ferro說(shuō)。“在 HBM 的前兩代中,我沒(méi)有聽(tīng)到任何人抱怨延遲。現(xiàn)在我們一直收到有關(guān)延遲的問(wèn)題?!?/p>

Ferro 建議,抓住當(dāng)前的限制,了解數(shù)據(jù)結(jié)構(gòu)極其重要?!八赡苁沁B續(xù)的數(shù)據(jù),例如視頻語(yǔ)音識(shí)別。也可能是事務(wù)性的,就像財(cái)務(wù)數(shù)據(jù)一樣,可能非常隨機(jī)。如果你知道數(shù)據(jù)是隨機(jī)的,那么設(shè)置內(nèi)存接口的方式將與流式傳輸視頻不同。這些是基本問(wèn)題,但也有層次的問(wèn)題。我要在內(nèi)存中使用的字長(zhǎng)是多少??jī)?nèi)存的塊大小是多少?這個(gè)了解得越多,你設(shè)計(jì)系統(tǒng)的效率就越大。如果你了解了,那么你可以定制處理器,從而最大限度地提高計(jì)算能力和內(nèi)存帶寬。我們看到越來(lái)越多的 ASIC 式 SoC 正在瞄準(zhǔn)特定的目標(biāo)市場(chǎng)剖析市場(chǎng),以實(shí)現(xiàn)更高效的處理?!?/p>

降低 HBM 成本將是一項(xiàng)挑戰(zhàn)。由于將 TSV 放置在晶圓上的成本很高,因此加工成本已經(jīng)明顯高于標(biāo)準(zhǔn) DRAM。這使得它無(wú)法擁有像標(biāo)準(zhǔn) DRAM 一樣大的市場(chǎng)。由于市場(chǎng)較小,規(guī)模經(jīng)濟(jì)導(dǎo)致成本在一個(gè)自給自足的過(guò)程中更高。體積越小,成本越高,但成本越高,使用的體積就越少。沒(méi)有簡(jiǎn)單的方法可以解決這個(gè)問(wèn)題。盡管如此,HBM 已經(jīng)是一個(gè)成熟的 JEDEC 標(biāo)準(zhǔn)產(chǎn)品,這是一種獨(dú)特的 DRAM 技術(shù)形式,能夠以比 SRAM 低得多的成本提供極高的帶寬。它還可以通過(guò)封裝提供比 SRAM 更高的密度。它會(huì)隨著時(shí)間的推移而改進(jìn),就像 DRAM 一樣。隨著接口的成熟,預(yù)計(jì)會(huì)看到更多巧妙的技巧來(lái)提高其速度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46316

    瀏覽量

    236467
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8320

    瀏覽量

    132164
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    0

    文章

    351

    瀏覽量

    14655

原文標(biāo)題:HBM的未來(lái)

文章出處:【微信號(hào):算力基建,微信公眾號(hào):算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    HBM4到來(lái)前夕,HBM熱出現(xiàn)兩極分化

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)高帶寬存儲(chǔ)器HBM由于生成式AI的到來(lái)而異軍突起,成為AI訓(xùn)練不可或缺的存儲(chǔ)產(chǎn)品。三大HBM廠商SK海力士、三星電子、美光科技也因HBM的供應(yīng)迎來(lái)了業(yè)績(jī)的高增長(zhǎng)。只是
    的頭像 發(fā)表于 09-23 12:00 ?2437次閱讀

    HBM3E量產(chǎn)后,第六代HBM4要來(lái)了!

    有消息說(shuō)提前到2025年。其他兩家三星電子和美光科技的HBM4的量產(chǎn)時(shí)間在2026年。英偉達(dá)、AMD等處理器大廠都規(guī)劃了HBM4與自家GPU結(jié)合的產(chǎn)品,HBM4將成為未來(lái)AI、HPC、
    的頭像 發(fā)表于 07-28 00:58 ?4657次閱讀
    <b class='flag-5'>HBM</b>3E量產(chǎn)后,第六代<b class='flag-5'>HBM</b>4要來(lái)了!

    HBM上車(chē)之后,移動(dòng)HBM有望用在手機(jī)上

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)據(jù)韓媒報(bào)道,三星和海力士正在開(kāi)發(fā)低功耗DRAM堆疊技術(shù),以用于移動(dòng)設(shè)備上,這類(lèi)DRAM被稱之為移動(dòng)HBM存儲(chǔ)器,并計(jì)劃2026年左右實(shí)現(xiàn)商業(yè)化。 ? 移動(dòng)HBM是堆疊
    的頭像 發(fā)表于 09-06 00:21 ?2903次閱讀
    繼<b class='flag-5'>HBM</b>上車(chē)之后,移動(dòng)<b class='flag-5'>HBM</b>有望用在手機(jī)上

    美光志在HBM市場(chǎng):計(jì)劃未來(lái)兩年大幅提升市占率

    在全球高帶寬內(nèi)存(HBM)市場(chǎng)競(jìng)爭(zhēng)日益激烈的背景下,美光(Micron)近日宣布了其雄心勃勃的市場(chǎng)拓展計(jì)劃。該公司預(yù)計(jì),在2024會(huì)計(jì)年度,將搶下HBM市場(chǎng)超過(guò)20%的份額,而到2025會(huì)計(jì)年度末,市占率更是計(jì)劃挑戰(zhàn)25%的高位。
    的頭像 發(fā)表于 06-07 09:58 ?548次閱讀

    中國(guó)AI芯片和HBM市場(chǎng)的未來(lái)

     然而,全球HBM產(chǎn)能幾乎被SK海力士、三星和美光壟斷,其中SK海力士占據(jù)AI GPU市場(chǎng)80%份額,是Nvidia HBM3內(nèi)存獨(dú)家供應(yīng)商,且已于今年3月啟動(dòng)HBM3E量產(chǎn)。
    的頭像 發(fā)表于 05-28 09:40 ?703次閱讀

    臺(tái)積電準(zhǔn)備生產(chǎn)HBM4基礎(chǔ)芯片

    在近日舉行的2024年歐洲技術(shù)研討會(huì)上,臺(tái)積電透露了關(guān)于HBM4基礎(chǔ)芯片制造的新進(jìn)展。據(jù)悉,未來(lái)HBM4將采用邏輯制程進(jìn)行生產(chǎn),臺(tái)積電計(jì)劃使用其N(xiāo)12和N5制程的改良版來(lái)完成這一任務(wù)。
    的頭像 發(fā)表于 05-21 14:53 ?624次閱讀

    三星電子組建HBM4獨(dú)立團(tuán)隊(duì),力爭(zhēng)奪回HBM市場(chǎng)領(lǐng)導(dǎo)地位

    具體而言,現(xiàn)有的DRAM設(shè)計(jì)團(tuán)隊(duì)將負(fù)責(zé)HBM3E內(nèi)存的進(jìn)一步研發(fā),而三月份新成立的HBM產(chǎn)能質(zhì)量提升團(tuán)隊(duì)則專(zhuān)注于開(kāi)發(fā)下一代HBM內(nèi)存——HBM4。
    的頭像 發(fā)表于 05-10 14:44 ?490次閱讀

    英偉達(dá)CEO贊譽(yù)三星HBM內(nèi)存,計(jì)劃采購(gòu)

     提及此前有人預(yù)測(cè)英偉達(dá)可能向三星購(gòu)買(mǎi)HBM3或HBM3E等內(nèi)存,黃仁勛在會(huì)上直接認(rèn)可三星實(shí)力,稱其為“極具價(jià)值的公司”。他透露目前已對(duì)三星HBM內(nèi)存進(jìn)行測(cè)試,未來(lái)可能增加采購(gòu)量。
    的頭像 發(fā)表于 03-20 16:17 ?744次閱讀

    從兩會(huì)看AI產(chǎn)業(yè)飛躍,HBM需求預(yù)示存儲(chǔ)芯片新機(jī)遇

    高端AI服務(wù)器GPU搭載HBM芯片已成為主流趨勢(shì)。這表明,HBM芯片的需求在未來(lái)一段時(shí)間內(nèi)繼續(xù)保持旺盛,也將為相關(guān)企業(yè)提供了重要的機(jī)遇。
    的頭像 發(fā)表于 03-12 13:59 ?646次閱讀
    從兩會(huì)看AI產(chǎn)業(yè)飛躍,<b class='flag-5'>HBM</b>需求預(yù)示存儲(chǔ)芯片新機(jī)遇

    HBM、HBM2、HBM3和HBM3e技術(shù)對(duì)比

    AI服務(wù)器出貨量增長(zhǎng)催化HBM需求爆發(fā),且伴隨服務(wù)器平均HBM容量增加,經(jīng)測(cè)算,預(yù)期25年市場(chǎng)規(guī)模約150億美元,增速超過(guò)50%。
    發(fā)表于 03-01 11:02 ?1042次閱讀
    <b class='flag-5'>HBM</b>、<b class='flag-5'>HBM</b>2、<b class='flag-5'>HBM</b>3和<b class='flag-5'>HBM</b>3e技術(shù)對(duì)比

    HBM4為何備受存儲(chǔ)行業(yè)關(guān)注?

    當(dāng)前,生成式人工智能已經(jīng)成為推動(dòng)DRAM市場(chǎng)增長(zhǎng)的關(guān)鍵因素,與處理器一起處理數(shù)據(jù)的HBM的需求也必將增長(zhǎng)。未來(lái),隨著AI技術(shù)不斷演進(jìn),HBM將成為數(shù)據(jù)中心的標(biāo)準(zhǔn)配置,而以企業(yè)應(yīng)用為重點(diǎn)場(chǎng)景的存儲(chǔ)卡供應(yīng)商期望提供更快的接口。
    發(fā)表于 12-02 16:30 ?400次閱讀
    <b class='flag-5'>HBM</b>4為何備受存儲(chǔ)行業(yè)關(guān)注?

    速度優(yōu)勢(shì)是HBM產(chǎn)品成功的關(guān)鍵

    速度優(yōu)勢(shì)是HBM產(chǎn)品成功的關(guān)鍵
    的頭像 發(fā)表于 11-29 16:22 ?408次閱讀
    速度優(yōu)勢(shì)是<b class='flag-5'>HBM</b>產(chǎn)品成功的關(guān)鍵

    如何加速HBM仿真迭代優(yōu)化?

    如何加速HBM仿真迭代優(yōu)化?
    的頭像 發(fā)表于 11-29 16:13 ?626次閱讀
    如何加速<b class='flag-5'>HBM</b>仿真迭代優(yōu)化?

    英偉達(dá)將于Q1完成HBM3e驗(yàn)證 2026年HBM4將推出

    由于hbm芯片的驗(yàn)證過(guò)程復(fù)雜,預(yù)計(jì)需要2個(gè)季度左右的時(shí)間,因此業(yè)界預(yù)測(cè),最快將于2023年末得到部分企業(yè)對(duì)hbm3e的驗(yàn)證結(jié)果。但是,驗(yàn)證工作可能會(huì)在2024年第一季度完成。機(jī)構(gòu)表示,各原工廠的hbm3e驗(yàn)證結(jié)果將最終決定英偉達(dá)
    的頭像 發(fā)表于 11-29 14:13 ?765次閱讀
    英偉達(dá)將于Q1完成<b class='flag-5'>HBM</b>3e驗(yàn)證 2026年<b class='flag-5'>HBM</b>4將推出

    預(yù)計(jì)英偉達(dá)將于Q1完成HBM3e驗(yàn)證 2026年HBM4將推出

    由于hbm芯片的驗(yàn)證過(guò)程復(fù)雜,預(yù)計(jì)需要2個(gè)季度左右的時(shí)間,因此業(yè)界預(yù)測(cè),最快將于2023年末得到部分企業(yè)對(duì)hbm3e的驗(yàn)證結(jié)果。但是,驗(yàn)證工作可能會(huì)在2024年第一季度完成。機(jī)構(gòu)表示,各原工廠的hbm3e驗(yàn)證結(jié)果將最終決定英偉達(dá)
    的頭像 發(fā)表于 11-27 15:03 ?834次閱讀
    預(yù)計(jì)英偉達(dá)將于Q1完成<b class='flag-5'>HBM</b>3e驗(yàn)證 2026年<b class='flag-5'>HBM</b>4將推出