0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MCM正在滲透進(jìn)更多的芯片設(shè)計(jì)中

lPCU_elecfans ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-05-09 09:27 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))多芯片模塊(MCM)技術(shù)的應(yīng)用在半導(dǎo)體業(yè)界已經(jīng)不是什么新鮮事了,但隨著Chiplet、2.5D/3D封裝技術(shù)日趨火熱,MCM正在滲透進(jìn)更多的芯片設(shè)計(jì)中,無(wú)論是GPU、光模塊還是AI芯片,都在慢慢引入這類封裝技術(shù)。

MCM GPU成為趨勢(shì)

以去年AMD發(fā)布的首個(gè)MCM GPU Instinct MI250X為例,這款GPU集成了兩個(gè)GPU Chiplet和128GB的超大HBM2e內(nèi)存,在算力和帶寬上都做到了極致,實(shí)現(xiàn)了383TFLOPS(FP16)和3.2TB/s的可怕成績(jī),無(wú)疑是專注AI的各大超算中心夢(mèng)寐以求的加速器了。同樣,英特爾也在其Ponte Vecchio GPU上采用了MCM。

雖然MCM已經(jīng)由AMD和英特爾兩家GPU廠商開始推進(jìn)了,但目前來(lái)看英偉達(dá)的動(dòng)作比較小,雖然有相關(guān)的研究,但還未拿出商用的MCM產(chǎn)品。不過(guò)以上都是面向HPC/AI市場(chǎng)的GPU,消費(fèi)級(jí)的GPU是否也會(huì)迎來(lái)MCM的GPU呢?據(jù)現(xiàn)在的傳聞,AMD極有可能在下一代RDNA3架構(gòu)的高端GPU中用上MCM。

但消費(fèi)級(jí)應(yīng)用與HPC/AI應(yīng)用又屬于截然不同的場(chǎng)景,后者使用多個(gè)GPU跑負(fù)載是很常見的情況。但消費(fèi)場(chǎng)景中多GPU已經(jīng)相當(dāng)少見了,在兼容性上肯定會(huì)大打折扣,所以邁出這一步很可能會(huì)帶來(lái)一定的風(fēng)險(xiǎn)。

IP公司眼中的MCM

MCM不僅為GPU公司帶來(lái)了更多設(shè)計(jì)靈活性,也讓一眾IP公司找到了新的商業(yè)模式。比如IP公司Credo就提供混合信號(hào)DSP IP,用于客戶的ASIC設(shè)計(jì),以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。隨著數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)慢慢趨向于400G以上,芯片連接性的要求也在逐步升高。為此,Credo在去年底推出了全新的3.2Tbps BlueJay重定時(shí)器chiplet,通過(guò)64通道56Gbps PAM4 LR的DSP,提供了強(qiáng)大的系統(tǒng)級(jí)連接性。

BlueJay雖然只是以臺(tái)積電28nm工藝打造,但保證了性能和功耗的要求,與其先進(jìn)工藝方案Nutcracker相比也降低了成本。此外,由于BlueJay與主機(jī)端MCM中SoC核心的通信是通過(guò)超低功耗的BoW D2D接口實(shí)現(xiàn)的,其接口已經(jīng)針對(duì)臺(tái)積電的CoWoS封裝技術(shù)做了優(yōu)化。這種將SerDes功能從片上(on-die)轉(zhuǎn)向片外(off-chip)的做法,顯著增加了ASIC的可使用面積,設(shè)計(jì)者可以將這一部分多出來(lái)的面積用于實(shí)現(xiàn)更高的計(jì)算性能。

AI在MCM上的創(chuàng)新

同樣,AI也在MCM上找到了新的解決方案。我們已經(jīng)看到了大的機(jī)器學(xué)習(xí)模型通過(guò)訓(xùn)練大數(shù)據(jù)在多個(gè)領(lǐng)域展示了驚人的成果,比如計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別和自然語(yǔ)言處理等。為了減少機(jī)器學(xué)習(xí)加速器的成本,業(yè)界引入了不少設(shè)計(jì)創(chuàng)新,其中之一就是MCM。

英偉達(dá)的Simba,谷歌的TPU,都用到了MCM的設(shè)計(jì)。谷歌的Coral TPU是一個(gè)用于邊緣端的機(jī)器學(xué)習(xí)推理加速器,在極小的占用面積下可以實(shí)現(xiàn)4 TOPS(INT8)的峰值性能,能效比可達(dá)2 TOPS/W。英偉達(dá)的Simba同樣是一個(gè)用于推理的芯片,但規(guī)模比谷歌的Coral更大,整個(gè)MCM由36個(gè)Chiplet組成,每個(gè)都能實(shí)現(xiàn)4 TOPS的峰值性能,將整個(gè)芯片算力提升至最高128 TOPS,能效比更是高達(dá)6.1 TOPS/W。

一來(lái)在設(shè)計(jì)上,設(shè)計(jì)小芯片的難度比一整塊芯片要低,二來(lái)小芯片由于面積較小,生產(chǎn)良率也更高。這都證明了這種方案既可以減少設(shè)計(jì)和生產(chǎn)成本,也能達(dá)到與單個(gè)大芯片近似的性能與能效。

但正如我們上文提到的MCM GPU兼容問(wèn)題一樣,機(jī)器學(xué)習(xí)中MCM也并非毫無(wú)痛點(diǎn)。由于MCM中單個(gè)Chiplet的內(nèi)存遠(yuǎn)比單個(gè)大芯片要小,所以大型機(jī)器學(xué)習(xí)模型的訓(xùn)練與推理都需要將矢量計(jì)算的數(shù)據(jù)流圖在Chiplet上進(jìn)行劃分。多芯片進(jìn)行劃分就是為了將運(yùn)算分配給Chiplet,從而將某個(gè)性能指標(biāo)最大化,比如說(shuō)吞吐量。但與單芯片不一樣,MCM中小芯片的數(shù)量以及神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量增加,都會(huì)讓搜索空間成指數(shù)級(jí)增長(zhǎng),從而降低效率,更不用說(shuō)因?yàn)镸CM的硬件特性,可用的劃分方案并不多。所以這種劃分的質(zhì)量,直接影響到了MCM芯片設(shè)計(jì)的優(yōu)化。

為了解決這個(gè)問(wèn)題,谷歌的研究員們開發(fā)了一種深度強(qiáng)化學(xué)習(xí)的劃分方案,同時(shí)利用一個(gè)約束求解器來(lái)專門解決MCM封裝的機(jī)器學(xué)習(xí)模型劃分問(wèn)題。他們的方案可以通過(guò)預(yù)訓(xùn)練來(lái)普及到未知的輸入圖,通過(guò)對(duì)生產(chǎn)級(jí)BERT模型的硬件評(píng)估,他們得到了超過(guò)隨機(jī)搜索和模擬退火等現(xiàn)有方案5%以上的吞吐量。更重要的是,這種方案具備極佳的遷移學(xué)習(xí)性能,使用預(yù)訓(xùn)練的模型可以有效提升樣本效率,將搜索時(shí)間從3個(gè)小時(shí)減少到了9分鐘。

原文標(biāo)題:MCM正在潛移默化地改變芯片設(shè)計(jì)

文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4652

    瀏覽量

    128499
  • 芯片設(shè)計(jì)
    +關(guān)注

    關(guān)注

    15

    文章

    987

    瀏覽量

    54721
  • MCM
    MCM
    +關(guān)注

    關(guān)注

    1

    文章

    67

    瀏覽量

    22310

原文標(biāo)題:MCM正在潛移默化地改變芯片設(shè)計(jì)

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    電動(dòng)重卡加速滲透,鋰電行業(yè)迎來(lái)新機(jī)遇

    在雙碳目標(biāo)的推動(dòng)下,電動(dòng)化趨勢(shì)正在向乘用車以外的全場(chǎng)景蔓延,其中交通運(yùn)輸領(lǐng)域的電動(dòng)化尤為顯著。新能源客車已經(jīng)實(shí)現(xiàn)了超過(guò)50%的市場(chǎng)滲透率,而新能源重卡的市場(chǎng)空間則更為廣闊,特別是在卡車領(lǐng)域。
    的頭像 發(fā)表于 10-22 11:36 ?346次閱讀

    芯片封裝是什么?芯片封裝芯片環(huán)氧膠的應(yīng)用有哪些?

    芯片封裝是什么?芯片封裝芯片環(huán)氧膠的應(yīng)用有哪些?芯片封裝是什么?芯片封裝是集成電路(IC)制造
    的頭像 發(fā)表于 09-20 10:15 ?288次閱讀
    <b class='flag-5'>芯片</b>封裝是什么?<b class='flag-5'>芯片</b>封裝<b class='flag-5'>中</b><b class='flag-5'>芯片</b>環(huán)氧膠的應(yīng)用有哪些?

    維信諾推動(dòng)AMOLED加快向尺寸應(yīng)用滲透

    SID作為全球新興顯示風(fēng)向標(biāo),隨著AMOLED顯示技術(shù)邁進(jìn)尺寸新賽道,本次展會(huì)上AMOLED尺寸技術(shù)與應(yīng)用可謂百花齊放。維信諾帶來(lái)了多項(xiàng)尺寸創(chuàng)新技術(shù),并首發(fā)多款尺寸創(chuàng)新應(yīng)用,持
    的頭像 發(fā)表于 09-20 09:58 ?236次閱讀

    聯(lián)發(fā)科正在開發(fā)Arm架構(gòu)Windows PC芯片

    據(jù)權(quán)威媒體援引三位知情人士的消息報(bào)道,聯(lián)發(fā)科正在緊鑼密鼓地開發(fā)一款基于Arm架構(gòu)的個(gè)人電腦芯片。這款芯片將成為推動(dòng)Windows操作系統(tǒng)在新型電腦設(shè)備上運(yùn)行的重要力量。
    的頭像 發(fā)表于 06-13 09:16 ?608次閱讀

    蘋果正在研發(fā)全新數(shù)據(jù)中心AI芯片

    蘋果正在秘密研發(fā)一款全新的數(shù)據(jù)中心AI芯片,這一項(xiàng)目在公司內(nèi)部被稱為“ACDC”,并且已經(jīng)經(jīng)過(guò)了數(shù)年的精心籌備。據(jù)華爾街日?qǐng)?bào)的知情人士透露,這款芯片的設(shè)計(jì)目標(biāo)是為了優(yōu)化蘋果數(shù)據(jù)中心服務(wù)器運(yùn)行人工智能軟件的能力。
    的頭像 發(fā)表于 05-08 09:40 ?358次閱讀

    BLDC加速滲透,國(guó)產(chǎn)主控如何優(yōu)化芯片性能?

    的主要方向。 ? 從高速風(fēng)筒到智能家電、從掃地機(jī)器人到新能源汽車,諸多終端產(chǎn)品都在使用BLDC電機(jī)替代傳統(tǒng)電機(jī),旺盛的終端需求正在推動(dòng)BLDC電機(jī)芯片市場(chǎng)迅速發(fā)展。電子發(fā)燒友采訪了在BLDC芯片行業(yè)內(nèi)耕耘已久的廠商——國(guó)民技術(shù)、
    的頭像 發(fā)表于 04-29 00:03 ?4345次閱讀

    集成芯片的運(yùn)用

    集成芯片(IC)的運(yùn)用非常廣泛,幾乎滲透到了現(xiàn)代社會(huì)的每一個(gè)角落。
    的頭像 發(fā)表于 03-25 13:55 ?633次閱讀

    汽車價(jià)格戰(zhàn)對(duì)芯片供應(yīng)鏈的影響

    隨著新能源汽車滲透率的快速提升,傳統(tǒng)燃油車市場(chǎng)正在逐漸被蠶食。車規(guī)芯片廠商又將迎來(lái)哪些挑戰(zhàn)和機(jī)會(huì)?
    發(fā)表于 03-20 10:26 ?576次閱讀
    汽車價(jià)格戰(zhàn)對(duì)<b class='flag-5'>芯片</b>供應(yīng)鏈的影響

    點(diǎn)成案例|BE-Transflow芯片構(gòu)建上皮模型用于滲透性研究

    概述 體外重現(xiàn)組織屏障的滲透性對(duì)于評(píng)估化學(xué)物質(zhì)、藥物或化妝品等在上皮組織的選擇性轉(zhuǎn)運(yùn)至關(guān)重要。物質(zhì)對(duì)組織屏障的滲透能力影響它們的吸收和效果。因此,在制藥和化妝品行業(yè),尤其是在毒理學(xué)研究確定物質(zhì)
    的頭像 發(fā)表于 02-04 10:27 ?244次閱讀
    點(diǎn)成案例|BE-Transflow<b class='flag-5'>芯片</b>構(gòu)建上皮模型用于<b class='flag-5'>滲透</b>性研究

    電子膠行業(yè)芯片膠用在什么領(lǐng)域?

    在數(shù)字化時(shí)代,半導(dǎo)體芯片已經(jīng)成為滲透到幾乎每一個(gè)角落的重要支撐,而芯片封裝則是其關(guān)鍵一環(huán)。芯片膠主要用于芯片封裝領(lǐng)域,
    的頭像 發(fā)表于 01-23 14:33 ?576次閱讀
    電子膠行業(yè)<b class='flag-5'>中</b>的<b class='flag-5'>芯片</b>膠用在什么領(lǐng)域?

    介紹一款基于java的滲透測(cè)試神器-CobaltStrike

    Cobalt Strike是一款基于java的滲透測(cè)試神器,常被業(yè)界人稱為CS神器。
    的頭像 發(fā)表于 01-16 09:16 ?819次閱讀
    介紹一款基于java的<b class='flag-5'>滲透</b>測(cè)試神器-CobaltStrike

    淺談Web滲透之信息收集(上)

    信息收集在滲透測(cè)試過(guò)程是最重要的一環(huán),本篇重點(diǎn)討論Whois查詢與域名信息收集。
    的頭像 發(fā)表于 12-15 15:18 ?890次閱讀
    淺談Web<b class='flag-5'>滲透</b>之信息收集(上)

    CPU、MCU、MPU、SOC和MCM的含義及區(qū)別

    在嵌入式開發(fā),我們經(jīng)常會(huì)接觸到一些專業(yè)術(shù)語(yǔ),例如CPU、MCU、MPU、SOC和MCM等,這些縮寫代表了不同類型的電子處理單元,它們?cè)谙M(fèi)電子、計(jì)算機(jī)硬件、自動(dòng)化和工業(yè)系統(tǒng)扮演著重要角色。下面將
    的頭像 發(fā)表于 11-29 14:14 ?1720次閱讀

    瀾起科技:CKD芯片有望明年下半年開始上量

     aipc為了提高整體性能,需要更多的帶寬需要的內(nèi)存,所以aipc ddr5一代反復(fù)滲透率的增加,加快速度更高的ddr5內(nèi)存可以增加的需要,因此,ckd芯片的加快,ckd未來(lái)更多的羊可
    的頭像 發(fā)表于 11-23 14:49 ?855次閱讀

    滲透必備:使用Proxifier玩轉(zhuǎn)代理

    很多時(shí)候,作為攻擊隊(duì),我們都需要在純凈的武器庫(kù)虛擬機(jī)完成自己的滲透(因?yàn)槊酃迺?huì)嘗試獲取瀏覽器Cookie和本地文件,用自己的實(shí)體機(jī)很快就能被溯源),如何直接讓所有的虛擬機(jī)都走上代理呢?
    的頭像 發(fā)表于 11-15 16:37 ?1.6w次閱讀
    <b class='flag-5'>滲透</b>必備:使用Proxifier玩轉(zhuǎn)代理