0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MCM正在潛移默化地改變芯片設(shè)計

21克888 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:凱揚 ? 2022-05-09 08:32 ? 次閱讀

芯片模塊(MCM)技術(shù)的應(yīng)用在半導(dǎo)體業(yè)界已經(jīng)不是什么新鮮事了,但隨著Chiplet、2.5D/3D封裝技術(shù)日趨火熱,MCM正在滲透進更多的芯片設(shè)計中,無論是GPU、光模塊還是AI芯片,都在慢慢引入這類封裝技術(shù)。

MCM GPU成為趨勢

以去年AMD發(fā)布的首個MCM GPU Instinct MI250X為例,這款GPU集成了兩個GPU Chiplet和128GB的超大HBM2e內(nèi)存,在算力和帶寬上都做到了極致,實現(xiàn)了383TFLOPS(FP16)和3.2TB/s的可怕成績,無疑是專注AI的各大超算中心夢寐以求的加速器了。同樣,英特爾也在其Ponte Vecchio GPU上采用了MCM。

Instinct MI250X GPU / AMD

雖然MCM已經(jīng)由AMD和英特爾兩家GPU廠商開始推進了,但目前來看英偉達的動作比較小,雖然有相關(guān)的研究,但還未拿出商用的MCM產(chǎn)品。不過以上都是面向HPC/AI市場的GPU,消費級的GPU是否也會迎來MCM的GPU呢?據(jù)現(xiàn)在的傳聞,AMD極有可能在下一代RDNA3架構(gòu)的高端GPU中用上MCM。

但消費級應(yīng)用與HPC/AI應(yīng)用又屬于截然不同的場景,后者使用多個GPU跑負載是很常見的情況。但消費場景中多GPU已經(jīng)相當(dāng)少見了,在兼容性上肯定會大打折扣,所以邁出這一步很可能會帶來一定的風(fēng)險。

IP公司眼中的MCM

MCM不僅為GPU公司帶來了更多設(shè)計靈活性,也讓一眾IP公司找到了新的商業(yè)模式。比如IP公司Credo就提供混合信號DSP IP,用于客戶的ASIC設(shè)計,以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。隨著數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)慢慢趨向于400G以上,芯片連接性的要求也在逐步升高。為此,Credo在去年底推出了全新的3.2Tbps BlueJay重定時器chiplet,通過64通道56Gbps PAM4 LR的DSP,提供了強大的系統(tǒng)級連接性。

BlueJay Chiplet / Credo

BlueJay雖然只是以臺積電28nm工藝打造,但保證了性能和功耗的要求,與其先進工藝方案Nutcracker相比也降低了成本。此外,由于BlueJay與主機端MCM中SoC核心的通信是通過超低功耗的BoW D2D接口實現(xiàn)的,其接口已經(jīng)針對臺積電的CoWoS封裝技術(shù)做了優(yōu)化。這種將SerDes功能從片上(on-die)轉(zhuǎn)向片外(off-chip)的做法,顯著增加了ASIC的可使用面積,設(shè)計者可以將這一部分多出來的面積用于實現(xiàn)更高的計算性能。

AI在MCM上的創(chuàng)新

同樣,AI也在MCM上找到了新的解決方案。我們已經(jīng)看到了大的機器學(xué)習(xí)模型通過訓(xùn)練大數(shù)據(jù)在多個領(lǐng)域展示了驚人的成果,比如計算機視覺、語音識別和自然語言處理等。為了減少機器學(xué)習(xí)加速器的成本,業(yè)界引入了不少設(shè)計創(chuàng)新,其中之一就是MCM。

Coral TPU / 谷歌

英偉達的Simba,谷歌的TPU,都用到了MCM的設(shè)計。谷歌的Coral TPU是一個用于邊緣端的機器學(xué)習(xí)推理加速器,在極小的占用面積下可以實現(xiàn)4 TOPS(INT8)的峰值性能,能效比可達2 TOPS/W。英偉達的Simba同樣是一個用于推理的芯片,但規(guī)模比谷歌的Coral更大,整個MCM由36個Chiplet組成,每個都能實現(xiàn)4 TOPS的峰值性能,將整個芯片算力提升至最高128 TOPS,能效比更是高達6.1 TOPS/W。

一來在設(shè)計上,設(shè)計小芯片的難度比一整塊芯片要低,二來小芯片由于面積較小,生產(chǎn)良率也更高。這都證明了這種方案既可以減少設(shè)計和生產(chǎn)成本,也能達到與單個大芯片近似的性能與能效。

但正如我們上文提到的MCM GPU兼容問題一樣,機器學(xué)習(xí)中MCM也并非毫無痛點。由于MCM中單個Chiplet的內(nèi)存遠比單個大芯片要小,所以大型機器學(xué)習(xí)模型的訓(xùn)練與推理都需要將矢量計算的數(shù)據(jù)流圖在Chiplet上進行劃分。多芯片進行劃分就是為了將運算分配給Chiplet,從而將某個性能指標最大化,比如說吞吐量。但與單芯片不一樣,MCM中小芯片的數(shù)量以及神經(jīng)網(wǎng)絡(luò)的節(jié)點數(shù)量增加,都會讓搜索空間成指數(shù)級增長,從而降低效率,更不用說因為MCM的硬件特性,可用的劃分方案并不多。所以這種劃分的質(zhì)量,直接影響到了MCM芯片設(shè)計的優(yōu)化。

為了解決這個問題,谷歌的研究員們開發(fā)了一種深度強化學(xué)習(xí)的劃分方案,同時利用一個約束求解器來專門解決MCM封裝的機器學(xué)習(xí)模型劃分問題。他們的方案可以通過預(yù)訓(xùn)練來普及到未知的輸入圖,通過對生產(chǎn)級BERT模型的硬件評估,他們得到了超過隨機搜索和模擬退火等現(xiàn)有方案5%以上的吞吐量。更重要的是,這種方案具備極佳的遷移學(xué)習(xí)性能,使用預(yù)訓(xùn)練的模型可以有效提升樣本效率,將搜索時間從3個小時減少到了9分鐘。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    452

    文章

    50056

    瀏覽量

    419957
  • 芯片設(shè)計
    +關(guān)注

    關(guān)注

    15

    文章

    987

    瀏覽量

    54721
  • MCM
    MCM
    +關(guān)注

    關(guān)注

    1

    文章

    67

    瀏覽量

    22310
收藏 人收藏

    評論

    相關(guān)推薦

    正在使用的芯片停產(chǎn),而您又不想改變PCB布局時,該怎么辦?

    我們的一位客戶遇到了一個棘手的問題,正在使用的芯片停產(chǎn),而客戶又不想改變PCB布局,找到瑞蘇盈科,要求我們?yōu)橥.a(chǎn)的鍵盤編碼器IC開發(fā)一種無須更換的替代品。面臨的挑戰(zhàn)如何用無須改動的替代品取代已停產(chǎn)
    的頭像 發(fā)表于 10-25 08:03 ?68次閱讀
    <b class='flag-5'>正在</b>使用的<b class='flag-5'>芯片</b>停產(chǎn),而您又不想<b class='flag-5'>改變</b>PCB布局時,該怎么辦?

    請問固定增益芯片是否意味著不能通過改變外圍參數(shù)來改變增益?

    固定增益芯片是否意味著我不能通過改變外圍參數(shù)來改變增益?
    發(fā)表于 09-11 07:13

    Tidal正在改變其音頻格式

    對于發(fā)燒友來說,大新聞是:Tidal正在改變其音頻格式。從7月24日開始,Tidal將放棄對Master Quality Authenticated(MQA)和360 Reality Audio格式
    的頭像 發(fā)表于 06-24 16:51 ?479次閱讀

    N8900藍牙音樂芯片,打造寶寶舒適睡眠環(huán)境

    ,不僅有助于寶寶更快地進入夢鄉(xiāng),還能在潛移默化中培養(yǎng)他們的音樂素養(yǎng)。一直以來,做母親的都知道利用搖籃使孩子盡快入睡。美國俄亥俄州大學(xué)的研究人員發(fā)現(xiàn),搖晃還有益于嬰兒
    的頭像 發(fā)表于 05-13 17:12 ?256次閱讀
    N8900藍牙音樂<b class='flag-5'>芯片</b>,打造寶寶舒適睡眠環(huán)境

    N8900藍牙音樂芯片,打造寶寶舒適睡眠環(huán)境

    ,不僅有助于寶寶更快地進入夢鄉(xiāng),還能在潛移默化中培養(yǎng)他們的音樂素養(yǎng)。 首先,讓我們聚焦N8900藍牙音樂芯片的功能特點。 這款芯片擁有32位CPU和DSP硬件解碼,能夠高效處理音頻信號,確保音樂播放的流暢性和音質(zhì)的高保真。 同時
    的頭像 發(fā)表于 05-13 11:47 ?416次閱讀

    一顆改變了世界的芯片

    英特爾突破性的8008微處理器于50多年前首次生產(chǎn)。這是英特爾的第一個8位微處理器,也是您現(xiàn)在可能正在使用的x86處理器系列的祖先。我找不到8008的好的Die照片,所以我打開了一顆并拍了一些詳細
    的頭像 發(fā)表于 04-20 08:10 ?800次閱讀
    一顆<b class='flag-5'>改變</b>了世界的<b class='flag-5'>芯片</b>

    RFID技術(shù)為橋牌競技項目注入新活力

    打橋牌需要雙方遵守嚴格的一整套公開、公平的規(guī)則,伙伴間必需保持高度的默契與合作精神,對人們特別是青少年遵紀守法、品德陶冶、身心修養(yǎng),起著極為良好的潛移默化作用。由于橋牌對玩家的思維能力、記憶力、溝通
    的頭像 發(fā)表于 03-22 13:40 ?257次閱讀
    RFID技術(shù)為橋牌競技項目注入新活力

    國家推出“以舊換新” 拉動家電行業(yè)市場增長

    新的一輪家電以舊換新以高技術(shù)、能耗、排放等標準為牽引,元器件廠商們?nèi)绾斡犹魬?zhàn)? ? 經(jīng)過疫情這三年,我國的經(jīng)濟形勢出現(xiàn)巨大挑戰(zhàn),人們的消費習(xí)慣也被潛移默化地被影響著,消費熱情難以提高。再加上近幾年
    的頭像 發(fā)表于 03-06 13:55 ?520次閱讀

    AI時代,傳統(tǒng)HDD硬盤的出路是什么?

    電子發(fā)燒友網(wǎng)報道(文/周凱揚)隨著存儲技術(shù)的進一步發(fā)展,以及大家對于存儲性能的看法發(fā)生了潛移默化改變,HDD硬盤似乎在慢慢淡出普通消費者的視野。而AI的加速更是讓這一趨勢變得更為明顯,閃存帶來
    的頭像 發(fā)表于 02-19 00:00 ?3466次閱讀

    暢行智駕智能駕駛域控解決方案RazorDCX Pantanal獲階段性進展

    近年來,智能駕駛滲透率持續(xù)攀高,智駕功能從各方面提升了用戶的駕駛體驗,同時在安全、兼容性、成本方面起到積極作用,用戶的駕駛習(xí)慣正被潛移默化改變
    的頭像 發(fā)表于 01-11 09:58 ?848次閱讀

    Verisium如何提高調(diào)試效率和驗證吞吐量呢?

    半導(dǎo)體對各行各業(yè)都有著潛移默化的影響,其重要性不言而喻。
    的頭像 發(fā)表于 01-05 13:54 ?841次閱讀
    Verisium如何提高調(diào)試效率和驗證吞吐量呢?

    用勤哲EXCEL服務(wù)器無代碼實現(xiàn)統(tǒng)計分析管理系統(tǒng)

    在當(dāng)下大數(shù)據(jù)時代,各項先進信息技術(shù)的引入和應(yīng)用正在潛移默化中影響和改變著現(xiàn)代企業(yè)的經(jīng)營管理模式,實踐證明這些先進信息技術(shù)的確為企業(yè)實際管理工作的開展帶來了諸多便利和實效。當(dāng)前信息化建設(shè)已然成為
    的頭像 發(fā)表于 12-20 14:38 ?445次閱讀
    用勤哲EXCEL服務(wù)器無代碼實現(xiàn)統(tǒng)計分析管理系統(tǒng)

    新型光子芯片正在改變未來

    這個問題是眾所周知的:光對任何形式的障礙物都很敏感,即使是非常小的障礙物。例如,想一想當(dāng)透過磨砂窗戶或當(dāng)我們的眼鏡起霧時我們?nèi)绾慰吹轿矬w。這種效果與光學(xué)無線系統(tǒng)中攜帶數(shù)據(jù)流的光束非常相似:信息雖然仍然存在,但卻完全扭曲并且極難檢索。
    的頭像 發(fā)表于 12-01 16:51 ?740次閱讀
    新型光子<b class='flag-5'>芯片</b><b class='flag-5'>正在</b><b class='flag-5'>改變</b>未來

    CPU、MCU、MPU、SOC和MCM的含義及區(qū)別

    在嵌入式開發(fā)中,我們經(jīng)常會接觸到一些專業(yè)術(shù)語,例如CPU、MCU、MPU、SOC和MCM等,這些縮寫代表了不同類型的電子處理單元,它們在消費電子、計算機硬件、自動化和工業(yè)系統(tǒng)中扮演著重要角色。下面將
    的頭像 發(fā)表于 11-29 14:14 ?1720次閱讀

    一張圖片道盡企業(yè)數(shù)字化轉(zhuǎn)型的心酸與無奈

    第一,從組織的角度來看,企業(yè)數(shù)字化轉(zhuǎn)型從意識到落地需經(jīng)過四個層面,即決策層、技術(shù)層、業(yè)務(wù)層、基礎(chǔ)層;每個層面在數(shù)字化轉(zhuǎn)型建設(shè)過程中均扮演著不同的角色,發(fā)揮著不同的作用,彼此之間相互關(guān)聯(lián)與潛移默化的影響;
    的頭像 發(fā)表于 11-25 15:39 ?1046次閱讀
    一張圖片道盡企業(yè)數(shù)字化轉(zhuǎn)型的心酸與無奈