0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

異構(gòu)計(jì)算的前世今生

E4Life ? 來(lái)源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2021-12-17 09:35 ? 次閱讀
異構(gòu)計(jì)算已經(jīng)成了半導(dǎo)體業(yè)界不得不思考的一個(gè)話題,傳統(tǒng)通用計(jì)算的性能捉襟見(jiàn)肘,過(guò)去承諾的每隔一段時(shí)間芯片性能翻倍的豪言壯語(yǔ)已經(jīng)沒(méi)有人再提了。如今我們用到的手機(jī)中,各種除CPU以外的計(jì)算單元層出不窮,無(wú)論是神經(jīng)網(wǎng)絡(luò)處理器還是圖像處理器。

異構(gòu)計(jì)算的存在可以說(shuō)創(chuàng)造了另一個(gè)維度,這個(gè)維度上我們又有了堆性能的空間,小至手機(jī)SoC、汽車芯片,大到服務(wù)器芯片和超算處理器,異構(gòu)帶來(lái)了更大的算力。但與此同時(shí),異構(gòu)計(jì)算也帶來(lái)了一些潛在的問(wèn)題。

異構(gòu)計(jì)算的崛起

異構(gòu)計(jì)算其實(shí)早在計(jì)算機(jī)時(shí)代的早期就開(kāi)始零星出現(xiàn)了,比如英特爾在80年代推出的浮點(diǎn)協(xié)處理器(FPU)i487,Inmos./ST在1996年推出的多媒體加速器Chameleon等等。轉(zhuǎn)眼進(jìn)入了新世紀(jì),異構(gòu)出現(xiàn)的頻率也越來(lái)越高,2010年蘋(píng)果推出了首個(gè)自研的處理器A4,將CPU、GPU和其它加速器集成至一起。在超算領(lǐng)域,加速器和協(xié)處理器也數(shù)量也在逐步增加。

全球超算系統(tǒng)加速器/協(xié)處理器的應(yīng)用趨勢(shì) / TOP500

2020年以后,各國(guó)的超級(jí)計(jì)算機(jī)計(jì)劃都定位在了Exascale的百億億級(jí)別,要想實(shí)現(xiàn)目標(biāo),要么靠堆核心規(guī)模來(lái)堆性能,要么就是選擇異構(gòu)計(jì)算。如今前十的超算系統(tǒng)中,有一半以上都采用了CPU+GPU的異構(gòu)設(shè)計(jì)。

明眼人都能看出,這種CPU+GPU的異構(gòu)設(shè)計(jì)也開(kāi)始變得愈發(fā)緊密,比如英偉達(dá)今年宣布的Arm CPU Grace,該處理器靠著英偉達(dá)專利互聯(lián)技術(shù)NVLink的加持,成功將CPU與GPU之間的互聯(lián)速度做到了夸張的900GB/s,是傳統(tǒng)PCIe的10倍以上,CPU更是靠LPDDR5X實(shí)現(xiàn)了500GB/s的內(nèi)存帶寬。

非傳統(tǒng)的架構(gòu)更是層出不窮,Graphcore的IPU、谷歌的TPU、矢量引擎和FPGA等等,相信XPU的命名形式馬上就要用完26個(gè)字母了。促使大家選擇異構(gòu)的動(dòng)力究竟是什么?答案很簡(jiǎn)單,異構(gòu)給到了一個(gè)更高效的方案,能夠?qū)崿F(xiàn)的算力更高。既然你CPU在計(jì)算上落后了,我GPU自然要上位,更何況我還有這么多成熟的I/O和互聯(lián)技術(shù)為我撐腰。

異構(gòu)計(jì)算真就完美無(wú)缺?

異構(gòu)計(jì)算就真的如此完美嗎?并非如此。異構(gòu)計(jì)算的存在其實(shí)也引出了不少隱患,比如極度差異化的編程模型,從過(guò)去的單向編程轉(zhuǎn)為了多向編程。因?yàn)楫悩?gòu)系統(tǒng)中存在多個(gè)計(jì)算設(shè)備,又有著不同的系統(tǒng)架構(gòu)、指令集和編程模型,因此異構(gòu)系統(tǒng)的編程與傳統(tǒng)的CPU編程相比有很大的差距。通常來(lái)說(shuō),異構(gòu)混合計(jì)算系統(tǒng)需要多套不同的代碼,這增大了應(yīng)用開(kāi)發(fā)的難度,紙面參數(shù)是好看了,卻苦了軟件開(kāi)發(fā)者。

IPU / Graphcore

其次,GPU、FPGA和AI處理器廠商都推出了截然不同的加速器方案,這些方案不僅僅采用了自己專用的處理器架構(gòu),還有自己的執(zhí)行指令和編譯器。在這樣不統(tǒng)一的架構(gòu)下,將并行程序移植到異構(gòu)處理器上需要的可不只是重新編譯,還有代碼重寫(xiě)。也正因如此,HPC的代碼生態(tài)雖然不弱,但近半數(shù)以上可能永遠(yuǎn)都不會(huì)被移植到其他加速器上,甚至這一部分工作量還分?jǐn)偟搅思铀倨鲝S商的軟件開(kāi)發(fā)工作量上。

所以,必須得使用優(yōu)秀的軟件棧,這樣才能讓開(kāi)發(fā)者充分利用異構(gòu)處理器的計(jì)算資源,而不用在編程時(shí)考慮復(fù)雜的硬件細(xì)節(jié)?,F(xiàn)在已經(jīng)有了不少跨平臺(tái)的編程標(biāo)準(zhǔn),比如C++/Fortran、OpenMP、SYCL和Kokkos等。

最后是復(fù)雜的數(shù)據(jù)存取過(guò)程,異構(gòu)帶來(lái)的不僅是不同層級(jí)的計(jì)算架構(gòu),還有不同層級(jí)的存儲(chǔ)架構(gòu),比如主存儲(chǔ)、主緩存、設(shè)備主存、設(shè)備緩存和寄存器等等。數(shù)據(jù)要在多種存儲(chǔ)類型之間移動(dòng),程序執(zhí)行要在同時(shí)對(duì)多種存儲(chǔ)進(jìn)行存取,這些存儲(chǔ)方式的帶寬和延遲也不盡相同。

異構(gòu)計(jì)算的未來(lái)

在近期舉辦的CIUK 2021大會(huì)上,HPC研究組的Simon McIntosh-Smith教授發(fā)表了他自己對(duì)異構(gòu)計(jì)算未來(lái)的看法。他認(rèn)為異構(gòu)計(jì)算的趨勢(shì)還將繼續(xù)發(fā)展下去,差異化不會(huì)消失,但也不會(huì)出現(xiàn)極度差異化的情況。

其次CPU與GPU的關(guān)系將更加緊密,比如緩存一致和封裝集成等,其他加速器在特定場(chǎng)景下聲稱的性能數(shù)據(jù)都很優(yōu)秀,但要說(shuō)通用計(jì)算性能,GPU還是要略勝一籌。而且依目前的趨勢(shì)來(lái)看,CPU也在慢慢汲取GPU上的優(yōu)點(diǎn),比如HBM、寬矢量處理器的核心、核心內(nèi)部的加速器等等。編程的困境固然已經(jīng)有了改善的跡象,但還有一段長(zhǎng)路要走。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 異構(gòu)
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    13033
  • 異構(gòu)計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    98

    瀏覽量

    16247
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    澎峰科技高性能計(jì)算庫(kù)PerfIPP介紹

    PerfIPP是專為計(jì)算機(jī)視覺(jué)處理和信號(hào)處理設(shè)計(jì)的優(yōu)化計(jì)算庫(kù),計(jì)算驅(qū)動(dòng)層基于OpenCL標(biāo)準(zhǔn),支持異構(gòu)計(jì)算加速。
    的頭像 發(fā)表于 09-02 17:39 ?295次閱讀
    澎峰科技高性能<b class='flag-5'>計(jì)算</b>庫(kù)PerfIPP介紹

    淺談國(guó)產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢(shì)和應(yīng)用場(chǎng)景

    關(guān)于國(guó)產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢(shì)和應(yīng)用場(chǎng)景淺談如下: 優(yōu)勢(shì) 異構(gòu)計(jì)算能力 : 異構(gòu)雙核設(shè)計(jì)結(jié)合了RISC-V的高效指令集和FPGA的靈活可編程性,能夠針對(duì)特定
    發(fā)表于 08-31 08:32

    打造異構(gòu)計(jì)算新標(biāo)桿!國(guó)數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計(jì)

    參考設(shè)計(jì)是首個(gè)支持異構(gòu)計(jì)算架構(gòu)的CXL硬件設(shè)備,標(biāo)志著CXL技術(shù)在數(shù)據(jù)中心領(lǐng)域迎來(lái)異構(gòu)計(jì)算新階段。 ? 國(guó)數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進(jìn)特性,可實(shí)現(xiàn)CPU、GPU、DDR、SSD
    的頭像 發(fā)表于 08-06 14:19 ?244次閱讀
    打造<b class='flag-5'>異構(gòu)計(jì)算</b>新標(biāo)桿!國(guó)數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計(jì)

    AvaotaA1全志T527開(kāi)發(fā)板AMP異構(gòu)計(jì)算簡(jiǎn)介

    Avaota SBC 的部分平臺(tái)內(nèi)具有小核心 CPU,與大核心一起組成了異構(gòu)計(jì)算的功能。 在異構(gòu)多處理系統(tǒng)中,主核心和輔助核心的存在旨在共同協(xié)作,以實(shí)現(xiàn)更高效的任務(wù)處理。這種協(xié)作需要系統(tǒng)采取一系列
    發(fā)表于 07-24 09:54

    異構(gòu)計(jì)算:解鎖算力潛能的新途徑

    在這個(gè)數(shù)據(jù)爆炸的時(shí)代,計(jì)算力是推動(dòng)社會(huì)與科技創(chuàng)新的核心。從日常智能設(shè)備的流暢運(yùn)行到超級(jí)計(jì)算機(jī)的尖端模擬,均依賴強(qiáng)大的計(jì)算能力。但面對(duì)多樣化的復(fù)雜計(jì)算任務(wù),單一處理器難以勝任。于是,
    的頭像 發(fā)表于 07-18 08:28 ?7333次閱讀
    <b class='flag-5'>異構(gòu)計(jì)算</b>:解鎖算力潛能的新途徑

    智能時(shí)代的路,將由異構(gòu)計(jì)算鋪就

    AI時(shí)代,在計(jì)算支持領(lǐng)域,云計(jì)算、邊緣計(jì)算等相繼崛起,我們能看到的算力形態(tài)逐漸多樣化。同時(shí),在我們看不到的地方,算力需求依然旺盛。隨著“十四五”規(guī)劃的不斷落地,加快數(shù)字化發(fā)展,打造具有國(guó)際競(jìng)爭(zhēng)
    的頭像 發(fā)表于 07-03 08:28 ?174次閱讀
    智能時(shí)代的路,將由<b class='flag-5'>異構(gòu)計(jì)算</b>鋪就

    高通NPU和異構(gòu)計(jì)算提升生成式AI性能?

    異構(gòu)計(jì)算的重要性不可忽視。根據(jù)生成式AI的獨(dú)特需求和計(jì)算負(fù)擔(dān),需要配備不同的處理器,如專注于AI工作負(fù)載的定制設(shè)計(jì)的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?653次閱讀

    如何評(píng)價(jià)智能車載異構(gòu)計(jì)算芯片性能?

    車企不斷的宣傳讓我們知道了芯片的重要性。那么在智能駕駛領(lǐng)域里,到底什么是重要的呢,評(píng)估面向自動(dòng)駕駛的計(jì)算芯片性能時(shí),有沒(méi)有什么科學(xué)的依據(jù)呢?
    發(fā)表于 01-25 12:45 ?642次閱讀
    如何評(píng)價(jià)智能車載<b class='flag-5'>異構(gòu)計(jì)算</b>芯片性能?

    二極管的前世今生

    二極管的前世今生
    的頭像 發(fā)表于 12-14 18:35 ?1010次閱讀
    二極管的<b class='flag-5'>前世</b><b class='flag-5'>今生</b>

    科學(xué)計(jì)算與Julia技術(shù)研討會(huì) | 張先軼:從OpenBLAS到異構(gòu)計(jì)算軟件棧

    蓬勃發(fā)展,新興科學(xué)計(jì)算語(yǔ)言不斷涌現(xiàn),Julia以其高性能、動(dòng)態(tài)性成為其中的佼佼者。 12月9日上午1020 ,澎峰科技創(chuàng)始人 張先軼博士 將 在 主論壇:Julia與數(shù)字化和AI 上 作 “ 從OpenBLAS到異構(gòu)計(jì)算軟件?!?主題演講,期待與大家見(jiàn)面 ! 研討會(huì)完整詳
    的頭像 發(fā)表于 11-30 19:35 ?634次閱讀
    科學(xué)<b class='flag-5'>計(jì)算</b>與Julia技術(shù)研討會(huì) | 張先軼:從OpenBLAS到<b class='flag-5'>異構(gòu)計(jì)算</b>軟件棧

    什么是異構(gòu)集成?什么是異構(gòu)計(jì)算?異構(gòu)集成、異構(gòu)計(jì)算的關(guān)系?

    異構(gòu)集成主要指將多個(gè)不同工藝節(jié)點(diǎn)單獨(dú)制造的芯片封裝到一個(gè)封裝內(nèi)部,以增強(qiáng)功能性和提高性能。
    的頭像 發(fā)表于 11-27 10:22 ?6345次閱讀
    什么是<b class='flag-5'>異構(gòu)</b>集成?什么是<b class='flag-5'>異構(gòu)計(jì)算</b>?<b class='flag-5'>異構(gòu)</b>集成、<b class='flag-5'>異構(gòu)計(jì)算</b>的關(guān)系?

    情感語(yǔ)音識(shí)別的前世今生

    的支持。本文將探討情感語(yǔ)音識(shí)別的前世今生,包括其發(fā)展歷程、應(yīng)用場(chǎng)景、面臨的挑戰(zhàn)以及未來(lái)發(fā)展趨勢(shì)。 二、情感語(yǔ)音識(shí)別的發(fā)展歷程 起步階段:早期的情感語(yǔ)音識(shí)別技術(shù)主要依賴于聲譜分析、特征提取等傳統(tǒng)信號(hào)處理方法,但這
    的頭像 發(fā)表于 11-12 17:33 ?550次閱讀

    基石數(shù)據(jù):TOC理論物理學(xué)淺析—MES的前世今生(十一)

    MES的前世今生前面的文章大體介紹了TOC下的低結(jié)存,計(jì)劃統(tǒng)一性原則,列隊(duì)生產(chǎn),日結(jié)日清,品質(zhì)問(wèn)題碎片化等,有很多朋友問(wèn)是否基石公司不再做數(shù)字化,而做流程梳理,非也!其實(shí)所有不同的制造業(yè)生產(chǎn)方式都有
    的頭像 發(fā)表于 11-09 10:39 ?409次閱讀
    基石數(shù)據(jù):TOC理論物理學(xué)淺析—MES的<b class='flag-5'>前世</b><b class='flag-5'>今生</b>(十一)

    帶你探索吹風(fēng)筒的前世今生【其利天下高速風(fēng)筒方案開(kāi)發(fā)】?

    電吹風(fēng)作為如今生活中不可或缺的小家電之一,這個(gè)看似簡(jiǎn)單的設(shè)備,已經(jīng)走過(guò)了漫長(zhǎng)的發(fā)展歷程,從它的前世今生,經(jīng)歷了許多變革和創(chuàng)新,本文將帶您穿越時(shí)間,探索其前世
    的頭像 發(fā)表于 11-02 16:15 ?1814次閱讀
    帶你探索吹風(fēng)筒的<b class='flag-5'>前世</b><b class='flag-5'>今生</b>【其利天下高速風(fēng)筒方案開(kāi)發(fā)】?

    異構(gòu)計(jì)算為什么會(huì)異軍突起?基于FPGA的異構(gòu)計(jì)算討論

    簡(jiǎn)單的介紹幾個(gè)概念,同道中人可以忽略這一段。云計(jì)算取代傳統(tǒng)IT基礎(chǔ)設(shè)施已經(jīng)基本成為業(yè)界共識(shí)和不可阻擋的趨勢(shì)。
    發(fā)表于 10-26 10:04 ?707次閱讀
    <b class='flag-5'>異構(gòu)計(jì)算</b>為什么會(huì)異軍突起?基于FPGA的<b class='flag-5'>異構(gòu)計(jì)算</b>討論