電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在去年Frontier超算首次公開(kāi)突破E級(jí)算力以后,各國(guó)近期都紛紛傳出消息,加快HPC算力資源的建設(shè),爭(zhēng)取早日實(shí)現(xiàn)E級(jí)甚至對(duì)未來(lái)ZettaSscale的算力開(kāi)始布局。盡管ZettaSscale離我們還有比較遠(yuǎn)的距離,但從今年開(kāi)始,E級(jí)算力系統(tǒng)絕對(duì)會(huì)成為新的戰(zhàn)場(chǎng)。
美國(guó)——霸主地位不可丟
2022年9月,美國(guó)新興技術(shù)與創(chuàng)新基金會(huì)(ITIF)發(fā)布了《在Exascale時(shí)代保持美國(guó)HPC領(lǐng)先地位》的報(bào)道,其中就提到了HPC代表了一個(gè)國(guó)家的關(guān)鍵戰(zhàn)略實(shí)力,美國(guó)應(yīng)該憑借自身的半導(dǎo)體實(shí)力在HPC系統(tǒng)開(kāi)發(fā)和應(yīng)用上都保持在領(lǐng)先地位。
從TOP500的排名角度上來(lái)說(shuō),盡管美國(guó)在頂級(jí)超算的算力排名上占有優(yōu)勢(shì),但其實(shí)在系統(tǒng)數(shù)量上仍將中國(guó)視為威脅。再加上AL/ML為硅谷注入的這股新動(dòng)力,使得HPC的建設(shè)尤其是高AI算力的HPC系統(tǒng),變得更具有吸引力。
所以美國(guó)也開(kāi)始仿照中國(guó)打造區(qū)域化算力的操作,例如CHIPS法案中就提出,要在未來(lái)五年中投入近100億美元建設(shè)區(qū)域技術(shù)和創(chuàng)新中心,并在其中發(fā)展區(qū)域超算中心,方便產(chǎn)學(xué)研界和政府合作,將其轉(zhuǎn)換為商業(yè)化產(chǎn)品,進(jìn)一步提高美國(guó)尖端科技的競(jìng)爭(zhēng)力。
英國(guó)——提振本土HPC市場(chǎng)
在英國(guó)的春季預(yù)算聲明中,指出英國(guó)政府將提供9億英鎊的資金,用于支持英國(guó)提供一個(gè)公共E級(jí)算力的超級(jí)計(jì)算機(jī),這也是他們?nèi)ツ?月發(fā)表的《未來(lái)計(jì)算獨(dú)立報(bào)道》一文中推薦的。英國(guó)在HPC的存在感不算很強(qiáng),在超算領(lǐng)域更加是如此,較新的超算系統(tǒng)除了英偉達(dá)為其打造的劍橋1號(hào)外,TOPS500中榜上有名的只有14臺(tái)。
盡管這一計(jì)劃的初衷是好的,但對(duì)于本土企業(yè)來(lái)說(shuō)并沒(méi)有給出任何承諾。為此,Graphcore近日就發(fā)布了一篇寫給英國(guó)首相的公開(kāi)信,其中提到希望這筆預(yù)算中能分出大部分交給英國(guó)供應(yīng)商,否則這筆看似不小的資金很快就會(huì)被美國(guó)芯片制造商,比如英偉達(dá)等巨頭給消耗掉。
像Graphcore這樣的企業(yè),其實(shí)已經(jīng)在海外的HPC市場(chǎng)中闖出了一些名聲,其IPU也在多個(gè)計(jì)算設(shè)施中被使用。但如果英國(guó)政府開(kāi)啟所謂的E級(jí)系統(tǒng)招標(biāo),CPU和GPU這些組件肯定會(huì)預(yù)定英特爾、AMD和英偉達(dá),但如果英國(guó)政府愿意在這些系統(tǒng)中用到本國(guó)自研的AI加速器,不僅能夠促進(jìn)本土HPC企業(yè)的發(fā)展,也有助于實(shí)現(xiàn)這些系統(tǒng)的技術(shù)多樣性。
中國(guó)——數(shù)字經(jīng)濟(jì)下的搶手資源
由于地緣政治沖突等原因,如今國(guó)內(nèi)不僅一些超算中心尚在部署中的超算系統(tǒng)無(wú)法透露部署信息,連一些網(wǎng)絡(luò)公司自己找服務(wù)器供應(yīng)商開(kāi)發(fā)并部署的系統(tǒng)也都無(wú)法公開(kāi)。比如在去年的中國(guó)HPC TOP100榜單中,過(guò)去的兩巨頭神威太湖之光和天湖二號(hào)升級(jí)系統(tǒng)已經(jīng)退居第三和第五席,如今的第一名和第二名均為部署在網(wǎng)絡(luò)公司、采用CPU+GPU異構(gòu)眾核處理器的主機(jī)系統(tǒng)。
這兩臺(tái)系統(tǒng)的峰值算力分別達(dá)到了390Pflops和240Pflops,如果向TOP500提交測(cè)試成績(jī)的話,應(yīng)該可以拿到第四名和第六名的成績(jī)。不過(guò)網(wǎng)絡(luò)公司部署這些機(jī)器主要是用于算力服務(wù),并不會(huì)花大把時(shí)間去跑這些測(cè)試。
加上一些下一代超算中心系統(tǒng)的傳聞,國(guó)內(nèi)可以說(shuō)是已經(jīng)邁進(jìn)或是達(dá)到Exascale級(jí)計(jì)算的門檻了。這也與國(guó)內(nèi)對(duì)于先進(jìn)計(jì)算的政策有關(guān),在數(shù)字經(jīng)濟(jì)時(shí)代下,無(wú)論是HPC通用算力還是AI算力都已經(jīng)成了全新的資源。
國(guó)內(nèi)企業(yè)雖然在HPC處理器上的進(jìn)度要稍微落后一些,但高速互聯(lián)、處理器加速部件和高性能算法上的研究可不輸于人。再加上最近ChatGPT之類的超大規(guī)模并行應(yīng)用的加速,都對(duì)E級(jí)以上的計(jì)算提出了要求。
根據(jù)傳聞,國(guó)內(nèi)可能在2025年之前建成10臺(tái)E級(jí)超算,而美國(guó)目前已知的在建E級(jí)系統(tǒng)只有三個(gè),足以看出國(guó)內(nèi)對(duì)HPC算力的重視。但與此同時(shí),我們還需要關(guān)注提高系統(tǒng)效率之類的優(yōu)化,以及最重要的軟件開(kāi)發(fā),要知道美國(guó)能源部花在E級(jí)超算的大量資金中,一半都是用于軟件開(kāi)發(fā)的。
至于公共算力這塊,國(guó)內(nèi)也在堅(jiān)持推進(jìn)更高的算力,例如2020年在內(nèi)蒙古部署的高性能公共服務(wù)平臺(tái)“青城之光”,即便在2022年的榜單上依然有著15名的成績(jī)。未來(lái)國(guó)內(nèi)無(wú)論是超算中心、網(wǎng)絡(luò)公司,甚至是學(xué)府,都會(huì)加速邁入E級(jí)的步伐,云化E級(jí)超算也將逐步成為現(xiàn)實(shí)。
-
HPC
+關(guān)注
關(guān)注
0文章
306瀏覽量
23619
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論