電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)智算中心是承載人工智能計(jì)算需求的基礎(chǔ)設(shè)施,專門用于處理AI算法和模型所需的大量計(jì)算任務(wù)。與傳統(tǒng)的數(shù)據(jù)中心和超算中心不同,智算中心更側(cè)重于AI算力的提供,以滿足日益增長(zhǎng)的人工智能應(yīng)用需求。
近期,中國(guó)各地紛紛加快數(shù)字基建項(xiàng)目的建設(shè)步伐,智算中心成為布局重點(diǎn)。從北京到四川,從寧夏到河南,多地智算中心項(xiàng)目相繼開工或投入使用。國(guó)家統(tǒng)計(jì)局最新數(shù)據(jù)顯示,我國(guó)算力基礎(chǔ)設(shè)施建設(shè)已達(dá)到世界領(lǐng)先水平,智能算力規(guī)模占比提升至逾30%。
智算中心技術(shù)架構(gòu)
智算中心的技術(shù)架構(gòu)通常包含多個(gè)層次,從底層的硬件基礎(chǔ)設(shè)施到上層的軟件平臺(tái)和算法服務(wù),形成了一個(gè)完整的計(jì)算生態(tài)系統(tǒng)。
硬件基礎(chǔ)設(shè)施層主要包括計(jì)算設(shè)備、存儲(chǔ)系統(tǒng)和網(wǎng)絡(luò)設(shè)施。計(jì)算設(shè)備包括高性能服務(wù)器、計(jì)算節(jié)點(diǎn)、GPU加速卡等,提供強(qiáng)大的計(jì)算能力和并行處理能力。這些設(shè)備是智算中心的核心組成部分,能夠支持大規(guī)模數(shù)據(jù)處理和復(fù)雜的計(jì)算任務(wù)。
存儲(chǔ)系統(tǒng)包括高速硬盤陣列、分布式文件系統(tǒng)、對(duì)象存儲(chǔ)系統(tǒng)等,用于存儲(chǔ)和管理海量數(shù)據(jù)。這些系統(tǒng)提供了高可靠性、高吞吐量和快速訪問的存儲(chǔ)解決方案,確保數(shù)據(jù)的安全性和可用性。
網(wǎng)絡(luò)基礎(chǔ)設(shè)施包括高速以太網(wǎng)、光纖網(wǎng)絡(luò)、交換機(jī)、路由器等,支持?jǐn)?shù)據(jù)傳輸和通信。這些設(shè)備提供了高帶寬和低延遲的網(wǎng)絡(luò)連接,以滿足大規(guī)模數(shù)據(jù)傳輸和分布式計(jì)算的需求。
軟件平臺(tái)層包括算法和人工智能技術(shù)、大數(shù)據(jù)處理平臺(tái)、AI使能軟件和開發(fā)框架、云平臺(tái)管理調(diào)度系統(tǒng)。算法和人工智能技術(shù):包括機(jī)器學(xué)習(xí)算法、神經(jīng)網(wǎng)絡(luò)、圖像處理和自然語(yǔ)言處理等,用于數(shù)據(jù)處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和模型訓(xùn)練等任務(wù)。這些算法和技術(shù)是智算中心實(shí)現(xiàn)智能計(jì)算的關(guān)鍵。
大數(shù)據(jù)處理平臺(tái):如Hadoop、Spark等,提供分布式和并行計(jì)算的能力,能夠高效地處理大規(guī)模數(shù)據(jù)集。這些平臺(tái)為智算中心提供了強(qiáng)大的數(shù)據(jù)處理和分析能力。
AI使能軟件和開發(fā)框架:如CANN(華為昇騰AI計(jì)算架構(gòu))、MindSpore(華為全場(chǎng)景AI框架)等,為AI開發(fā)者提供便捷的開發(fā)環(huán)境和工具鏈,降低AI應(yīng)用的開發(fā)門檻和成本。
云平臺(tái)管理調(diào)度系統(tǒng):如ModelArts(華為云AI開發(fā)平臺(tái))等,提供算力資源的統(tǒng)一管理和調(diào)度服務(wù),實(shí)現(xiàn)算力資源的靈活配置和高效利用。
智算中心涉及的芯片及企業(yè)
從計(jì)算層面來(lái)看,智算中心以人工智能計(jì)算任務(wù)為主,是AI算力的核心基礎(chǔ)設(shè)施。它采用專門的AI算力硬件,如GPU、NPU、TPU等,這些芯片擅長(zhǎng)并行計(jì)算,能夠高效處理AI算法中的大量簡(jiǎn)單矩陣運(yùn)算任務(wù)。
智算服務(wù)器作為智算中心的主要算力硬件,通常采用“CPU+GPU”或“CPU+NPU”的異構(gòu)計(jì)算架構(gòu),以充分發(fā)揮不同算力芯片在性能、成本和能耗上的優(yōu)勢(shì)。
這種強(qiáng)大的算力驅(qū)動(dòng)AI模型對(duì)數(shù)據(jù)進(jìn)行深度加工,源源不斷產(chǎn)生各種智慧計(jì)算服務(wù),面向全行業(yè)領(lǐng)域提供基于深度學(xué)習(xí)技術(shù)的人工智能算法能力、算法框架和相關(guān)接口。
華為、天數(shù)智芯、摩爾線程、中科曙光、燧原科技、英偉達(dá)、英特爾、AMD等都推出有相關(guān)的芯片。如,華為推出了昇騰系列AI芯片昇騰910和昇騰310等,這些芯片專為AI訓(xùn)練和推理設(shè)計(jì),具有高性能和低功耗的特點(diǎn)。昇騰系列已廣泛應(yīng)用于數(shù)據(jù)中心、云服務(wù)和邊緣計(jì)算等領(lǐng)域,為智算中心提供強(qiáng)大的算力支持。
英偉達(dá)推出了多款針對(duì)AI訓(xùn)練和推理的GPU產(chǎn)品,如A100、H100等。英特爾也推出了多款A(yù)I芯片產(chǎn)品,如Habana Labs的Gaudi系列芯片,旨在與英偉達(dá)競(jìng)爭(zhēng)。AMD在AI芯片領(lǐng)域也有所布局,推出了MI系列GPU和APU產(chǎn)品。
從存儲(chǔ)方面來(lái)看,智算中心需要存儲(chǔ)海量的數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)等。這些數(shù)據(jù)是AI算法訓(xùn)練和推理的基礎(chǔ)。因此,智算中心在存儲(chǔ)方面需要具備高容量、高可靠性、高可用性等特點(diǎn)。
存儲(chǔ)設(shè)備通常采用高性能的硬盤或固態(tài)硬盤,并配備冗余的存儲(chǔ)架構(gòu),以確保數(shù)據(jù)的安全性和可訪問性。一般而言,智算中心的主要算力硬件智算服務(wù)器,其DRAM容量和NAND容量通常是傳統(tǒng)服務(wù)器的數(shù)倍。三星、美光、SK海力士等都有相關(guān)芯片都廣泛應(yīng)用于數(shù)據(jù)中心、云計(jì)算等領(lǐng)域,為智算中心提供高性能的存儲(chǔ)解決方案。
網(wǎng)絡(luò)互聯(lián)方面,智算中心的設(shè)備互聯(lián)首先依賴于硬件基礎(chǔ)設(shè)施,包括高性能的交換機(jī)、路由器、無(wú)線產(chǎn)品等網(wǎng)絡(luò)設(shè)備,以及用于連接服務(wù)器、存儲(chǔ)設(shè)備等的光纖、網(wǎng)線等物理介質(zhì)。為了實(shí)現(xiàn)設(shè)備間的高效互聯(lián),智算中心通常采用高速互聯(lián)技術(shù),如InfiniBand、RoCE(RDMA over Converged Ethernet)等。這些技術(shù)能夠提供低延遲、高帶寬的數(shù)據(jù)傳輸能力,滿足AI算法對(duì)算力的需求。
在智算中心中,GPU是核心的計(jì)算單元。為了實(shí)現(xiàn)GPU之間的高效互聯(lián),通常采用NVLink等專用通信協(xié)議,以實(shí)現(xiàn)高速的P2P(點(diǎn)對(duì)點(diǎn))互聯(lián)帶寬。NVLink是NVIDIA開發(fā)并推出的一種私有通信協(xié)議,它采用點(diǎn)對(duì)點(diǎn)結(jié)構(gòu)、串列傳輸,可以達(dá)到數(shù)百GB/s的P2P互聯(lián)帶寬。
寫在最后
智算中心作為智慧時(shí)代的基礎(chǔ)設(shè)施,將在未來(lái)社會(huì)經(jīng)濟(jì)發(fā)展中發(fā)揮越來(lái)越重要的作用。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,智算中心將迎來(lái)更加廣闊的發(fā)展前景。而上游產(chǎn)業(yè)鏈為智算中心提供了必要的硬件和軟件支持。這些產(chǎn)業(yè)鏈參與者的共同努力和協(xié)作,推動(dòng)了智算中心計(jì)算能力的不斷提升和發(fā)展。
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4169瀏覽量
85479 -
計(jì)算
+關(guān)注
關(guān)注
2文章
439瀏覽量
38667 -
智算中心
+關(guān)注
關(guān)注
0文章
49瀏覽量
1598
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論