0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CCF HPC China 2023 | 超融合以太加持:北京大學(xué)高性能計(jì)算平臺(tái)將迎來(lái)大提速

華為數(shù)據(jù)通信 ? 來(lái)源:未知 ? 2023-08-25 18:10 ? 次閱讀

wKgZomToju-APKHNAABYb2B4C6Q259.png

8月25日,在青島舉行的全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)大會(huì)(CCF HPC China 2023)上,2023華為高性能計(jì)算解決方案分論壇同步舉辦。來(lái)自北京大學(xué)計(jì)算中心工程師付振新分享了“北京大學(xué)高性能計(jì)算平臺(tái)超融合以太數(shù)據(jù)中心網(wǎng)絡(luò)解決方案實(shí)踐”。

wKgZomToju-Aaw42AADGekqd3fA526.jpg

北京大學(xué)計(jì)算中心工程師 付振新 現(xiàn)場(chǎng)分享

為滿(mǎn)足校內(nèi)的教學(xué)科研計(jì)算需求,北京大學(xué)從2018年起陸續(xù)建設(shè)了“未名一號(hào)”、“未名生科一號(hào)”、“未名教學(xué)二號(hào)”等高性能計(jì)算集群,有力地提升了校內(nèi)的算力供應(yīng)能力。隨著承載的用戶(hù)、計(jì)算任務(wù)和數(shù)據(jù)量不斷增加,原有平臺(tái)的網(wǎng)絡(luò)基礎(chǔ)設(shè)施性能逐漸不敷使用,因此北京大學(xué)在2023年進(jìn)行了高性能計(jì)算平臺(tái)的系統(tǒng)及網(wǎng)絡(luò)改造項(xiàng)目。經(jīng)過(guò)全方位的綜合評(píng)估,北京大學(xué)最終選擇了華為超融合以太數(shù)據(jù)中心網(wǎng)絡(luò)解決方案,實(shí)現(xiàn)高性能計(jì)算平臺(tái)的大提速,真正釋放算力基礎(chǔ)設(shè)施的全部潛力。

科研創(chuàng)新迎來(lái)算力時(shí)代

進(jìn)入二十一世紀(jì)以來(lái),人類(lèi)的科學(xué)探索逐漸深入高度復(fù)雜、高度不確定性的新環(huán)境,大量龐大而復(fù)雜的科學(xué)問(wèn)題需要借助超級(jí)計(jì)算機(jī)來(lái)進(jìn)行模擬、仿真、預(yù)測(cè)。從傳統(tǒng)的化學(xué)化工、生物制藥、高能物理、金融工程、社會(huì)治理,到新興的大數(shù)據(jù)、人工智能、網(wǎng)絡(luò)信息安全等等,都因強(qiáng)大算力的加持而取得了超出以往的全新進(jìn)展和成果。

北京大學(xué)早在2018年就建成了高性能計(jì)算校級(jí)公共平臺(tái),先后建成投用了“未名一號(hào)”、“未名教學(xué)二號(hào)”、“未名生科一號(hào)”等5套集群。不過(guò)隨著平臺(tái)使用人數(shù)、計(jì)算任務(wù)的增加,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的流量吞吐量和復(fù)雜性都大大增加,年均節(jié)點(diǎn)占用率都在80%以上,“未名生科一號(hào)”的節(jié)點(diǎn)占用率甚至長(zhǎng)期處于95%以上,作業(yè)時(shí)間和排隊(duì)時(shí)間變得越來(lái)越漫長(zhǎng)。針對(duì)這一問(wèn)題,幾家供應(yīng)商分別提出了基于IB、RoCEv1、RoCEv2等技術(shù)打造的網(wǎng)絡(luò)方案。在北京大學(xué)組織的基準(zhǔn)測(cè)試和通用地球系統(tǒng)模式CESM、分子動(dòng)力學(xué)軟件VASP等應(yīng)用場(chǎng)景測(cè)試中,華為提供的基于RoCEv2的超融合以太數(shù)據(jù)中心網(wǎng)絡(luò)解決方案表現(xiàn)出了優(yōu)異性能,能夠有效縮短作業(yè)運(yùn)行時(shí)間和排隊(duì)時(shí)間,于是成功入選北京大學(xué)高性能計(jì)算平臺(tái)的改造項(xiàng)目。

生態(tài)開(kāi)放、性能優(yōu)異:RoCE前景看好

為適應(yīng)用戶(hù)對(duì)計(jì)算效率、時(shí)延、擴(kuò)展性等方面的苛刻要求,高性能計(jì)算需要在不同節(jié)點(diǎn)之間實(shí)時(shí)高速傳遞海量數(shù)據(jù),這對(duì)服務(wù)器互連方案的要求非常高。目前業(yè)界主流的計(jì)算互聯(lián)協(xié)議有RoCE和IB兩種,其中IB具有高吞吐、低時(shí)延、高可靠性等特點(diǎn),技術(shù)先進(jìn),不過(guò)主要掌握在英特爾、IBM、英偉達(dá)等企業(yè)手中,技術(shù)和產(chǎn)品生態(tài)都比較封閉,成本高昂。RoCE則是一種基于以太網(wǎng)絡(luò)的RDMA網(wǎng)絡(luò)協(xié)議,生態(tài)相對(duì)開(kāi)放,而且著力于實(shí)現(xiàn)網(wǎng)絡(luò)的無(wú)損傳輸,深受各國(guó)高性能計(jì)算和AI等產(chǎn)業(yè)歡迎,被認(rèn)為是未來(lái)全球數(shù)字化的重要路徑。

華為基于RoCE的超融合以太技術(shù),具有完善的流量控制、擁塞控制、流量調(diào)度和應(yīng)用加速功能,獨(dú)家實(shí)現(xiàn)了以太網(wǎng)0丟包。此外,華為還開(kāi)發(fā)了在網(wǎng)計(jì)算(INC)技術(shù)有效提高集合通信效率、降低總的任務(wù)完成時(shí)間,在時(shí)延方面比IB略勝一籌。

在北京大學(xué)組織的測(cè)試中,共有TCP/IP、IB、RoCEv2三種方案,分別用基準(zhǔn)測(cè)試工具Linpack和地球系統(tǒng)模式CESM、分子動(dòng)力學(xué)軟件VASP等應(yīng)用進(jìn)行實(shí)驗(yàn)。結(jié)果表明,承載VASP應(yīng)用時(shí),華為100GE RoCEv2略?xún)?yōu)于IB;承載Linpack和CESM時(shí),華為方案與IB性能表現(xiàn)基本一致。此前權(quán)威評(píng)測(cè)機(jī)構(gòu)Tolly也曾做過(guò)測(cè)試,在擁塞條件下的帶寬和時(shí)延等基礎(chǔ)性能測(cè)試、MPI計(jì)算性能基準(zhǔn)測(cè)試以及HPC應(yīng)用測(cè)試中,華為方案的性能都優(yōu)于其它廠(chǎng)商的IB組網(wǎng)方案。這些實(shí)測(cè)結(jié)果都表明,華為超融合以太網(wǎng)絡(luò)解決方案可完全可以代替IB方案。

wKgZomTojvCAATpjAAGCrMSf09s160.png

支持算力建設(shè),服務(wù)數(shù)字未來(lái)

近年來(lái),華為超融合以太網(wǎng)絡(luò)解決方案已經(jīng)在國(guó)內(nèi)外多個(gè)高性能計(jì)算平臺(tái)項(xiàng)目中落地應(yīng)用。比如在2022年,華為超融合以太網(wǎng)絡(luò)解決方案還在武漢超算中心、阿聯(lián)酋高級(jí)國(guó)家研究和教育網(wǎng)絡(luò)Ankabut項(xiàng)目中投入了應(yīng)用,因其卓越性能而得到了客戶(hù)的高度評(píng)價(jià)。

在北京大學(xué)高性能計(jì)算平臺(tái)的前期項(xiàng)目中,“未名二號(hào)”集群就采用了華為100GE RoCE無(wú)損以太網(wǎng)絡(luò)方案?!拔疵?hào)”由240臺(tái)CPU計(jì)算節(jié)點(diǎn)和30臺(tái)GPU計(jì)算節(jié)點(diǎn)組成,后續(xù)可擴(kuò)容至340臺(tái)CPU計(jì)算節(jié)點(diǎn)。與IB方案相比,北京大學(xué)高性能計(jì)算平臺(tái)管理人員發(fā)現(xiàn)華為RoCE方案無(wú)需用戶(hù)改變使用習(xí)慣,以太網(wǎng)帶寬增加更快,性能也超出預(yù)期。

隨著HPC和AI應(yīng)用的快速發(fā)展,對(duì)網(wǎng)絡(luò)帶寬吞吐的需求將不斷增長(zhǎng),從100GE、200GE、400GE到800GE等更高速率不斷演進(jìn)的以太網(wǎng)絡(luò)無(wú)疑是最佳的承載技術(shù)。與此同時(shí),RoCE無(wú)損以太網(wǎng)絡(luò)在時(shí)延、吞吐量、可靠性、編解碼和調(diào)制技術(shù)等方面也在不斷進(jìn)步,使得無(wú)損以太網(wǎng)絡(luò)的總體性能不斷提高,未來(lái)有望在自動(dòng)駕駛、智能制造、生物科技、金融等更多行業(yè)和領(lǐng)域投入應(yīng)用。

wKgZomTojvGAOb8aAAEeyHFS5w4874.png

wKgZomTojvGAUssyAABH79rerUY727.gif 點(diǎn)擊“閱讀原文”,了解更多華為數(shù)據(jù)通信資訊!


原文標(biāo)題:CCF HPC China 2023 | 超融合以太加持:北京大學(xué)高性能計(jì)算平臺(tái)將迎來(lái)大提速

文章出處:【微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    215

    文章

    34187

    瀏覽量

    250586

原文標(biāo)題:CCF HPC China 2023 | 超融合以太加持:北京大學(xué)高性能計(jì)算平臺(tái)將迎來(lái)大提速

文章出處:【微信號(hào):Huawei_Fixed,微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    科研計(jì)算HPC平臺(tái)是什么

    高性能計(jì)算平臺(tái)HPC平臺(tái))是一個(gè)利用由成千上萬(wàn)個(gè)處理器核心組成的超級(jí)計(jì)算機(jī)或
    的頭像 發(fā)表于 10-21 10:43 ?62次閱讀

    RISC-V AI技術(shù)正式納入北京大學(xué)研究生課程

    課堂此次合作是產(chǎn)學(xué)研結(jié)合的一次重要實(shí)踐?;?b class='flag-5'>北京大學(xué)集成電路學(xué)院開(kāi)設(shè)的研究生課程《現(xiàn)代SoC芯片架構(gòu)設(shè)計(jì)》,希姆計(jì)算北京大學(xué)達(dá)成課程合作,RISC-VAI核心
    的頭像 發(fā)表于 10-18 08:09 ?209次閱讀
    RISC-V AI技術(shù)正式納入<b class='flag-5'>北京大學(xué)</b>研究生課程

    帶你了解什么是高性能計(jì)算HPC

    受益于HPC更高的速度處理大量數(shù)據(jù)的能力,全球正在進(jìn)入HPC大周期,高性能計(jì)算的發(fā)展水平已經(jīng)成為衡量一個(gè)國(guó)家綜合實(shí)力和高科技發(fā)展水平的重要標(biāo)志,美國(guó)、歐盟、日本、英國(guó)都高度重視
    的頭像 發(fā)表于 07-20 08:28 ?402次閱讀
    帶你了解什么是<b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>(<b class='flag-5'>HPC</b>)

    超高“質(zhì)”量——CCF HPC China 2024主題論壇正式公布

    積蓄點(diǎn)點(diǎn)星火,以待磅礴進(jìn)發(fā),第 20 屆 CCF 全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)(以下簡(jiǎn)稱(chēng)“CCF HPC Ch
    的頭像 發(fā)表于 07-19 09:55 ?252次閱讀
    超高“質(zhì)”量——<b class='flag-5'>CCF</b> <b class='flag-5'>HPC</b> <b class='flag-5'>China</b> 2024主題論壇正式公布

    引領(lǐng)高校原生人才新生態(tài) 北京大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心正式成立

    6月22日,北京大學(xué)與華為技術(shù)有限公司在北京簽署合作協(xié)議,“北京大學(xué) 鯤鵬昇騰科教創(chuàng)新卓越中心”(以下簡(jiǎn)稱(chēng)“卓越中心”)正式成立揭牌。雙方圍繞卓越中心著力推動(dòng)科研
    的頭像 發(fā)表于 06-25 16:23 ?338次閱讀
    引領(lǐng)高校原生人才新生態(tài) <b class='flag-5'>北京大學(xué)</b>鯤鵬昇騰科教創(chuàng)新卓越中心正式成立

    潤(rùn)石科技董事長(zhǎng)參加北京大學(xué)集成電路學(xué)院“未名·芯”論壇

    2024年5月5日,在紀(jì)念五四運(yùn)動(dòng)105周年,也是北京大學(xué)建校126周年之際,潤(rùn)石科技董事長(zhǎng)張明先生受北京大學(xué)集成電路學(xué)院校友返校、共敘情誼活動(dòng)邀請(qǐng)
    的頭像 發(fā)表于 05-11 14:06 ?854次閱讀

    北京大學(xué)講座 | 大模型時(shí)代的軟件研發(fā):技術(shù)、范式與工具

    3 月 10 日,華為云與北京大學(xué)合作在軟件和微電子學(xué)院舉辦了此次關(guān)于研發(fā)大模型的講座,這不僅是華為云與北大第一次在 AI 大模型上進(jìn)行產(chǎn)教融合,更是雙方對(duì)于推動(dòng)大模型研發(fā)與應(yīng)用,培養(yǎng)相關(guān)技術(shù)人才
    的頭像 發(fā)表于 05-09 23:00 ?413次閱讀
    <b class='flag-5'>北京大學(xué)</b>講座 | 大模型時(shí)代的軟件研發(fā):技術(shù)、范式與工具

    北京大學(xué)-知存科技存算一體聯(lián)合實(shí)驗(yàn)室揭牌,開(kāi)啟知存科技產(chǎn)學(xué)研融合戰(zhàn)略新升級(jí)

    、知存科技首席科學(xué)家郭昕婕博士及企業(yè)研發(fā)相關(guān)負(fù)責(zé)人參加了現(xiàn)場(chǎng)揭牌儀式。面向多模態(tài)大模型時(shí)代產(chǎn)業(yè)發(fā)展新需求,雙方攜手踏上探索存算一體技術(shù)前沿發(fā)展和應(yīng)用的新征程。 ? ? 北京大學(xué)集成電路學(xué)院院長(zhǎng)蔡一茂(左二)、北京大學(xué)
    的頭像 發(fā)表于 05-07 19:31 ?1305次閱讀
    <b class='flag-5'>北京大學(xué)</b>-知存科技存算一體聯(lián)合實(shí)驗(yàn)室揭牌,開(kāi)啟知存科技產(chǎn)學(xué)研<b class='flag-5'>融合</b>戰(zhàn)略新升級(jí)

    北京大學(xué)問(wèn)世世界最薄光學(xué)晶體:氮化硼晶體

    據(jù)悉,光學(xué)晶體被譽(yù)為激光技術(shù)的核心部件,廣泛運(yùn)用于微納加工、量子光源及生物檢測(cè)等領(lǐng)域。北京大學(xué)科研團(tuán)隊(duì)通過(guò)不斷嘗試,最終確定氮化硼作為最適合研發(fā)新型激光器的材料。
    的頭像 發(fā)表于 04-26 10:41 ?619次閱讀

    北京大學(xué)高性能計(jì)算綜合能力競(jìng)賽圓滿(mǎn)結(jié)束

    近日,第一屆北京大學(xué)高性能計(jì)算綜合能力競(jìng)賽(HPCGame)舉辦了閉幕式暨頒獎(jiǎng)典禮。在全體參賽選手的積極參與和精彩角逐下,本屆共有來(lái)自87所高校,890名選手報(bào)名參賽。RISC-V新架構(gòu)獎(jiǎng)獲獎(jiǎng)選手共
    的頭像 發(fā)表于 04-14 08:34 ?568次閱讀
    <b class='flag-5'>北京大學(xué)</b><b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>綜合能力競(jìng)賽圓滿(mǎn)結(jié)束

    百川智能與北京大學(xué)共建通用人工智能聯(lián)合實(shí)驗(yàn)室

    近日,百川智能與北京大學(xué)攜手合作,共同簽署了“北大——百川通用人工智能聯(lián)合實(shí)驗(yàn)室”的共建協(xié)議,標(biāo)志著雙方在人工智能領(lǐng)域邁出了堅(jiān)實(shí)的合作步伐。
    的頭像 發(fā)表于 03-21 11:45 ?791次閱讀

    北京大學(xué)首次硬件實(shí)現(xiàn)電容耦合的VO2相變振蕩動(dòng)力學(xué)計(jì)算系統(tǒng)

    北京大學(xué)集成電路學(xué)院楊玉教授課題組首次硬件實(shí)現(xiàn)了電容耦合的VO2相變振蕩動(dòng)力學(xué)計(jì)算系統(tǒng)。
    的頭像 發(fā)表于 02-28 11:28 ?831次閱讀
    <b class='flag-5'>北京大學(xué)</b>首次硬件實(shí)現(xiàn)電容耦合的VO2相變振蕩動(dòng)力學(xué)<b class='flag-5'>計(jì)算</b>系統(tǒng)

    什么是HPC高性能計(jì)算

    高性能計(jì)算(HighPerformanceComputing,簡(jiǎn)稱(chēng)HPC),是指利用集群、網(wǎng)格、算等計(jì)算機(jī)技術(shù),通過(guò)合理地組織
    的頭像 發(fā)表于 02-19 13:27 ?732次閱讀
    什么是<b class='flag-5'>HPC</b><b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>

    北京大學(xué)其魯談:電池新材料的當(dāng)下和未來(lái)

    電池“達(dá)沃斯”-電池百人會(huì)12月5日訊“我認(rèn)為我國(guó)已經(jīng)跨入新的鋰電池應(yīng)用時(shí)代,就是儲(chǔ)能時(shí)代?!?b class='flag-5'>北京大學(xué)教授、中關(guān)村新型電池技術(shù)創(chuàng)新聯(lián)盟理事長(zhǎng)其魯表示,“從明年開(kāi)始,儲(chǔ)能時(shí)代就要從中國(guó)開(kāi)始走向世界。但是,有幾個(gè)問(wèn)題如果不能解決好,可能也會(huì)產(chǎn)生很多起起伏伏?!?/div>
    的頭像 發(fā)表于 12-08 10:00 ?851次閱讀

    北大計(jì)算中心成立60周年,未名二號(hào)高性能計(jì)算集群暨華為全球樣板點(diǎn)上線(xiàn)

    [中國(guó),北京2023年11月13日] 今日,為紀(jì)念北京大學(xué)計(jì)算中心成立60周年,“高校數(shù)字化轉(zhuǎn)型創(chuàng)新發(fā)展高峰論壇-算力新時(shí)代下高性能
    的頭像 發(fā)表于 11-14 09:10 ?466次閱讀
    北大<b class='flag-5'>計(jì)算</b>中心成立60周年,未名二號(hào)<b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>集群暨華為全球樣板點(diǎn)上線(xiàn)