0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何擴(kuò)大HPC資源的使用?

戰(zhàn)略科技前沿 ? 來源:集成電路研發(fā)競爭情報 ? 作者:集成電路研發(fā)競爭 ? 2020-12-24 10:07 ? 次閱讀

隨著數(shù)據(jù)密集型問題的增長,學(xué)術(shù)研究人員對訪問諸如高性能計算(HPC)等強(qiáng)大算力系統(tǒng)的需求也在增多,然而,當(dāng)前HPC資源的供應(yīng)尚不能滿足日益增長的需求。HPC有益于不同科學(xué)和工程領(lǐng)域的研究人員應(yīng)對重要科研挑戰(zhàn),推動了尖端人工智能AI)應(yīng)用的發(fā)展。但是,有限的HPC資源及其不充分利用,阻礙了研究人員開發(fā)新產(chǎn)品和服務(wù)的能力。我國在超級計算機(jī)方面發(fā)展迅速,達(dá)到國際先進(jìn)水平,但同樣需要增益超算資源的利用,以支持更多的科研和創(chuàng)新活動。2020年12月7日,美國智庫信息技術(shù)與創(chuàng)新基金會(ITIF)數(shù)據(jù)創(chuàng)新中心發(fā)布《如何增加超算資源的訪問》報告,就如何擴(kuò)大AI研究人員對HPC資源的使用提出具體建議。

01

美國國會應(yīng)在未來五年內(nèi)向美國國家科學(xué)基金會(NSF)和美國能源部(DOE)提供100億美元,以滿足HPC資源的供需平衡。

在HPC基礎(chǔ)設(shè)施方面,美國NSF從國會獲得的資助額度從2010年到2019年下降了約一半,即從3.52億美元下降到1.67億美元。2019年的資助金額尚不足以支撐1/3的美國NSF HPC資源訪問需求,如圖1所示。為滿足快速增長的HPC資源訪問需求,在未來五年內(nèi),美國國會應(yīng)將其對美國NSF HPC基礎(chǔ)設(shè)施的資助額度提高到至少5億美元/年。

美國DOE從美國國會獲得的資助額度從2010年到2019年增加了約90%,即從2010年2.76億美元增加到2019年5.23億美元。但是,2019年,美國DOE HPC資源訪問需求仍是供應(yīng)的3倍。因此,美國國會應(yīng)授權(quán)美國DOE將其對HPC基礎(chǔ)設(shè)施的資助額度提高到至少15億美元/年。

圖1 2019年美國NSF XSEDE所需和可用服務(wù)單元對比

02

美國NSF應(yīng)該支持代表大多數(shù)研究人員的潛在HPC長尾用戶。

美國許多州擁有從事AI研究的頂級研究機(jī)構(gòu),但缺乏本地HPC資源的獲取途徑來進(jìn)行AI研究。美國NSF應(yīng)加大資助這些州的“中程HPC系統(tǒng)”和“中心HPC系統(tǒng)”。此外還應(yīng)關(guān)注AI研究和HPC資源都相對貧乏的區(qū)域或機(jī)構(gòu),合理分配資助經(jīng)費。

圖2 HPC計算系統(tǒng)的四個類別

03

美國DOE和NSF應(yīng)該更有效地分配HPC計算時間。

為了更精確的為研究人員分配HPC資源,DOE和NSF首先要了解用戶的計算需求。目前提議的一些流程主要集中于給定項目所需的HPC系統(tǒng)計算峰值方面。但除此之外,美國DOE和NSF還需進(jìn)一步了解用戶所需其它HPC能力,包括互連帶寬、數(shù)據(jù)長期存儲等。

04

美國DOE和NSF應(yīng)為研究者提供HPC方面的專家,以提高科研生產(chǎn)力。

HPC系統(tǒng)的使用需要專業(yè)技術(shù)人才,美國DOE和NSF應(yīng)該探索如何以更有效和可擴(kuò)展的方式提供HPC專業(yè)知識,以提高研究人員的生產(chǎn)力。例如,美國NSF應(yīng)該擴(kuò)展“極端科學(xué)與工程發(fā)現(xiàn)環(huán)境”(XSEDE)項目的良好實踐,允許研究人員在申請HPC資源使用的同時申請相應(yīng)時段的專業(yè)技術(shù)人員指導(dǎo)。這些HPC專業(yè)技術(shù)人員來自XSEDE項目的合作伙伴,他們將協(xié)助所分配的項目,以加快項目進(jìn)展、達(dá)成研究目標(biāo)。類似此類實踐,美國DOE應(yīng)為阿貢國家實驗室和橡樹嶺國家實驗室的HPC資源配備更多的HPC專業(yè)技術(shù)人員,以期同時提供給用戶、提升科研生產(chǎn)力。

圖3 2019年美國NSF XSEDE資源服務(wù)的研究領(lǐng)域分配情況

05

美國NSF應(yīng)資助兩年制學(xué)院開發(fā)HPC課程,促進(jìn)其與四年制大學(xué)的無縫銜接。

HPC專業(yè)人員的需求日益增長,但達(dá)到技術(shù)準(zhǔn)入門檻的合格技術(shù)人員數(shù)量明顯不夠。部分原因是因為兩年制學(xué)院的大學(xué)預(yù)科和四年制大學(xué)之間的教學(xué)漏洞,阻礙了許多學(xué)生從事計算機(jī)科學(xué)。為了彌補(bǔ)這一缺口,美國NSF應(yīng)該資助兩年制學(xué)院和四年制大學(xué)聯(lián)合開發(fā)HPC課程,確保兩年制學(xué)院或社區(qū)大學(xué)的學(xué)生掌握計算機(jī)科學(xué)低年級課程,以便無縫地進(jìn)入高年級學(xué)習(xí)。

06

美國NSF應(yīng)為AI研究者提供多樣化的HPC資源組合。

云計算為遠(yuǎn)程訪問HPC資源提供了可行路徑,突破了訪問HPC資源的空間限制。美國國會應(yīng)批準(zhǔn)“國家AI研究資源任務(wù)工作組法案2020”關(guān)于NSF成立專項任務(wù)組為AI研究開發(fā)國家公共云計算資源的提議。目前,美國NSF只在一個私有云環(huán)境(Jetstream)上分配HPC資源。美國NSF應(yīng)擴(kuò)大HPC資源組合以提供更多的云服務(wù),諸如投資更多的私有云、與多種公有云合作。

圖3截至2019年美國NSF HPC系統(tǒng)和服務(wù)情況

07

美國NSF應(yīng)制定并發(fā)布路線圖,以明確未來投資方向。

下一代計算設(shè)施長期計劃可以確保研究人員訪問最先進(jìn)的計算系統(tǒng),進(jìn)而確保他們具有比競爭對手更高的生產(chǎn)力和更快的創(chuàng)新速度。同時,長期計劃還將為科學(xué)軟件開發(fā)提供指導(dǎo)。美國DOE已經(jīng)有此類路線圖,美國NSF應(yīng)該加快步伐。美國NSF應(yīng)該每年收集用戶需求并發(fā)布路線圖,以便更好地確定HPC優(yōu)先事項和戰(zhàn)略決策。這項工作應(yīng)該由美國國家AI研究資源任務(wù)工作組牽頭。

08

美國NSF應(yīng)建立更多的公私合作伙伴關(guān)系。

為實現(xiàn)AI研究投資回報最大化,需要有效的機(jī)制促進(jìn)AI基礎(chǔ)研究轉(zhuǎn)化為市場產(chǎn)品和服務(wù)。目前,美國NSF已啟動“創(chuàng)新伙伴關(guān)系計劃”,資助NSF項目與工業(yè)界合作研發(fā),旨在加速新技術(shù)向市場的轉(zhuǎn)化。但是,目前該計劃每年僅可以資助50個項目,美國NSF應(yīng)該加大該計劃的資助力度,至少增加到每年150個項目。為實施國家AI研究所計劃,美國NSF已與埃森哲、亞馬遜、谷歌和英特爾建立了合作伙伴關(guān)系,共同解決全國性的AI問題。此外,美國NSF應(yīng)該支持區(qū)域能力發(fā)展,鼓勵大學(xué)、地方企業(yè)、州和地方政府之間的合作。

09

美國DOE和NSF應(yīng)采用新的工具和流程,以確保用戶更合理和更有效地利用HPC資源。

通過分析用戶對HPC系統(tǒng)使用情況來優(yōu)化資源管理,以實現(xiàn)最大的HPC投資回報。美國DOE和NSF應(yīng)要求所有獲得HPC資源資助的機(jī)構(gòu)采用審計工具,以了解它們使用HPC系統(tǒng)的最佳方式。此外,美國NSF還應(yīng)建立中心系統(tǒng)機(jī)構(gòu)定期審查機(jī)制和用戶業(yè)務(wù)跟進(jìn)機(jī)制,以及時獲得反饋,進(jìn)而更新HPC戰(zhàn)略。

原文標(biāo)題:【政策規(guī)劃?算】美國智庫就如何擴(kuò)大HPC資源的使用提出具體建議

文章出處:【微信公眾號:集成電路研發(fā)競爭情報】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7289

    瀏覽量

    87516
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    304

    瀏覽量

    23607

原文標(biāo)題:【政策規(guī)劃?算】美國智庫就如何擴(kuò)大HPC資源的使用提出具體建議

文章出處:【微信號:gh_22c5315861b3,微信公眾號:戰(zhàn)略科技前沿】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI與HPC技術(shù)推動先進(jìn)封裝行業(yè)發(fā)展

    “隨著人工智能(AI)和高性能計算(HPC)技術(shù)的迅猛發(fā)展,半導(dǎo)體行業(yè)也迎來了新的變革浪潮?!薄@句話在2024年的今天,早已被喻為行業(yè)共識。
    的頭像 發(fā)表于 10-22 11:22 ?162次閱讀

    云計算hpc的主要功能是什么

    云計算HPC(High-Performance Computing)是指利用云計算技術(shù)來實現(xiàn)高性能計算的一種解決方案。云計算HPC將高性能計算能力以云服務(wù)的形式提供給用戶。
    的頭像 發(fā)表于 10-22 10:20 ?40次閱讀

    科研計算HPC平臺是什么

    高性能計算平臺(HPC平臺)是一個利用由成千上萬個處理器核心組成的超級計算機(jī)或計算機(jī)集群來執(zhí)行復(fù)雜計算任務(wù)的平臺。
    的頭像 發(fā)表于 10-21 10:43 ?62次閱讀

    HPC云計算前景

    高性能計算(HPC)與云計算的結(jié)合,正逐步成為推動科技創(chuàng)新和產(chǎn)業(yè)升級的重要引擎。隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大和計算需求的日益復(fù)雜,HPC云計算展現(xiàn)出了巨大的潛力和價值。
    的頭像 發(fā)表于 10-16 10:17 ?90次閱讀

    云計算hpc是什么意思

    云計算HPC(High-Performance Computing)是指利用云計算技術(shù)來實現(xiàn)高性能計算的一種解決方案。
    的頭像 發(fā)表于 10-15 10:01 ?88次閱讀

    Linux在車載HPC安全方面的工作原理

    隨著汽車智能化和自動駕駛技術(shù)的飛速發(fā)展,車載高性能計算(High-Performance Computing, HPC)系統(tǒng)已成為推動汽車產(chǎn)業(yè)革新的核心力量。在此背景下,Linux作為開源操作系統(tǒng)領(lǐng)域的佼佼者,正以其高度靈活性、強(qiáng)大生態(tài)系統(tǒng)以及不斷發(fā)展的安全特性,在車載HPC
    的頭像 發(fā)表于 08-27 14:58 ?350次閱讀
    Linux在車載<b class='flag-5'>HPC</b>安全方面的工作原理

    帶你了解什么是高性能計算(HPC

    受益于HPC更高的速度處理大量數(shù)據(jù)的能力,全球正在進(jìn)入HPC大周期,高性能計算的發(fā)展水平已經(jīng)成為衡量一個國家綜合實力和高科技發(fā)展水平的重要標(biāo)志,美國、歐盟、日本、英國都高度重視高性能計算的發(fā)展,并在
    的頭像 發(fā)表于 07-20 08:28 ?402次閱讀
    帶你了解什么是高性能計算(<b class='flag-5'>HPC</b>)

    助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究

    科學(xué)家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報、遺傳學(xué)和材料科學(xué)領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?328次閱讀
    助力科學(xué)發(fā)展,NVIDIA AI加速<b class='flag-5'>HPC</b>研究

    AI是把雙刃劍,HPC面臨的全新機(jī)遇與挑戰(zhàn)

    電子發(fā)燒友網(wǎng)報道(文/周凱揚(yáng))高性能計算也就是HPC(High Performance Computing),是一種利用超級計算機(jī)或高性能計算機(jī)集群的能力實現(xiàn)并行計算,以處理標(biāo)準(zhǔn)工作站無法完成的數(shù)據(jù)
    的頭像 發(fā)表于 05-11 00:11 ?3287次閱讀
    AI是把雙刃劍,<b class='flag-5'>HPC</b>面臨的全新機(jī)遇與挑戰(zhàn)

    AWS HPC為什么不用Infiniband?有何原因?

    HPC的低延遲需求來自于很多應(yīng)用都會通過網(wǎng)格刨分來進(jìn)行并行運(yùn)算,然后網(wǎng)格間有復(fù)雜而頻繁的通信數(shù)據(jù)交互,Brain將其稱為“Ghost Cell Exchange”。
    的頭像 發(fā)表于 04-16 16:59 ?482次閱讀
    AWS <b class='flag-5'>HPC</b>為什么不用Infiniband?有何原因?

    康佳特歡迎COM-HPC載板設(shè)計指南Rev. 2.2的發(fā)布 COM-HPC Mini規(guī)范現(xiàn)已完善

    ? 2024/4/2 中國上海 * * * 嵌入式和邊緣計算技術(shù)的領(lǐng)先供應(yīng)商德國康佳特--歡迎COM-HPC載板設(shè)計指南2.2修訂版的發(fā)布,該指南為開發(fā)人員新增了基于95毫米x70毫米COM-HPC
    發(fā)表于 04-02 10:47 ?515次閱讀
    康佳特歡迎COM-<b class='flag-5'>HPC</b>載板設(shè)計指南Rev. 2.2的發(fā)布 COM-<b class='flag-5'>HPC</b> Mini規(guī)范現(xiàn)已完善

    什么是HPC高性能計算

    高性能計算(HighPerformanceComputing,簡稱HPC),是指利用集群、網(wǎng)格、超算等計算機(jī)技術(shù),通過合理地組織計算機(jī)資源以及運(yùn)用適合的算法和程序,提高計算效率和處理能力,實現(xiàn)對大量
    的頭像 發(fā)表于 02-19 13:27 ?731次閱讀
    什么是<b class='flag-5'>HPC</b>高性能計算

    2024年,RISC-V能在HPC上實現(xiàn)突破嗎?

    電子發(fā)燒友網(wǎng)報道(文/周凱揚(yáng))自x86統(tǒng)治HPC多年以來,大家都在期待著能有新的架構(gòu)能夠打破這一現(xiàn)狀。而2020年的富岳超算做到了這一點,將Arm架構(gòu)以第一的姿態(tài)呈現(xiàn)在了大家的面前??呻S著RISC-V慢慢獲得更多的關(guān)注,不少人在猜測這個全新的開放式架構(gòu)何時能在HPC領(lǐng)域有
    的頭像 發(fā)表于 02-05 01:19 ?8015次閱讀

    SOVD協(xié)議在HPC中的應(yīng)用詳解

    整車電子電器架構(gòu)正在從分布式總線架構(gòu)逐漸向以High Performance Computer(以下簡稱HPC)為中心的集中式架構(gòu)轉(zhuǎn)變
    的頭像 發(fā)表于 12-29 16:34 ?5961次閱讀
    SOVD協(xié)議在<b class='flag-5'>HPC</b>中的應(yīng)用詳解

    研揚(yáng)最新COM-HPC模塊讓您獲得源源不斷的強(qiáng)勁性能

    HPC-RPSC的COM-HPC模塊擁有比以往任何產(chǎn)品更多的接口、存儲和處理能力,旨在為最苛刻的應(yīng)用提供最高性能。HPC-RPSC支持第12代和第13代IntelCore處理器,兼容超過10個
    的頭像 發(fā)表于 11-18 08:05 ?451次閱讀
    研揚(yáng)最新COM-<b class='flag-5'>HPC</b>模塊讓您獲得源源不斷的強(qiáng)勁性能