0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

速度和容量受制?No!高性能存儲(chǔ)的瓶頸不止于此

E4Life ? 來(lái)源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2022-02-25 09:40 ? 次閱讀
近兩年以來(lái)存儲(chǔ)市場(chǎng)可謂好不熱鬧,SSD帶來(lái)的急速已經(jīng)體現(xiàn)在了下至消費(fèi)電子,上至超算的性能上,然而隨著高性能計(jì)算走上了全新的道路,大吞吐量和大容量也已經(jīng)不再是HPC存儲(chǔ)關(guān)注的唯二設(shè)計(jì)目標(biāo)了。

那么當(dāng)下的HPC存儲(chǔ)遇上了哪些挑戰(zhàn)呢?首先數(shù)據(jù)生成已經(jīng)在被數(shù)據(jù)接入逐漸取代,大數(shù)據(jù)環(huán)境下,IOPS要求的反而是小數(shù)據(jù)的隨機(jī)存取。其次,“尋找”到真正所需的數(shù)據(jù)成了最關(guān)鍵的一環(huán),也對(duì)元數(shù)據(jù)在統(tǒng)計(jì)、讀取、寫入和刪除上提出了更高的要求。加之近年來(lái)涌現(xiàn)的不同文件與數(shù)據(jù)形式,處理起來(lái)需要額外的注意,高性能存儲(chǔ)必須具備大型數(shù)據(jù)轉(zhuǎn)移的能力。

新的高性能計(jì)算場(chǎng)景

就以目前一些在建的智能城市項(xiàng)目為例,諸多傳感器和執(zhí)行器散落在城市中,激光雷達(dá)、攝像頭、微流控傳感器和電機(jī),它們將產(chǎn)生PB級(jí)別的原始數(shù)據(jù),這些數(shù)據(jù)在需要經(jīng)過(guò)壓縮、預(yù)處理、上傳、深度學(xué)習(xí)和推理,存儲(chǔ)可以說(shuō)與邊緣計(jì)算和機(jī)器學(xué)習(xí)緊密聯(lián)系在一起。

另一個(gè)例子就是我們的自動(dòng)駕駛,如今的自動(dòng)駕駛方案都是通過(guò)數(shù)據(jù)與高性能計(jì)算實(shí)現(xiàn)的,像特斯拉這樣的廠商甚至自研自建芯片和超算,用于其自動(dòng)駕駛技術(shù)的開(kāi)發(fā)。自動(dòng)駕駛測(cè)試車隊(duì)每天都要將PB級(jí)的遙測(cè)傳感數(shù)據(jù)傳輸給數(shù)據(jù)平臺(tái),隨后經(jīng)過(guò)標(biāo)簽、分類、錯(cuò)誤檢測(cè)仿真,再放到大型存儲(chǔ)系統(tǒng)中,而這樣的大型存儲(chǔ)平臺(tái)不僅大小可能擴(kuò)展至EB級(jí),還要承受著仿真、再處理與機(jī)器學(xué)習(xí)的繁重負(fù)載。

在這些新場(chǎng)景給出的挑戰(zhàn)下,興起了一波新的技術(shù),比如PCIe 4.0朝PCIe 5.0轉(zhuǎn)變,光模塊從200G朝400G的轉(zhuǎn)變,使用GPU直接存儲(chǔ)等專用協(xié)議等等。這些技術(shù)多數(shù)是對(duì)HPC存儲(chǔ)在吞吐量上的提升,而更重要的是對(duì)特定工作流效率的優(yōu)化。

HPC系統(tǒng)中存儲(chǔ)的組成

在當(dāng)下的HPC場(chǎng)景中,無(wú)論是本地部署還是云端環(huán)境,都需要一個(gè)計(jì)算平臺(tái),可能是CPU或是CPU+GPU/加速器的配置,這一節(jié)點(diǎn)可以充分利用3D Xpoint這樣的持久內(nèi)存,不僅可以提供低延遲的內(nèi)存數(shù)據(jù)訪問(wèn),在斷電下不丟失數(shù)據(jù),還可以用上DAOS這樣分布式異步對(duì)象存儲(chǔ)的文件系統(tǒng)。

Lustre文件系統(tǒng) / Lustre

接著是存儲(chǔ)平臺(tái),也就是并行文件系統(tǒng)的所在,這個(gè)系統(tǒng)可能是基于Lustre、Spectrum或是NVMe-oF的方案。但無(wú)論是哪種系統(tǒng),考慮到需要低成本大容量,通常都會(huì)用到NVMe硬盤和HDD硬盤的混合方案,但這就提出了數(shù)據(jù)分布以及數(shù)據(jù)移動(dòng)上的挑戰(zhàn)。不過(guò)現(xiàn)在已經(jīng)有了PCC/LROC這樣的客戶端持久性高速緩存,在存儲(chǔ)或數(shù)據(jù)敏感的環(huán)境中,只需完成計(jì)算平臺(tái)和存儲(chǔ)平臺(tái)相關(guān)的數(shù)據(jù)移動(dòng),進(jìn)一步降低了I/O開(kāi)銷。

最后是數(shù)據(jù)的管理,這一部分屬于對(duì)大量數(shù)據(jù)更加長(zhǎng)期的存儲(chǔ),比如像波音這樣的航空公司,需要對(duì)每一架飛機(jī)的細(xì)致數(shù)據(jù)存儲(chǔ)50年以上,還要具備數(shù)據(jù)追溯的能力。這樣的存儲(chǔ)并不需要擁有高速的性能,但在前端的程序需要時(shí)提供即時(shí)的交互,而且為了節(jié)能考慮,要做到所謂的“零功耗存儲(chǔ)”。

超算是怎么做的?

隨著不少超算都已經(jīng)在布局百億億級(jí)的系統(tǒng),作為HPC中最頂端的應(yīng)用,我們自然可以從中窺得一二,看一看當(dāng)下主流的HPC存儲(chǔ)方案。以計(jì)劃于今年打造完成的Frontier超算為例,該超算將成為美國(guó)第一臺(tái)百億億級(jí)別的超算,算力約為1.5 exaFLOPS。

Frontier超級(jí)計(jì)算機(jī) / AMD

Frontier采取了AMD的全套方案,結(jié)合AMD的EPyc CPU和Radeon Instinct GPU,在AMD的緩存一致性互聯(lián)方案下,CPU上的代碼可以直接訪問(wèn)GPU內(nèi)存,這也就是我們?cè)谏衔奶岬降腉PU直接存儲(chǔ)技術(shù)。在存儲(chǔ)系統(tǒng)上,F(xiàn)rontier用到了679PB基于Lustre+ZFS的文件系統(tǒng)方案,用47700塊硬盤實(shí)現(xiàn),最高速率可達(dá)5TB/s。高速存儲(chǔ)上,共有5400塊NVMe固態(tài)硬盤組成11PB的存儲(chǔ)空間,提供10TB/s的讀取速度。

Aurora超級(jí)計(jì)算機(jī) / 英特爾
而Aurora同樣作為今年推出的百億億級(jí)超算系統(tǒng),則選擇了英特爾的方案,單個(gè)計(jì)算節(jié)點(diǎn)由兩個(gè)Xeon Sapphire Rapids、6個(gè)Xe Ponte Vecchio GPU和一個(gè)通用內(nèi)存架構(gòu)組成。其主要存儲(chǔ)方案也選擇了英特爾的DAOS文件系統(tǒng),結(jié)合NVMe和傲騰持久內(nèi)存,組成一套大于230PB的系統(tǒng),并實(shí)現(xiàn)25TB/s的速度。

小結(jié)

在HPC存儲(chǔ)上的挑戰(zhàn)除了以上提到的這些外,還有近來(lái)興起的存內(nèi)計(jì)算激發(fā)的計(jì)算能力挑戰(zhàn),未來(lái)5年內(nèi),無(wú)論是存儲(chǔ)結(jié)構(gòu)、文件系統(tǒng)乃至存儲(chǔ)材料都會(huì)再度迎來(lái)新的變化。這些變化會(huì)先一步解決HPC上的難題,再潛移默化地改善日常應(yīng)用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4180

    瀏覽量

    85498
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    306

    瀏覽量

    23621
  • 超算
    +關(guān)注

    關(guān)注

    1

    文章

    114

    瀏覽量

    9034
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    內(nèi)存儲(chǔ)器的特點(diǎn)是速度快成本低容量小對(duì)嗎

    內(nèi)存儲(chǔ)器,通常指的是計(jì)算機(jī)系統(tǒng)中的隨機(jī)存取存儲(chǔ)器(RAM),是計(jì)算機(jī)硬件的重要組成部分。它負(fù)責(zé)存儲(chǔ)計(jì)算機(jī)運(yùn)行時(shí)的數(shù)據(jù)和程序,以便處理器快速訪問(wèn)。內(nèi)存儲(chǔ)器的特點(diǎn)包括
    的頭像 發(fā)表于 10-14 10:05 ?192次閱讀

    存儲(chǔ)器中訪問(wèn)速度最快的是什么

    在探討存儲(chǔ)器中訪問(wèn)速度最快的是哪一種時(shí),我們首先需要了解計(jì)算機(jī)存儲(chǔ)系統(tǒng)的層次結(jié)構(gòu)以及各類存儲(chǔ)器的特性和功能。計(jì)算機(jī)存儲(chǔ)系統(tǒng)通常包括多個(gè)層次的
    的頭像 發(fā)表于 10-12 17:01 ?674次閱讀

    某證券公司智能云投資交易云集群高性能分布式存儲(chǔ)應(yīng)用

    某證券公司智能云投資交易云集群高性能分布式存儲(chǔ)應(yīng)用
    的頭像 發(fā)表于 09-27 09:57 ?200次閱讀
    某證券公司智能云投資交易云集群<b class='flag-5'>高性能</b>分布式<b class='flag-5'>存儲(chǔ)</b>應(yīng)用

    SK海力士推出高性能數(shù)據(jù)中心SSD PEB110

    SK海力士近日宣布成功開(kāi)發(fā)出專為數(shù)據(jù)中心設(shè)計(jì)的高性能固態(tài)硬盤(SSD)新品——PEB110 E1.S(簡(jiǎn)稱PEB110),標(biāo)志著公司在數(shù)據(jù)存儲(chǔ)解決方案領(lǐng)域邁出了重要一步。這款SSD旨在滿足數(shù)據(jù)中心日益增長(zhǎng)的高性能、大
    的頭像 發(fā)表于 09-12 17:01 ?500次閱讀

    三星電子推出性能更強(qiáng)、容量更大的升級(jí)版1TB microSD 存儲(chǔ)

    microSD 存儲(chǔ)卡 PRO Plus 和 EVO Plus 采用三星先進(jìn)的 V-NAND 技術(shù),可安全可靠地捕捉和存儲(chǔ)日常瞬間 性能提升后,順序讀取速度高達(dá) 180MB/s,傳輸
    的頭像 發(fā)表于 08-01 09:24 ?192次閱讀
    三星電子推出<b class='flag-5'>性能</b>更強(qiáng)、<b class='flag-5'>容量</b>更大的升級(jí)版1TB microSD <b class='flag-5'>存儲(chǔ)</b>卡

    基于WDS的天瑞水泥企業(yè)高性能私有云存儲(chǔ)方案

    基于WDS的天瑞水泥企業(yè)高性能私有云存儲(chǔ)方案
    的頭像 發(fā)表于 07-31 09:47 ?205次閱讀
    基于WDS的天瑞水泥企業(yè)<b class='flag-5'>高性能</b>私有云<b class='flag-5'>存儲(chǔ)</b>方案

    黑龍江電力高性能WDS分布式存儲(chǔ)系統(tǒng)解決方案

    黑龍江電力高性能WDS分布式存儲(chǔ)系統(tǒng)解決方案
    的頭像 發(fā)表于 07-01 09:54 ?283次閱讀
    黑龍江電力<b class='flag-5'>高性能</b>WDS分布式<b class='flag-5'>存儲(chǔ)</b>系統(tǒng)解決方案

    鋰電池灌封膠:不止于鋰電池,更廣泛的應(yīng)用前景

    封膠:不止于鋰電池,更廣泛的應(yīng)用前景 鋰電池灌封膠,作為電子工業(yè)中的一項(xiàng)重要材料,長(zhǎng)久以來(lái)都以其卓越的防水、防潮、防震和導(dǎo)熱性能,在鋰電池的安全防護(hù)中發(fā)揮著不可替代的作用。然而,它的應(yīng)用領(lǐng)域遠(yuǎn)不止于此
    的頭像 發(fā)表于 06-03 16:18 ?478次閱讀

    虛擬存儲(chǔ)器的概念和特征

    隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,存儲(chǔ)器的容量速度成為了影響計(jì)算機(jī)性能的關(guān)鍵因素。在解決內(nèi)存容量不足和速度
    的頭像 發(fā)表于 05-24 17:23 ?1261次閱讀

    SolidWorks2024 不止于此但求優(yōu)越

    來(lái)了怎樣的變革和提升?本文將從SolidWorks2024的新特性、應(yīng)用領(lǐng)域的拓展以及對(duì)優(yōu)越品質(zhì)的追求三個(gè)方面,探討SolidWorks2024如何不止于此,但求優(yōu)越。
    的頭像 發(fā)表于 04-18 13:04 ?450次閱讀
    SolidWorks2024 <b class='flag-5'>不止于此</b>但求優(yōu)越

    兆芯攜手智云創(chuàng)新推出高性能NVMe企業(yè)級(jí)存儲(chǔ)系統(tǒng)

    面向持續(xù)增長(zhǎng)的數(shù)字化轉(zhuǎn)型與應(yīng)用創(chuàng)新發(fā)展需求,兆芯攜手智云創(chuàng)新,基于兆芯高性能自主處理器平臺(tái)成功推出多款信創(chuàng)存儲(chǔ)產(chǎn)品,包括高性能NVMe企業(yè)級(jí)存儲(chǔ)系統(tǒng)、HS6000系列企業(yè)級(jí)
    的頭像 發(fā)表于 04-12 14:06 ?472次閱讀

    Hitek Systems開(kāi)發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求

    Hitek Systems 使用開(kāi)放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開(kāi)發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網(wǎng)絡(luò)、計(jì)算和高容量存儲(chǔ)應(yīng)用的需求。
    的頭像 發(fā)表于 03-22 14:02 ?522次閱讀
    Hitek Systems開(kāi)發(fā)基于PCIe的<b class='flag-5'>高性能</b>加速器以滿足行業(yè)需求

    NVMe Host Controller IP實(shí)現(xiàn)高性能存儲(chǔ)解決方案

    電子發(fā)燒友網(wǎng)站提供《NVMe Host Controller IP實(shí)現(xiàn)高性能存儲(chǔ)解決方案.pdf》資料免費(fèi)下載
    發(fā)表于 02-21 14:28 ?0次下載

    佰維存儲(chǔ)研發(fā)突破,為AI高性能計(jì)算賦能

    近日,佰維存儲(chǔ)在接受調(diào)研時(shí)透露,公司近期成功研發(fā)并發(fā)布了支持CXL2.0規(guī)范的CXLDRAM內(nèi)存擴(kuò)展模塊。這款產(chǎn)品具有支持內(nèi)存容量和帶寬擴(kuò)展、內(nèi)存池化共享、高帶寬、低延遲、高可靠性等優(yōu)勢(shì),特別適合于AI高性能計(jì)算的應(yīng)用。
    的頭像 發(fā)表于 01-23 16:13 ?735次閱讀

    The ONE 產(chǎn)品系列重磅上市,aigo打造高性能移動(dòng)存儲(chǔ)新體驗(yàn)!

    近年來(lái),數(shù)據(jù)規(guī)模呈爆炸式增長(zhǎng),傳統(tǒng)存儲(chǔ)方式已無(wú)法滿足用戶需求,冷數(shù)據(jù)存儲(chǔ)應(yīng)運(yùn)而生。移動(dòng)固態(tài)硬盤作為冷存儲(chǔ)數(shù)據(jù)經(jīng)驗(yàn)的延伸,以其高性能、大容量、
    的頭像 發(fā)表于 12-01 10:49 ?354次閱讀
    The ONE 產(chǎn)品系列重磅上市,aigo打造<b class='flag-5'>高性能</b>移動(dòng)<b class='flag-5'>存儲(chǔ)</b>新體驗(yàn)!