0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA BlueField DPU將加速計(jì)算提升到新的水平

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-06-01 10:29 ? 次閱讀

全球的超級計(jì)算中心都在紛紛利用 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上的 NVIDIA BlueField DPU 將加速計(jì)算提升到一個(gè)新的水平。

在歐洲和美國,HPC 開發(fā)者正在利用 NVIDIA BlueField-2 DPU 內(nèi)的 Arm 核和加速器的強(qiáng)大功能為超級計(jì)算機(jī)提供強(qiáng)大助力。

美國洛斯阿拉莫斯國家實(shí)驗(yàn)室(LANL)正在與 NVIDIA 進(jìn)行一項(xiàng)為期多年的廣泛合作,這項(xiàng)合作旨在將計(jì)算型多物理應(yīng)用的性能提高 30 倍。

LANL 研究人員預(yù)計(jì),使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上運(yùn)行的 DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用 BlueField 以及 NVIDIA DOCA 軟件框架在計(jì)算存儲(chǔ)、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。

面向 DPU 的開放式 API

這些努力還將有助于進(jìn)一步定義 OpenSNAPI ,任何人都可通過該應(yīng)用接口來控制 DPU 。這是統(tǒng)計(jì)計(jì)算框架(Unified Communication Framework)的一個(gè)項(xiàng)目,Unified Communication Framework 是一個(gè)旨在實(shí)現(xiàn) HPC 應(yīng)用異構(gòu)計(jì)算的聯(lián)盟,成員包括 Arm 、IBM 、NVIDIA 、美國國家實(shí)驗(yàn)室和美國的一些大學(xué)。

LANL 已經(jīng)感受到網(wǎng)絡(luò)計(jì)算的強(qiáng)大功能,這要?dú)w功于其創(chuàng)建的 DPU 賦能的存儲(chǔ)系統(tǒng)。

加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲(chǔ)與 DPU 和 InfiniBand 加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達(dá)同類存儲(chǔ)系統(tǒng)的 30 倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。

一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計(jì)算靠近存儲(chǔ),可更大限度減少數(shù)據(jù)移動(dòng),從而提高仿真和數(shù)據(jù)分析工作流程的效率?!?/p>

德克薩斯州打造出云原生超級計(jì)算平臺

德克薩斯高級計(jì)算中心(TACC)近期也開始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2 。它將在 InfiniBand 網(wǎng)絡(luò)上使用 DPU,使其 Lonestar6 系統(tǒng)成為云原生超級計(jì)算的開發(fā)平臺。

TACC 的 Lonestar6 為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開發(fā)者,以及一些研究中心和教職人員提供服務(wù)。

MPI 獲得加速

在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個(gè) HPC 熱門編程模型的運(yùn)行速度提高 26%。

他們通過卸載消息傳遞接口(MPI)的關(guān)鍵部分,加速了 P3DFFT ,這是一個(gè)用于眾多大規(guī)模 HPC 仿真的數(shù)學(xué)庫。

俄亥俄州立大學(xué)計(jì)算機(jī)科學(xué)與工程專業(yè)的教授 Dhabaleswar K. (DK) Panda 在其帶領(lǐng)的 MVAPICH 開源軟件團(tuán)隊(duì)推動(dòng) DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因?yàn)樗鼈兛梢约铀龠\(yùn)行各種工作負(fù)載?!?/p>

HPC 中心和云中的 DPU

對于運(yùn)行藥物研發(fā)或飛機(jī)設(shè)計(jì)等 HPC 仿真應(yīng)用的超級計(jì)算機(jī)而言,高達(dá)兩位數(shù)的性能加速是驚人的。Panda 表示,云服務(wù)可以利用這些加速提高客戶的生產(chǎn)力,他已收到多個(gè) HPC 中心的代碼請求。

Quantum InfiniBand 網(wǎng)絡(luò)以及 NVIDIA SHARP 特性,助力他高效完成工作。

他說:“其他人還在談?wù)摼W(wǎng)絡(luò)計(jì)算,而 InfiniBand 已經(jīng)在為它提供支持?!?/p>

達(dá)勒姆開發(fā)負(fù)載均衡

歐洲的多個(gè)研究團(tuán)隊(duì)正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負(fù)載。

例如,英格蘭北部的達(dá)勒姆大學(xué)正在開發(fā)一款軟件,用于在 16 個(gè)節(jié)點(diǎn)的 Dell PowerEdge 集群上使用 BlueField DPU 以實(shí)現(xiàn) MPI 作業(yè)的負(fù)載均衡。該項(xiàng)目的首席調(diào)查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設(shè)施更高效地處理更好算法鋪平道路。

劍橋大學(xué)和慕尼黑的 DPU 應(yīng)用

劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用 DPU 。

倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機(jī)系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機(jī)處理器之間移動(dòng)數(shù)據(jù),以便在需要時(shí)數(shù)據(jù)已然就位。

Dell PowerEdge 服務(wù)器內(nèi)的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機(jī) CPU 的安全策略、存儲(chǔ)框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。

與此同時(shí),慕尼黑工業(yè)大學(xué)計(jì)算機(jī)體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用 DPU 來卸載 MPI 和操作系統(tǒng)任務(wù),這是 EuroHPC 項(xiàng)目的一部分。

在美國,佐治亞理工學(xué)院的研究人員正在與桑迪亞國家實(shí)驗(yàn)室合作,利用 BlueField-2 DPU 加速分子動(dòng)力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達(dá) 20% ,且不會(huì)損失模擬的準(zhǔn)確性。

不斷擴(kuò)展的網(wǎng)絡(luò)

本月早些時(shí)候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)平臺。

NEC 將使用 H100 的為筑波大學(xué)計(jì)算科學(xué)中心構(gòu)建算力大約為 6 PFLOPS 超級計(jì)算機(jī)。研究人員將使用該系統(tǒng)實(shí)現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。

與此同時(shí),Panda 等研究人員已經(jīng)開始考慮如何使用 BlueField-3 DPU 的核心功能。

他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載?!?/p>

原文標(biāo)題:ISC22 | HPC 研究人員借助 NVIDIA BlueField DPU 為網(wǎng)絡(luò)計(jì)算的未來打下堅(jiān)實(shí)基礎(chǔ)

文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4814

    瀏覽量

    102629
  • 計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    439

    瀏覽量

    38667
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    352

    瀏覽量

    24072

原文標(biāo)題:ISC22 | HPC 研究人員借助 NVIDIA BlueField DPU 為網(wǎng)絡(luò)計(jì)算的未來打下堅(jiān)實(shí)基礎(chǔ)

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計(jì)算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計(jì)劃成員,其開發(fā)的產(chǎn)品基于高性能分布式時(shí)序數(shù)據(jù)庫,是支持復(fù)雜計(jì)算和流數(shù)據(jù)分析的實(shí)時(shí)計(jì)算平臺,適用于金融、電力
    的頭像 發(fā)表于 09-09 09:57 ?344次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark平臺<b class='flag-5'>提升</b><b class='flag-5'>計(jì)算</b>性能

    NVIDIA BlueField-3 DPU助力思科提高工作負(fù)載安全性和運(yùn)營效率

    、位置和外形尺寸的應(yīng)用程序工作負(fù)載。 思科最近發(fā)布了Cisco Secure Workload 3.9 版,企業(yè)的安全性和運(yùn)營效率提升到了新的水平。它提供了新的功能來緩解威脅和漏洞,并為部署微分段(microsegmentat
    的頭像 發(fā)表于 06-27 17:31 ?672次閱讀

    基于ESP32S進(jìn)行BLE MESH開發(fā),基于的是BLE4.2,是否可以提升到BLE5.0?

    1.現(xiàn)在基于ESP32S進(jìn)行BLE MESH開發(fā),基于的是BLE4.2,是否可以提升到BLE5.0? 2.BLE4.2是否可以接收到BLE5.0 Beacon?Code: Select all
    發(fā)表于 06-12 07:49

    借助NVIDIA DOCA 2.7增強(qiáng)AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動(dòng)和 API,以便為 NVIDIA BlueField DPU 和 SuperNI
    的頭像 發(fā)表于 05-29 09:22 ?398次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)推理的稠密網(wǎng)絡(luò)和熱
    的頭像 發(fā)表于 04-20 09:39 ?568次閱讀

    基于NVIDIA DOCA 2.6實(shí)現(xiàn)高性能和安全的AI云設(shè)計(jì)

    作為專為 NVIDIA? BlueField? 網(wǎng)絡(luò)平臺而設(shè)計(jì)的數(shù)據(jù)中心基礎(chǔ)設(shè)施軟件框架,NVIDIA? DOCA? 使廣大開發(fā)者能夠利用其行業(yè)標(biāo)準(zhǔn) API 在
    的頭像 發(fā)表于 02-23 10:02 ?403次閱讀

    利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

    本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學(xué)習(xí)模型,并借助NVIDIA Triton推理服務(wù)器在NVIDIA V1
    的頭像 發(fā)表于 01-17 09:30 ?600次閱讀

    《數(shù)據(jù)處理器:DPU編程入門》DPU計(jì)算入門書籍測評

    , 數(shù)據(jù)加速應(yīng)用實(shí)踐 。 分別介紹了DPU技術(shù)和英偉達(dá)DPU技術(shù): DPU的誕生 現(xiàn)代計(jì)算架構(gòu)及問題 數(shù)據(jù)解耦及大帶寬數(shù)據(jù)應(yīng)用 英偉達(dá)
    發(fā)表于 12-24 10:54

    《數(shù)據(jù)處理器:DPU編程入門》讀書筆記

    AI、機(jī)器學(xué)習(xí)、安全、電信和存儲(chǔ)等應(yīng)用,并提升性能,減輕虛擬化Hypervisor的工作負(fù)載。同時(shí),它還具備開放性集成功能,未來支持更多功能集成。NVIDIADPU還提供統(tǒng)一的面向各種應(yīng)用的編程接口
    發(fā)表于 12-21 10:47

    《數(shù)據(jù)處理器:DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    BlueField-3 DPU 的關(guān)鍵軟件定義、硬件加速應(yīng)用包括: 1.云網(wǎng)絡(luò):云覆蓋、SDN 加速、NAT、負(fù)載均衡等。 NVIDIA
    發(fā)表于 12-08 18:03

    什么是DPU?

    ,能以線速或網(wǎng)絡(luò)中的可用速度解析、處理數(shù)據(jù),并高效地數(shù)據(jù)傳輸?shù)紾PU和CPU。 各種靈活和可編程的加速引擎,可以卸載AI、機(jī)器學(xué)習(xí)、安全、電信和存儲(chǔ)等應(yīng)用,并提升性能。 所有這些DPU
    發(fā)表于 11-03 10:55

    解碼 DPU 編程,投稿贏取好禮!

    十余位資深系統(tǒng)架構(gòu)師歷經(jīng)數(shù)月編寫而成,定位為 NVIDIA BlueField 系列 DPUNVIDIA DOCA 開發(fā)環(huán)境
    的頭像 發(fā)表于 11-01 20:25 ?374次閱讀
    解碼 <b class='flag-5'>DPU</b> 編程,投稿贏取好禮!

    很好的書籍,學(xué)以致用

    BlueField系列DPUNVIDIA DOCA的實(shí)用指南,使開發(fā)人員和數(shù)據(jù)科學(xué)家能走近DPU的應(yīng)用和編程,是一本非常好的DPU入門書
    發(fā)表于 10-31 08:45

    5V脈沖信號怎么可以提升到28V脈沖?

    PCF8591,5V脈沖信號怎么可以提升到28V脈沖?
    發(fā)表于 10-25 08:29

    【書籍評測活動(dòng)NO.23】數(shù)據(jù)處理器:DPU編程入門

    資格! “DPU將是未來計(jì)算的三大支柱之一。CPU用于通用計(jì)算,GPU用于加速計(jì)算,而DPU
    發(fā)表于 10-24 15:21