0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA贏得四項最新行業(yè)指標

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2021-11-21 10:57 ? 次閱讀

在五項新的行業(yè)指標中,NVIDIA 贏得了其中的四項。這些指標聚焦于AI在高性能計算中的應(yīng)用,是一種推動科學和行業(yè)進步的方法。

MLPerf HPC 1.0 是用于衡量高性能計算中 AI 性能的行業(yè)基準測試,而 NVIDIA 賦能的系統(tǒng)在該基準的五項測試中勝出四項。

MLPerf 是用于深度學習的行業(yè)基準測試,首次發(fā)布于 2018 年 5 月。上述戰(zhàn)績是 MLPerf 基準測試的最新結(jié)果。MLPerf HPC 解決了一種計算方式,可借助 AI 加速并增強超級計算機上的模擬。

分子動力學、天文學和氣候模擬的近期進展都使用 HPC+AI 取得了科學突破。這種趨勢可以推動科學和工業(yè)領(lǐng)域用戶采用E級(Exascale) AI。

基準測試衡量內(nèi)容

MLPerf HPC 1.0 在 HPC 中心的三個典型工作負載中測試 AI 模型訓練。

Cosmoflow 判斷望遠鏡圖像中物體的細節(jié)。

Deepcam 測試對氣候數(shù)據(jù)中颶風和大氣河流的檢測。

Opencatalyst 跟蹤系統(tǒng)預(yù)測分子中原子間力的成效。

每個測試分為兩個部分。衡量系統(tǒng)訓練模型的速度的指標被稱為強標度。其對應(yīng)的弱標度是衡量系統(tǒng)最大吞吐量的指標,即系統(tǒng)在給定時間內(nèi)可以訓練多少模型。

與去年 MLPerf 0.7 那一輪的強標度最佳成績相比,NVIDIA 為 Cosmoflow 性能提升了多達 5 倍。在 deepcam 方面,則將性能提高了近 7 倍以上。

勞倫斯伯克利國家實驗室 (Lawrence Berkeley National Laboratory) 的 Perlmutter 系統(tǒng)使用了 5,120 個 NVIDIA A100 Tensor Core GPU 中的 2,048 個,在 opencatalyst基準中成績斐然。

在弱標度類別中,NVIDIA使用每個作業(yè) 16 個節(jié)點和 256 個同時作業(yè)來主導(dǎo) deepcam。NVIDIA所有的測試都在 NVIDIA Selene(如上圖),即NVIDIA內(nèi)部系統(tǒng)和大型工業(yè)超級計算機上運行。

最新結(jié)果顯示 NVIDIA AI 平臺及其性能領(lǐng)先性的另一個維度。這是 NVIDIA 第八次在 MLPerf 基準中獲得最高分,該基準涵蓋數(shù)據(jù)中心、云和網(wǎng)絡(luò)邊緣的 AI 訓練和推理。

龐大的生態(tài)系統(tǒng)

本輪八名參與者中有七名使用 NVIDIA GPU 提交了結(jié)果。

其中包括德國于利希超級計算中心、瑞士國家超算中心,以及美國的阿貢國家實驗室、勞倫斯伯克利國家實驗室、國家超級計算機應(yīng)用中心和德克薩斯高級計算中心。

于利希超算中心(Jülich Supercomputing Centre)主任 Thomas Lippert 表示:“通過基準測試,我們已經(jīng)證明我們的機器能夠在實踐中發(fā)揮其潛力,并有助于讓歐洲在 AI 方面保持領(lǐng)先?!?/p>

MLPerf 基準由 MLCommons 提供支持。后者是由阿里巴巴、Google、英特爾、Meta、NVIDIA 等牽頭的行業(yè)組織。

我們的實現(xiàn)方式

如此強勁的表現(xiàn)都得益于 NVIDIA AI 平臺的成熟發(fā)展。該平臺目前已包括完整的軟件堆棧。

在這一輪中,NVIDIA使用每個人都可以使用的工具來調(diào)整代碼,例如可以加速數(shù)據(jù)處理的 NVIDIA DALI 和能夠減少小批量延遲的 CUDA Graphs,追蹤將橫向擴展到 1,024 個或更多個 GPU。此外還應(yīng)用了 NVIDIA SHARP,這是 NVIDIA MagnumIO 中的一個關(guān)鍵組件,可提供網(wǎng)絡(luò)計算以加速通信并將數(shù)據(jù)操作卸載到 NVIDIA Quantum InfiniBand 交換機網(wǎng)絡(luò)。

NVIDIA用于提交作品的所有軟件均可從 MLPerf 倉庫獲得。NVIDIA定期將此類代碼添加到 NGC 目錄。該目錄是NVIDIA預(yù)訓練 AI 模型、行業(yè)應(yīng)用程序框架、GPU 應(yīng)用程序和其他軟件資源的軟件中心。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4814

    瀏覽量

    102632
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29359

    瀏覽量

    267647

原文標題:SC21 | MLPerf 基準測試闡明為什么 AI 是 HPC 的未來

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    維信諾四項高性能顯示技術(shù)

    OLED顯示技術(shù)持續(xù)在創(chuàng)新浪潮中前行,低功耗、窄邊框、多形態(tài)等創(chuàng)新技術(shù)不斷發(fā)展并受到市場歡迎。為充分滿足市場需求,推動顯示性能的精進,維信諾在SID展會帶來4高性能前沿技術(shù)。
    的頭像 發(fā)表于 09-20 10:11 ?370次閱讀

    維信諾四項屏幕集成創(chuàng)新技術(shù)

    屏幕作為信息交互的窗口,正沿著多種功能集成一體化方向演進,帶來更多維、更便捷的交互體驗。本屆展會,維信諾帶來四項屏幕集成創(chuàng)新技術(shù),不僅拓寬了屏幕技術(shù)的邊界,也為用戶帶來了+1+1+1+1的交互升級。
    的頭像 發(fā)表于 09-20 10:07 ?384次閱讀

    在THS3201的datasheet中,有一指標noise figure,其值為11dB,這個指標怎么解釋?

    請問專家,在THS3201的datasheet中,有一指標noise figure,其值為11dB(G=10V/V,RG=28歐姆,RF=255歐姆),這個指標怎么解釋?
    發(fā)表于 09-12 06:25

    單對以太網(wǎng) (SPE) 連接器的四項主要優(yōu)勢

    、8芯,減少為雙芯??娠@著減少連接器、連接線的體積、重量,讓設(shè)備的布線更靈活。在實際應(yīng)用中,單對以太網(wǎng) (SPE) 連接器的四項主要優(yōu)勢包括: 高頻率:SPE連接器的傳輸頻率為1-600MHz,而傳統(tǒng)
    的頭像 發(fā)表于 08-14 08:35 ?342次閱讀
    單對以太網(wǎng) (SPE) 連接器的<b class='flag-5'>四項</b>主要優(yōu)勢

    大Google更新將登陸Samsung設(shè)備

    在近期的 Galaxy Unpacked 發(fā)布會上,我們宣布了四項即將在 Samsung 最新設(shè)備中推出的 Google 更新,這些設(shè)備包括 Galaxy Z Flip6、Z Fold6 和最新款 Galaxy 手表。
    的頭像 發(fā)表于 08-09 16:58 ?652次閱讀

    NVIDIA和谷歌云宣布開展一新的合作,加速AI開發(fā)

    NVIDIA 和谷歌云宣布開展一新的合作,以幫助全球初創(chuàng)企業(yè)加速創(chuàng)建生成式 AI 應(yīng)用和服務(wù)。
    的頭像 發(fā)表于 04-11 14:03 ?428次閱讀

    聯(lián)發(fā)科看重“OAGI”四項特質(zhì)選拔人才,提升競爭力

    當日,陳冠州出席了陽明交通大學主辦的半導(dǎo)體領(lǐng)域高峰研討會,進一步闡述了其在選拔人才方面的策略和投入。據(jù)稱,聯(lián)發(fā)科已通過與校方廣泛合作,實施超過100扶持學生的項目,涉及人數(shù)高達數(shù)百人。
    的頭像 發(fā)表于 04-11 10:00 ?297次閱讀

    ROG助力i9-14900KS達到9117.75 MHz,創(chuàng)下四項世界紀錄

    近日,據(jù) ROG 玩家國度官方微博透露,ROG MAXIMUS Z790 APEX ENCORE 助力 i9-14900KS 刷新至 9117.75 MHz,創(chuàng)造四項世界紀錄(CPU 頻率、SUPERPI 1M、PIFAST、PYPRIME 32B)。
    的頭像 發(fā)表于 03-15 11:40 ?582次閱讀

    NVIDIA即將推出一新的生成式AI專業(yè)認證

    NVIDIA 即將推出一新的生成式 AI 專業(yè)認證,助力開發(fā)者在這一重要領(lǐng)域證明自身技術(shù)實力。
    的頭像 發(fā)表于 03-14 09:43 ?489次閱讀

    GTI頒獎典禮落幕,華為無線再度斬獲四項大獎

    在剛剛落幕的GTI Awards 2024頒獎典禮上,華為無線再度斬獲四項大獎。
    的頭像 發(fā)表于 03-01 09:38 ?355次閱讀

    Nvidia是如何顛覆芯片行業(yè)的呢?

    Nvidia在AI芯片市場的主導(dǎo)地位正在驅(qū)動整個技術(shù)行業(yè)發(fā)生巨大變革。伴隨這些顛覆性的變化,既蘊藏著機遇,也伴隨著風險,以及部分玩家可能被迫面臨適應(yīng)或出局的命運。
    的頭像 發(fā)表于 12-14 09:57 ?561次閱讀

    核心路由器的十性能指標

    電子發(fā)燒友網(wǎng)站提供《核心路由器的十性能指標.doc》資料免費下載
    發(fā)表于 11-10 16:28 ?0次下載
    核心路由器的十<b class='flag-5'>項</b>性能<b class='flag-5'>指標</b>

    DigiKey 憑借品牌更新榮獲四項 MarCom 大獎

    全球供應(yīng)品類豐富、發(fā)貨快速的商業(yè)現(xiàn)貨技術(shù)元件和自動化產(chǎn)品分銷商?DigiKey?日前宣布,在 2023 國際營銷和傳播專業(yè)人士創(chuàng)意大賽上榮獲包括兩個鉑金獎(最高榮譽)、一個金獎和一個榮譽獎在內(nèi)的四項
    發(fā)表于 11-10 14:08 ?1171次閱讀
    DigiKey 憑借品牌更新榮獲<b class='flag-5'>四項</b> MarCom 大獎

    連接器的四項重要性能測試

    要的一,這類測試主要包括接觸電阻、絕緣電阻、額定電壓、電流承載能力等參數(shù)。在連接器設(shè)計和制造過程中,確保電氣性能的穩(wěn)定和安全是至關(guān)重要的。 二、機械性能測試: 機械性能測試是連接器測試中的另一關(guān)鍵指標,這類測試
    的頭像 發(fā)表于 11-06 18:00 ?726次閱讀

    方之力 啟產(chǎn)教新篇|全國新一代信息技術(shù)創(chuàng)新行業(yè)產(chǎn)教融合共同體成立

    10月22日,全國新一代信息技術(shù)創(chuàng)新行業(yè)產(chǎn)教融合共同體(以下簡稱“共同體”)成立大會在北京理工大學召開。共同體是在 教育部職業(yè)教育與成人教育司、工業(yè)和信息化部教育與考試中心、廣東省教育廳、開放原子
    的頭像 發(fā)表于 10-24 10:30 ?376次閱讀
    聚<b class='flag-5'>四</b>方之力 啟產(chǎn)教新篇|全國新一代信息技術(shù)創(chuàng)<b class='flag-5'>新行業(yè)</b>產(chǎn)教融合共同體成立