0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

近600個應(yīng)用程序通過NVIDIA GPU實(shí)現(xiàn)了提速

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:cc ? 2019-02-14 14:15 ? 次閱讀

十幾年前,還不曾有加速應(yīng)用程序。而如今已有近600個應(yīng)用程序通過NVIDIA GPU實(shí)現(xiàn)了提速。

這些應(yīng)用程序涵蓋了物理、生物科學(xué)、分子動力學(xué)、化學(xué)和天氣預(yù)報等各個領(lǐng)域。其中包括全球最熱門的15個高性能計算應(yīng)用程序,也都是通過GPU實(shí)現(xiàn)加速的。去年,NVIDIA GPU應(yīng)用程序目錄收錄了100多個應(yīng)用程序,接下來還會有更多的程序?qū)⒈魂懤m(xù)添加到目錄中。

Intersect 360研究所的一份報告中收錄了數(shù)據(jù)中心運(yùn)行的各個關(guān)鍵應(yīng)用程序。其中,排名前15的應(yīng)用程序均由GPU加速,這些都是一系列殺手級的核心科學(xué)應(yīng)用程序。其中包括:

GROMACS(化學(xué))– 分子動力學(xué)應(yīng)用程序,旨在模擬包含了數(shù)百到數(shù)百萬個粒子的系統(tǒng)的牛頓運(yùn)動方程。

ANSYS(流體動力學(xué)分析)– 模擬液體和氣體與表面的相互作用。

Gaussian(化學(xué))– 預(yù)測分子系統(tǒng)的能量、分子結(jié)構(gòu)和振動頻率。

VASP(化學(xué))– 用于從頭計算法量子力學(xué)分子動力學(xué)模擬。

NAMD(化學(xué))– 大型生物分子系統(tǒng)的高性能模擬。

Simulia Abaqus(結(jié)構(gòu)分析)– 用于結(jié)構(gòu)力學(xué)的模擬和分析。

WRF(天氣/環(huán)境建模)– 數(shù)值天氣預(yù)報系統(tǒng),專為大氣研究和操作預(yù)測應(yīng)用程序而設(shè)計。

OpenFOAM(流體動力學(xué)分析)– 通用型 CFD 軟件的求解器庫。

ANSYS(結(jié)構(gòu)分析)– 對高頻和高速電子元件中的 3D 全波電磁場進(jìn)行建模。

LS-DYNA(結(jié)構(gòu)分析)– 結(jié)構(gòu)力學(xué)的模擬和分析工具。

BLAST(生物科學(xué))– 應(yīng)用最為廣泛的生物信息學(xué)工具之一。

LAMMPS(化學(xué))– 經(jīng)典分子動力學(xué)程序包。

Amber(化學(xué))– 專門針對生物分子系統(tǒng)模擬而開發(fā)的分子動力學(xué)應(yīng)用程序。

Quantum Espresso(化學(xué))– 一套集成的計算機(jī)代碼,用于電子結(jié)構(gòu)計算和納米級材料建模。

GAMESS(化學(xué))– 用于模擬原子和分子電子結(jié)構(gòu)的計算化學(xué)套件。

這些工具本身無法實(shí)現(xiàn)性能的遞增性提升。但通過采用NVIDIA GPU的服務(wù)器,其性能通??商岣?0 倍或更多。并且,GPU加速可以改善數(shù)據(jù)中心的經(jīng)濟(jì)效益。

預(yù)測天氣

天氣預(yù)報是一項(xiàng)遠(yuǎn)比其看起來更加困難的工作。天氣預(yù)報是高性能計算領(lǐng)域的一個重要分支。準(zhǔn)確可靠的天氣預(yù)報不僅可以拯救生命,還有助于航空、能源和公用事業(yè)、保險、零售和其他行業(yè)做出經(jīng)濟(jì)決策。

天氣預(yù)報需要大量的計算資源,包括幾何尺度(尤其是全球天氣預(yù)報),和大量描述大氣狀態(tài)的變量。

但是,受限于可用的計算量和應(yīng)用程序的性能,當(dāng)前的天氣預(yù)報模型僅限于低分辨率的模擬,例如12公里的分辨率。

這些模型忽略了一些重要的細(xì)節(jié),例如云層的影響(云層可以反射太陽輻射,在天氣模式中扮演著重要的角色)。采用1公里云分辨率可以改善預(yù)測效果,但這需要 應(yīng)用程序的性能提升1700倍。

GPU加速可以彌補(bǔ)此差距,提高天氣預(yù)報的準(zhǔn)確性。

加速空氣動力學(xué)模擬

使用NASA的FUN3D代碼模擬SLS Block 1B助推器分離流場。該圖片由Jamie Meeroff,Henry Lee,NASA/Ames提供。

火箭能夠以超高的速度飛行,然而利用大規(guī)??諝鈩恿W(xué)模擬,我們可以對其進(jìn)行改進(jìn),讓火箭可以飛得更快、更高效。

NASA蘭利研究中心開發(fā)的FUN3D計算流體動力學(xué)軟件,可用于模擬各種空氣動力學(xué)應(yīng)用程序中的流體流動。該應(yīng)用程序在NASA Pleiades超級計算機(jī)上消耗的周期比其他任何應(yīng)用程序都要多。借助于GPU加速,采用了6個NVIDIA V100 Tensor Core GPU的服務(wù)器能夠以高出雙插槽CPU服務(wù)器30倍的性能運(yùn)行這些模擬。

總結(jié):GPU具備非常好的性能,從而高效地計算規(guī)模更大、更復(fù)雜的模擬。NASA已經(jīng)證明,在Summit超級計算機(jī)上,僅需運(yùn)行1000臺GPU服務(wù)器就可以完成100多萬個CPU核心的工作。而且,其能源成本遠(yuǎn)低于CPU。

性能持續(xù)提升

我們在各個加速計算領(lǐng)域都擁有深厚的儲備。結(jié)合由100多萬名開發(fā)人員組成的生態(tài)系統(tǒng),我們將共同形成一個不斷改進(jìn)的平臺。該平臺可以在相同的 GPU加速服務(wù)器上提供更高的應(yīng)用程序性能。

例如,在包含 11 個高性能計算應(yīng)用程序的組合中,對于采用4個NVIDIA Tesla P100 GPU的服務(wù)器,其當(dāng)前的運(yùn)行速度比兩年前提高了2倍。如果同時改進(jìn)軟件堆棧和GPU架構(gòu),您可以獲得更大的性能提升。

現(xiàn)在,通過單一平臺,您可以加速各種高性能計算領(lǐng)域的應(yīng)用程序:科學(xué)計算、工業(yè)模擬、深度學(xué)習(xí)機(jī)器學(xué)習(xí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4818

    瀏覽量

    102651
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4640

    瀏覽量

    128487

原文標(biāo)題:GPU已加速的近600個高性能計算應(yīng)用程序都有哪些?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA CorrDiff生成式AI模型能夠精準(zhǔn)預(yù)測臺風(fēng)

    NVIDIA GPU 上運(yùn)行的一擴(kuò)散模型向天氣預(yù)報工作者展示加速計算如何實(shí)現(xiàn)新的用途并提升能效。
    的頭像 發(fā)表于 09-13 17:13 ?588次閱讀

    IB Verbs和NVIDIA DOCA GPUNetIO性能測試

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一庫,專門為實(shí)時在線 GPU 數(shù)據(jù)包處理而設(shè)計。它結(jié)合
    的頭像 發(fā)表于 08-23 17:03 ?375次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO性能測試

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    NVIDIA全面轉(zhuǎn)向開源GPU內(nèi)核模塊

    借助 R515 驅(qū)動程序,NVIDIA 于 2022 年 5 月發(fā)布一套開源的 Linux GPU 內(nèi)核模塊,該模塊采用雙許可證,即 GPL 和 MIT 許可。初始版本主要面向數(shù)據(jù)中
    的頭像 發(fā)表于 07-25 09:56 ?306次閱讀
    <b class='flag-5'>NVIDIA</b>全面轉(zhuǎn)向開源<b class='flag-5'>GPU</b>內(nèi)核模塊

    借助NVIDIA DOCA 2.7增強(qiáng)AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供豐富的庫、驅(qū)動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高性能的應(yīng)用程序和服務(wù)。
    的頭像 發(fā)表于 05-29 09:22 ?406次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?583次閱讀

    請問使用FreeRTOS與LWIP不算應(yīng)用程序消耗600K Byte RAM是否夠用?

    大家好! 最近新項(xiàng)目中需要使用FreeRTOS + LWIP,選MCU時候,對內(nèi)部RAM資源無法準(zhǔn)確評估: 請問使用FreeRTOS與LWIP 不算應(yīng)用程序消耗 600K Byte RAM 是否夠用
    發(fā)表于 04-18 07:37

    Nvidia與AMD新芯片,突破PCIe瓶頸

    AMD 和 NvidiaGPU 都依賴 PCI 總線與 CPU 進(jìn)行通信。CPU 和 GPU 有兩不同的內(nèi)存域,數(shù)據(jù)必須通過 PCI
    的頭像 發(fā)表于 03-08 14:15 ?546次閱讀
    <b class='flag-5'>Nvidia</b>與AMD新芯片,突破PCIe瓶頸

    基于NVIDIA DOCA 2.6實(shí)現(xiàn)高性能和安全的AI云設(shè)計

    網(wǎng)絡(luò)平臺上快速創(chuàng)建應(yīng)用程序和服務(wù),并啟用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的強(qiáng)大功能,提供突破性的網(wǎng)絡(luò)、安全和存儲性能。
    的頭像 發(fā)表于 02-23 10:02 ?406次閱讀

    通過實(shí)時加速器技術(shù)實(shí)現(xiàn)實(shí)時應(yīng)用程序的 Windows

    時功能應(yīng)用程序。這是通過專門為實(shí)時應(yīng)用程序保留一或多個CPU來實(shí)現(xiàn)的,設(shè)置 Windows 適當(dāng)?shù)膮?shù)化并利用 acontis 內(nèi)核驅(qū)動
    的頭像 發(fā)表于 01-29 16:03 ?768次閱讀
    <b class='flag-5'>通過</b>實(shí)時加速器技術(shù)<b class='flag-5'>實(shí)現(xiàn)</b>實(shí)時<b class='flag-5'>應(yīng)用程序</b>的 Windows

    如何選擇NVIDIA GPU和虛擬化軟件的組合方案呢?

    NVIDIA vGPU 解決方案能夠?qū)?NVIDIA GPU 的強(qiáng)大功能帶入虛擬桌面、應(yīng)用程序和工作站,加速圖形和計算,使在家辦公或在任何地方工作的創(chuàng)意和技術(shù)專業(yè)人員能夠訪問虛擬化工作
    的頭像 發(fā)表于 01-12 09:26 ?922次閱讀
    如何選擇<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>和虛擬化軟件的組合方案呢?

    RTC第二功能和應(yīng)用程序

    一般RTC模塊設(shè)備管理時間日歷、計時器等。從年到二。一些愛普生RTC模塊可以通過使用來自32768 Hz的分割頻率來管理次第二功能。本文件描述RTC模塊的三具體的應(yīng)用程序。(表1)
    發(fā)表于 01-03 15:45 ?0次下載

    開發(fā)java應(yīng)用程序的基本步驟是

    Java應(yīng)用程序。確定您希望應(yīng)用程序能夠執(zhí)行的任務(wù)和提供的功能。這將有助于指導(dǎo)您在開發(fā)過程中進(jìn)行決策并確定實(shí)現(xiàn)代碼的方式。 2.設(shè)計應(yīng)用程序:在開始編寫代碼之前,您應(yīng)該設(shè)計
    的頭像 發(fā)表于 11-28 16:52 ?1452次閱讀

    NVIDIA GPU的核心架構(gòu)及架構(gòu)演進(jìn)

    在探討 NVIDIA GPU 架構(gòu)之前,我們先來了解一些相關(guān)的基本知識。GPU 的概念,是由 NVIDIA 公司在 1999 年發(fā)布 Geforce256 圖形處理芯片時首先提出,從此
    發(fā)表于 11-21 09:40 ?1328次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>的核心架構(gòu)及架構(gòu)演進(jìn)

    Flask如何升級到 Quart 應(yīng)用程序

    本文詳細(xì)介紹典型的生產(chǎn)環(huán)境的 CRUD 應(yīng)用程序從 Flask 到 Quart 的轉(zhuǎn)換,并展示相關(guān)的性能改進(jìn)優(yōu)勢。 將這個 Flask-pyscopg2 應(yīng)用程序升級到 Quart-asyncpg
    的頭像 發(fā)表于 11-01 16:23 ?623次閱讀
    Flask如何升級到 Quart <b class='flag-5'>應(yīng)用程序</b>