0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA GPU并行計(jì)算技術(shù)解決AI研究問題

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Solee Moon ? 2022-04-19 16:44 ? 次閱讀

由于冠狀病毒的存在, 2021 年韓國科學(xué)技術(shù)信息研究所( KISTI ) GPU 黑客大賽在 KISTI NVIDIA 和 OpenACC 組織的專家導(dǎo)師指導(dǎo)下舉行。為了激發(fā)科學(xué)家加速 AI 研究或 HPC 代碼的可能性, hackathon 提供了利用 NVIDIA GPU并行計(jì)算技術(shù)解決研究問題和擴(kuò)展專業(yè)知識(shí)的機(jī)會(huì)。

以面對(duì)面活動(dòng)而聞名的虛擬黑客大會(huì)對(duì)與會(huì)者和主持人都提出了自己的挑戰(zhàn)。新的模式還需要兼顧由三個(gè) HPC 和 AI 團(tuán)隊(duì)、四個(gè)高等教育和研究團(tuán)隊(duì)以及兩個(gè)行業(yè)團(tuán)隊(duì)組成的多樣化團(tuán)隊(duì)。

活動(dòng)團(tuán)隊(duì)發(fā)現(xiàn)以下配方有助于為參與者創(chuàng)造有意義的成功體驗(yàn):

指導(dǎo)

基于他們?cè)谔囟I(lǐng)域或編程語言方面的專業(yè)知識(shí),專門的導(dǎo)師與團(tuán)隊(duì)一起進(jìn)行指導(dǎo),以設(shè)定目標(biāo),并考慮不同的方法。導(dǎo)師們合作解決團(tuán)隊(duì)遇到的問題并排除障礙。每天的導(dǎo)師同步電話讓每個(gè)人都集中精力,朝著實(shí)現(xiàn)目標(biāo)的最佳策略努力。

社交

每個(gè)人都知道,只工作不玩耍實(shí)際上會(huì)阻礙團(tuán)隊(duì)的生產(chǎn)力。 hackathon 為參與者和導(dǎo)師提供了 TGIF 社交時(shí)間會(huì)議。使用 Metaverse Gather 城鎮(zhèn)空間,導(dǎo)師和團(tuán)隊(duì)分享經(jīng)驗(yàn),為電池充電,并建立聯(lián)系,幫助他們?cè)诨顒?dòng)期間繼續(xù)前進(jìn)。

資源和現(xiàn)場研討會(huì)

成功的另一個(gè)重要因素是為與會(huì)者提供專門的培訓(xùn)和資源。例如, NVIDIA 深度學(xué)習(xí)培訓(xùn)中心( DLI )的一位大使和導(dǎo)師介紹了一個(gè)涵蓋 CUDA C / C ++主題的研討會(huì)。其他導(dǎo)師提供了團(tuán)隊(duì)專用的技術(shù)課程,重點(diǎn)是TRT和 NVIDIA Triton 、OpenACC和 NSight 系統(tǒng)的評(píng)測、并行計(jì)算和優(yōu)化。

努力工作是有回報(bào)的

延世大學(xué)的帕斯卡團(tuán)隊(duì)正在開發(fā)一種熱流體解算器,該解算器可以有效地計(jì)算湍流的熱運(yùn)動(dòng)。在這次黑客大會(huì)上,團(tuán)隊(duì)通過 OpenACC 和 cuFFT 庫將基于 CPU 的現(xiàn)有代碼轉(zhuǎn)換為多 GPU 環(huán)境。這使得最耗時(shí)的子程序之一的計(jì)算速度加快了 4 . 84 倍 RHS (右側(cè),分步)。

來自 AmorePacific 化妝品公司的 Amore Opt 團(tuán)隊(duì)致力于 GPU 優(yōu)化 DeepLabV3 +細(xì)分模型。通過應(yīng)用他們對(duì) TensorRT 推理優(yōu)化器和 NVIDIA Triton 推理服務(wù)器的了解,他們提高了推理速度,使推理速度提高了 26 倍。他們做到了這一點(diǎn),同時(shí)保持人工智能模型的準(zhǔn)確性,以便為未來的大規(guī)??蛻舴?wù)檢測皮膚問題。

首爾國立大學(xué)的 TFC 團(tuán)隊(duì)參與了一個(gè)項(xiàng)目,以加速基于 CPU 的 Fortran 內(nèi)部流體計(jì)算代碼。通過在 KISTI 使用 NVIDIA GPU s ,團(tuán)隊(duì)加速了耗時(shí)的三對(duì)角矩陣算法( TDMA )用于熱解算器和動(dòng)量解算器,以及快速傅立葉變換( FFT )用于壓力解算器計(jì)算。他們?cè)谝慌_(tái) V100 GPU 上實(shí)現(xiàn)了 11.15 倍的速度。

NVIDIA Inception 成員 Nota 和杭陽大學(xué)合作,通過利用 NVIDIA GPU s 中的張量核進(jìn)行 INT4 量化,優(yōu)化了 Nota 模型壓縮引擎。名為 NOTA-HYU 的團(tuán)隊(duì)學(xué)會(huì)了使用 NVIDIA 分析工具 NSight 系統(tǒng)和 NSight 計(jì)算。然后,他們應(yīng)用 NVIDIA 庫彎刀,通過 CUDA 優(yōu)化,使剩余塊的總體速度提高 1.85 倍。

關(guān)于作者

Solee Moon 是 NVIDIA 高等教育與研究( HER )和 NVIDIA 深度學(xué)習(xí)培訓(xùn)中心( DLI )項(xiàng)目的企業(yè)營銷專家,專注于支持 AI 開發(fā)者社區(qū)的發(fā)展。在 NVIDIA 之前, Solee 曾在三星電子 CTR 擔(dān)任品牌營銷專家,執(zhí)行各種整合營銷傳播活動(dòng)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4816

    瀏覽量

    102635
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5437

    瀏覽量

    120793
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強(qiáng)大的并行計(jì)算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?77次閱讀

    初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI計(jì)算機(jī)視覺技術(shù)變革航海安全系統(tǒng)

    總部位于奧地利林茨的初創(chuàng)公司正在利用 NVIDIA 邊緣 AI計(jì)算機(jī)視覺技術(shù)變革航海安全系統(tǒng),讓每一次出海變得更安全。
    的頭像 發(fā)表于 09-09 09:32 ?392次閱讀

    名單公布!【書籍評(píng)測活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu):大模型算力中心建設(shè)指南

    案例,展示如何針對(duì)機(jī)器學(xué)習(xí)應(yīng)用進(jìn)行需求分析、設(shè)計(jì)與實(shí)現(xiàn)。 無論是高等院校計(jì)算機(jī)與人工智能等相關(guān)專業(yè)的本科生或研究生,還是對(duì)并行計(jì)算技術(shù)、云計(jì)算技術(shù)、高性能存儲(chǔ)及高性能網(wǎng)絡(luò)
    發(fā)表于 08-16 18:33

    ai服務(wù)器是什么架構(gòu)類型

    架構(gòu)的AI服務(wù)器通常具有較高的通用性,可以運(yùn)行各種人工智能算法。但是,CPU架構(gòu)的AI服務(wù)器在處理大規(guī)模并行計(jì)算時(shí),性能可能不如GPU架構(gòu)的AI
    的頭像 發(fā)表于 07-02 09:51 ?770次閱讀

    恒訊科技的GPU云解決方案有什么特點(diǎn)和優(yōu)勢?

    GPU云解決方案通常指的是云服務(wù)提供商提供的、基于圖形處理單元(GPU)的計(jì)算服務(wù)。這些服務(wù)利用GPU
    的頭像 發(fā)表于 06-12 17:24 ?337次閱讀

    助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究

    科學(xué)家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報(bào)、遺傳學(xué)和材料科學(xué)領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?330次閱讀
    助力科學(xué)發(fā)展,<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b>加速HPC<b class='flag-5'>研究</b>

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    Blackwell Tensor Core GPU 與1個(gè) NVIDIA Grace CPU 連接,實(shí)現(xiàn)高效的計(jì)算協(xié)同。GB200 NVL72 同時(shí)集成尖端功能和第二代 Transformer 引擎,
    發(fā)表于 05-13 17:16

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱
    的頭像 發(fā)表于 04-20 09:39 ?571次閱讀

    NVLink技術(shù)GPUGPU的通信

    在多 GPU 系統(tǒng)內(nèi)部,GPU 間通信的帶寬通常在數(shù)百GB/s以上,PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉(zhuǎn)換會(huì)產(chǎn)生較大延時(shí),影響GPU并行計(jì)算的效率和性能。
    發(fā)表于 03-27 09:40 ?3214次閱讀
    NVLink<b class='flag-5'>技術(shù)</b>之<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>的通信

    NVIDIA cuPQC幫助開發(fā)適用于量子計(jì)算時(shí)代的加密技術(shù)

    NVIDIA cuPQC 可為相關(guān)開發(fā)者提供加速計(jì)算支持,幫助開發(fā)適用于量子計(jì)算時(shí)代的加密技術(shù)。cuPQC 庫可利用
    的頭像 發(fā)表于 03-22 09:53 ?354次閱讀

    NVIDIA 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級(jí) GPU 計(jì)算AI 基礎(chǔ)設(shè)施

    NVIDIA 軟件實(shí)現(xiàn)了跨 ?Blackwell GPU、新交換機(jī)和 BlueField-3 SuperNIC 的分布式計(jì)算,大幅提升了 AI、數(shù)據(jù)處理、高性能
    發(fā)表于 03-19 10:05 ?292次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級(jí) <b class='flag-5'>GPU</b> <b class='flag-5'>計(jì)算</b>和 <b class='flag-5'>AI</b> 基礎(chǔ)設(shè)施

    NVIDIA 人工智能開講 | 什么是 AI For Science?詳解 AI 助力科學(xué)研究領(lǐng)域的新突破

    ”兩大音頻 APP上搜索“ NVIDIA 人工智能開講 ”專輯,眾多技術(shù)大咖帶你深度剖析核心技術(shù),把脈未來科技發(fā)展方向! AI For Science (亦稱 “
    的頭像 發(fā)表于 12-25 18:30 ?884次閱讀
    <b class='flag-5'>NVIDIA</b> 人工智能開講 | 什么是 <b class='flag-5'>AI</b> For Science?詳解 <b class='flag-5'>AI</b> 助力科學(xué)<b class='flag-5'>研究</b>領(lǐng)域的新突破

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別

     相比于傳統(tǒng)的CPU服務(wù)器,GPU服務(wù)器支持同時(shí)計(jì)算大量相似的計(jì)算操作,可以實(shí)現(xiàn)更強(qiáng)的并行計(jì)算性能。GPU服務(wù)器通常配備多個(gè)高性能的
    的頭像 發(fā)表于 12-02 17:20 ?1794次閱讀

    創(chuàng)新企業(yè)云福利:騰訊云 × NVIDIA 初創(chuàng)加速計(jì)劃

    x NVIDIA 初創(chuàng)加速計(jì)劃 助您降低產(chǎn)品使用門檻 高性能計(jì)算集 群?HCC 以高性能云服務(wù)器為節(jié)點(diǎn),通過 RDMA 互聯(lián),大幅提升網(wǎng)絡(luò)性能,提供高帶寬和極低延遲的網(wǎng)絡(luò)服務(wù),能滿足大規(guī)模高性能計(jì)算、人工智能、大數(shù)據(jù)推薦等應(yīng)用
    的頭像 發(fā)表于 11-13 20:40 ?519次閱讀
    創(chuàng)新企業(yè)云福利:騰訊云 × <b class='flag-5'>NVIDIA</b> 初創(chuàng)加速計(jì)劃

    NVIDIA 校招 | 基礎(chǔ)設(shè)施部門正在熱招!

    認(rèn)識(shí)我們 1999 年,NVIDIA ?發(fā)明了 GPU,這極大地推動(dòng)了 PC ?游戲市場的發(fā)展,重新定義了現(xiàn)代計(jì)算機(jī)圖形技術(shù),并徹底改變了并行計(jì)算
    的頭像 發(fā)表于 10-26 09:05 ?407次閱讀
    <b class='flag-5'>NVIDIA</b> 校招 | 基礎(chǔ)設(shè)施部門正在熱招!