0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦黃氏定律:NVIDIA 首席科學(xué)家 Bill Dally 介紹推動(dòng) GPU 性能提升的關(guān)鍵因素

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-10-12 19:55 ? 次閱讀

在近期舉行的處理器和系統(tǒng)工程師年度盛會(huì)Hot Chips上,NVIDIA 首席科學(xué)家 Bill Dally 發(fā)表了主題演講。在演講中,其描述了后摩爾定律時(shí)代計(jì)算機(jī)性能正在發(fā)生結(jié)構(gòu)性的變化。

點(diǎn)擊觀看 Bill Dally 在 Hot Chips 主題演講完整視頻

他表示,每一款新處理器都具備獨(dú)創(chuàng)性,需要經(jīng)過(guò)不懈的努力,發(fā)明并驗(yàn)證新的電子元件。這與上一代產(chǎn)品的開(kāi)發(fā)截然不同,當(dāng)時(shí)的工程師主要依賴于芯片更小、更快的物理特性。

Dally 在 NVIDIA Research 領(lǐng)導(dǎo)著一支 300 多人的團(tuán)隊(duì),過(guò)去十年間他們將單個(gè) GPUAI 推理性能提高了 1000 倍(詳見(jiàn)下圖)。

wKgaomUt2zaAUzc7AADX7XjyyqQ650.jpg

IEEE Spectrum 最先以 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛的名字將這一驚人的性能提升命名為 "黃氏定律(Huang’s Law) ",后來(lái)《華爾街日?qǐng)?bào)》的一篇專欄文章又讓該定律廣為流傳。

這樣的飆升速度是對(duì)以同樣驚人的速度崛起的大語(yǔ)言模型的回應(yīng),該模型用于生成式 AI,并且每年都以數(shù)量級(jí)的速度增長(zhǎng)。

Dally 說(shuō):"這為硬件行業(yè)的發(fā)展設(shè)定了步調(diào),因?yàn)槲覀儽仨殱M足這種需求。”

在演講中,Dally 詳細(xì)介紹了推動(dòng)性能提升 1000 倍的要素。

其中,提升幅度最大的一次達(dá)到了 16 倍,這源于人們找到了更簡(jiǎn)單的方法來(lái)表示計(jì)算機(jī)運(yùn)算使用的數(shù)字。

新的運(yùn)算方法

最新NVIDIA Hopper 架構(gòu)及其 Transformer 引擎采用 8 位和 16 位浮點(diǎn)與整數(shù)運(yùn)算的動(dòng)態(tài)組合。這種運(yùn)算方法專為滿足當(dāng)今生成式 AI 模型的需求而量身定制。Dally 詳細(xì)介紹了該運(yùn)算方法帶來(lái)的性能提升和節(jié)能效果。

Dally 領(lǐng)導(dǎo)的團(tuán)隊(duì)通過(guò)編寫高級(jí)指令,指導(dǎo) GPU 組織工作,實(shí)現(xiàn)了 12.5 倍的性能提升。這些復(fù)雜的指令有助于以更低的能耗做更多的工作。

因此,計(jì)算機(jī)就可以像“專用加速器一樣高效,同時(shí)保留 GPU 的所有可編程性”,Dally 介紹道。

此外,NVIDIA Ampere 架構(gòu)還增加了結(jié)構(gòu)化稀疏功能,這種創(chuàng)新方法可以在不影響模型精度的前提下簡(jiǎn)化了 AI 模型的權(quán)重。Dally 表示,這項(xiàng)技術(shù)將性能提高了兩倍,并且未來(lái)有望實(shí)現(xiàn)更大的性能提升。

Dally 還介紹了可實(shí)現(xiàn) GPU 之間高速互聯(lián)的 NVLink 以及用于系統(tǒng)間的 NVIDIA 網(wǎng)絡(luò)如何使單個(gè) GPU 的性能提高 1000 倍。

進(jìn)步之路不止步

Dally 指出,盡管 NVIDIA 在過(guò)去十年里將 GPU 的半導(dǎo)體節(jié)點(diǎn)從 28 納米推進(jìn)到 5 納米,但這種技術(shù)僅僅貢獻(xiàn)了性能提升總量的 2.5 倍。

與摩爾定律下的前一代計(jì)算機(jī)設(shè)計(jì)相比,這是巨大的轉(zhuǎn)變。摩爾定律認(rèn)為,隨著芯片變得越來(lái)越小、越來(lái)越快,處理器的性能每隔兩年翻一倍。

登納德縮放比例定律(Dennard scaling)在某種程度上對(duì)此進(jìn)行了描述。該定律由 IBM 科學(xué)家 Robert Denard 在 1974 年與人合著的一篇論文中提出。但遺憾的是,物理微縮遇到了自然限制,例如更小、更快的器件所能承受的熱量。

前景樂(lè)觀

Dally 表示,盡管摩爾定律提出的性能提升在放緩,但黃氏定律仍將繼續(xù)存在,他對(duì)此充滿信心。

例如,他概括介紹了未來(lái)的幾個(gè)機(jī)會(huì),包括進(jìn)一步簡(jiǎn)化數(shù)字表示方式、在 AI 模型中創(chuàng)建更多稀疏性以及設(shè)計(jì)更優(yōu)的內(nèi)存和通信電路。

因?yàn)槊恳淮碌男酒拖到y(tǒng)都需要新的創(chuàng)新,所以這是屬于計(jì)算機(jī)工程師的美好時(shí)代,Dally 補(bǔ)充說(shuō)。

Dally 相信,計(jì)算機(jī)設(shè)計(jì)領(lǐng)域的新動(dòng)態(tài)為 NVIDIA 工程師們提供了他們最渴望的三個(gè)機(jī)會(huì):成為致勝團(tuán)隊(duì)的一員、與聰明人共事以及從事有影響力的設(shè)計(jì)。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開(kāi)放。點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,關(guān)注更多會(huì)議及活動(dòng)信息

wKgaomUt2zaAC-fDAAFtccdApf0108.jpg


原文標(biāo)題:聚焦黃氏定律:NVIDIA 首席科學(xué)家 Bill Dally 介紹推動(dòng) GPU 性能提升的關(guān)鍵因素

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3680

    瀏覽量

    90478

原文標(biāo)題:聚焦黃氏定律:NVIDIA 首席科學(xué)家 Bill Dally 介紹推動(dòng) GPU 性能提升的關(guān)鍵因素

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    了傳統(tǒng)學(xué)科界限,使得科學(xué)家們能夠從更加全面和深入的角度理解生命的奧秘。同時(shí),AI技術(shù)的引入也催生了一種全新的科學(xué)研究范式,即數(shù)據(jù)驅(qū)動(dòng)的研究范式,這種范式強(qiáng)調(diào)從大量數(shù)據(jù)中提取有價(jià)值的信息,從而推動(dòng)
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    的效率,還為科學(xué)研究提供了前所未有的洞察力和精確度。例如,在生物學(xué)領(lǐng)域,AI能夠幫助科學(xué)家快速識(shí)別基因序列中的關(guān)鍵變異,加速新藥研發(fā)進(jìn)程。 2. 跨學(xué)科融合的新范式 書(shū)中強(qiáng)調(diào),人工智能的應(yīng)用促進(jìn)了多個(gè)
    發(fā)表于 10-14 09:12

    硅谷VPS優(yōu)勢(shì)及關(guān)鍵因素

    硅谷VPS是一個(gè)虛擬專用服務(wù)器(VPS)的集群,它位于美國(guó)硅谷,為各類在線業(yè)務(wù)和科技企業(yè)提供了強(qiáng)大的計(jì)算能力和穩(wěn)定的網(wǎng)絡(luò)連接。Rak部落為您整理發(fā)布硅谷VPS優(yōu)勢(shì)及關(guān)鍵因素。
    的頭像 發(fā)表于 08-09 11:46 ?142次閱讀

    前OpenAI首席科學(xué)家創(chuàng)辦新的AI公司

    消息在業(yè)界引起了廣泛關(guān)注,因?yàn)樘K茨克維曾是OpenAI的聯(lián)合創(chuàng)始人及首席科學(xué)家,并在去年在OpenAI董事會(huì)上扮演了重要角色。
    的頭像 發(fā)表于 06-21 10:42 ?461次閱讀

    助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究

    科學(xué)家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報(bào)、遺傳學(xué)和材料科學(xué)領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?328次閱讀
    助力<b class='flag-5'>科學(xué)</b>發(fā)展,<b class='flag-5'>NVIDIA</b> AI加速HPC研究

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?569次閱讀

    深入了解影響ZR執(zhí)行器性能關(guān)鍵因素

    深入了解影響ZR執(zhí)行器性能關(guān)鍵因素-速程精密 在工業(yè)自動(dòng)化領(lǐng)域,ZR執(zhí)行器作為關(guān)鍵的終端設(shè)備,其性能的穩(wěn)定性對(duì)于整個(gè)自動(dòng)化系統(tǒng)的運(yùn)行至關(guān)重要。了解影響ZR執(zhí)行器
    的頭像 發(fā)表于 03-20 15:04 ?461次閱讀
    深入了解影響ZR執(zhí)行器<b class='flag-5'>性能</b>的<b class='flag-5'>關(guān)鍵因素</b>

    NVIDIA首席科學(xué)家Bill Dally:深度學(xué)習(xí)硬件趨勢(shì)

    Bill Dally于2009年1月加入NVIDIA擔(dān)任首席科學(xué)家,此前在斯坦福大學(xué)任職12年,擔(dān)任計(jì)算機(jī)
    的頭像 發(fā)表于 02-25 16:16 ?958次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>首席</b><b class='flag-5'>科學(xué)家</b><b class='flag-5'>Bill</b> <b class='flag-5'>Dally</b>:深度學(xué)習(xí)硬件趨勢(shì)

    飛騰首席科學(xué)家竇強(qiáng)榮獲 “國(guó)家卓越工程師” 稱號(hào)

    ? ? ?飛騰首席科學(xué)家竇強(qiáng)榮獲 “國(guó)家卓越工程師” 稱號(hào) 1月19日上午,首屆 “國(guó)家工程師獎(jiǎng)” 表彰大會(huì)在北京人民大會(huì)堂隆重舉行。81 名個(gè)人被授予 “國(guó)家卓越工程師” 稱號(hào),50 個(gè)團(tuán)隊(duì)被授予
    的頭像 發(fā)表于 01-19 19:22 ?1524次閱讀
    飛騰<b class='flag-5'>首席</b><b class='flag-5'>科學(xué)家</b>竇強(qiáng)榮獲 “國(guó)家卓越工程師” 稱號(hào)

    pcb板彎曲的7個(gè)關(guān)鍵因素

    pcb板彎曲的7個(gè)關(guān)鍵因素
    的頭像 發(fā)表于 12-27 10:16 ?911次閱讀

    選擇處理器的幾個(gè)關(guān)鍵因素

    選擇處理器的幾個(gè)關(guān)鍵因素? 選擇處理器時(shí),有幾個(gè)關(guān)鍵因素需要考慮。這些因素包括處理器的性能、功耗、價(jià)格、架構(gòu)和生產(chǎn)工藝。 首先,性能是選擇處
    的頭像 發(fā)表于 12-15 09:43 ?668次閱讀

    影響電池包氣密性的關(guān)鍵因素及改善要點(diǎn)

    影響電池包氣密性的關(guān)鍵因素及改善要點(diǎn)? 電池包的氣密性是電動(dòng)汽車及其他動(dòng)力電池應(yīng)用中非常重要的性能指標(biāo)之一。松散或缺乏氣密性的電池包會(huì)導(dǎo)致電池失效、安全隱患以及能量損失。本文將詳細(xì)介紹影響電池包
    的頭像 發(fā)表于 12-08 16:05 ?680次閱讀

    降低UPS電源總故障率的關(guān)鍵因素

    電子發(fā)燒友網(wǎng)站提供《降低UPS電源總故障率的關(guān)鍵因素.doc》資料免費(fèi)下載
    發(fā)表于 11-15 10:06 ?0次下載
    降低UPS電源總故障率的<b class='flag-5'>關(guān)鍵因素</b>

    Open AI首席科學(xué)家:ChatGPT可能已經(jīng)有了意識(shí),AI將萬(wàn)世不朽

    我是來(lái)和OpenAI的聯(lián)合創(chuàng)始人兼首席科學(xué)家Sutskever會(huì)面的,他的公司位于舊金山傳教區(qū)一條不起眼的街道上,辦公樓沒(méi)有任何標(biāo)志,我想聽(tīng)聽(tīng)他一手打造的這項(xiàng)顛覆世界的技術(shù)的下一步計(jì)劃。我還想知道他的下一步計(jì)劃,尤其是,為什么建立他公司的下一代旗艦生成模型不再是他的工作重
    的頭像 發(fā)表于 11-02 15:58 ?702次閱讀

    英偉達(dá)計(jì)劃芯片設(shè)計(jì)過(guò)程中使用聊天機(jī)器人

    據(jù)英偉達(dá)首席科學(xué)家Bill Dally介紹,“我們發(fā)現(xiàn)許多資深設(shè)計(jì)師花費(fèi)了大量的時(shí)間來(lái)回答初級(jí)設(shè)計(jì)師的問(wèn)題。利用聊天機(jī)器人回答初級(jí)設(shè)計(jì)問(wèn)題可
    的頭像 發(fā)表于 10-31 17:16 ?915次閱讀