0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達GPU有史以來最大性能飛躍!加速計算更加無所不在!

張慧娟 ? 來源:電子發(fā)燒友網 ? 作者:張慧娟 ? 2020-05-15 00:38 ? 次閱讀

疫情所致,英偉達今年的GTC(GPU Technology Conference)改為線上舉辦,日期也由原來的3月下旬推遲到5月中旬。于是,就有了北京時間5月14日晚,英偉達創(chuàng)始人兼CEO黃仁勛人生中首次的“Kitchen Keynote”。嗯,或許這篇也可以取名為《疫情當前,GPU大佬廚房帶貨忙》。

當然,姍姍來遲的GTC并沒有讓人失望,豪橫的硬菜有:全球最大的7nm處理器 A100 GPU、可用于對抗COVID-19的最新AI系統(tǒng)DGX A100、收購Mellanox以來的首個成果SmartNIC,這些創(chuàng)新直接彰顯了這位GPU霸主對于未來數(shù)據(jù)中心的理解,以及堅決捍衛(wèi)既有地位的決心。同時,還有對于邊緣市場、自動駕駛、醫(yī)療、AI機器人、對話式AI等領域的無限擴張。

第八代GPU A100成全球最大7nm處理器,堪稱英偉達史上最大性能飛躍

過去的一年內,英偉達的第八代GPU曾引發(fā)了業(yè)界的諸多猜測。也正如他早先放風出來“你不會失望的”,這款基于英偉達Ampere架構的NVIDIA A100,將AI訓練和推理性能提高20倍,可以說是英偉達GPU迄今為止最大的性能飛躍。作為一款通用型工作負載加速器,A100還被設計用于數(shù)據(jù)分析、科學計算和云圖形。

云計算和AI的強大趨勢正在推動數(shù)據(jù)中心設計的結構性轉變,高效的加速計算基礎架構正在取代傳統(tǒng)的服務器架構。黃仁勛對A100 GPU寄予厚望,認為它“作為一個端到端的機器學習加速器,有史以來首次在一個平臺上實現(xiàn)橫向擴展以及縱向擴展的負載的加速。在提高吞吐量的同時,能夠降低數(shù)據(jù)中心的成本。”

A100 GPU的突破來源于五大關鍵性創(chuàng)新:

NVIDIA Ampere架構:這是A100的核心,該架構包含超過540億個晶體管,這使其成為全球最大的7nm處理器;

具有TF32的第三代TensorCore核心:TensorCore被英偉達廣泛采用,現(xiàn)在變得更加靈活且易于使用,使FP32精度下的AI性能提高多達20倍。此外,TensorCore核心現(xiàn)在支持FP64精度,相比前代,它為HPC應用所提供的算力提高了2.5倍。

多實例GPU: MIG,這是一種全新的技術功能,可將單個A100 GPU分割為七個獨立的GPU,為不同規(guī)模的工作提供不同的算力,將利用率和效率最大化。

第三代NVIDIA NVLink:使GPU之間的高速聯(lián)結增加至原來的兩倍,實現(xiàn)服務器的高效擴展。

結構化稀疏:這種全新的效率技術利用AI數(shù)學固有的稀疏性,使性能提升了一倍。

憑借這些新功能,A100可成為AI訓練和推理以及科學模擬、對話式AI、推薦系統(tǒng)、基因組學、高性能數(shù)據(jù)分析、地震建模和金融預測等各種高要求工作負載的理想選擇。

據(jù)了解,A100已全面投產并已向全球客戶交付。眾多全球云服務供應商和系統(tǒng)構建商計劃將A100 GPU集成到其產品中,其中包括:阿里云、AWS、百度智能云、思科、Dell Technologies、富士通、Google Cloud、新華三、HPE、浪潮、聯(lián)想、Microsoft Azure、甲骨文、騰訊云等等。

新系統(tǒng)已搭載A100,首批訂單用于對抗COVID-19

同時發(fā)布的還有NVIDIA DGX A100系統(tǒng),內置8個由NVLink 互聯(lián)的A100 GPU,具有5Petaflops的AI性能。利用AI00的多實例GPU功能,每臺DGX A100能夠被分割為56個實例,用于加速多個小型工作負載的處理速度。憑借這些功能,用戶可在一個完全集成的軟件定義平臺上根據(jù)自身需求優(yōu)化算力和資源,加快數(shù)據(jù)分析、訓練和推理等各種工作負載的速度。

針對端到端的機器學習工作流,從數(shù)據(jù)分析到訓練再到推理構建的AI系統(tǒng),DGX A100提供的性能,能夠幫助機器學習工程師應對指數(shù)級增長的AI模型和數(shù)據(jù)。

據(jù)了解,多家全球大型企業(yè)、服務供應商和政府機構以及訂購了前幾批DGX A100。首批系統(tǒng)已于本月早些時候交付給了美國能源部(U.S. Department of Energy, DOE)的阿貢國家實驗室(Argonne National Laboratory),該實驗室將運用該集群的AI和算力來更好地研究和應對COVID-19。

阿貢國家實驗室計算機、環(huán)境和生命科學實驗室副主任Rick Stevens表示,全新DGX A100提供的算力,將幫助研究人員探索治療方法和研發(fā)疫苗、研究病毒的傳播方式,使科學家能夠利用AI加速工作,在數(shù)月甚至數(shù)日內完成以前需要數(shù)年才能完成的工作。

英偉達還展示了由140臺DGX A100系統(tǒng)組成的DGX SuperPOD AI超級計算機,用于公司內部對話式AI、基因組學和自動駕駛等領域的研究。該集群是全球速度最快的AI超級計算機之一,其性能相當于此前數(shù)千臺服務器的性能,AI計算能力高達700 Petaflops。

面向新一代數(shù)據(jù)中心的安全加速智能網卡

根據(jù)市場研究機構Dell’Oro的數(shù)據(jù)顯示,預計到2024年,智能網卡(SmartNIC)市場規(guī)模將超過6億美元,占全球以太網適配器市場的23%。而整體控制器和適配器市場將以7%的年復合增長率增長,其中25Gbps和100Gbps的銷售將是主要增長驅動力。

英偉達顯然早已看到這一巨大的機會,收購Mellanox以來首個發(fā)布就是25G安全智能網卡(SmartNIC)。據(jù)了解,全新發(fā)布的ConnectX-6 Lx SmartNIC就是面向新一代解耦式的、可重組的數(shù)據(jù)中心的經濟高效、可加速應用的和安全的智能網卡,是ConnectX系列網卡的第11代產品。

這款產品專為滿足現(xiàn)代化數(shù)據(jù)中心的需求而設計,在這個市場,25Gb/s網絡已成為各種主流應用的標準,例如企業(yè)級應用、AI和實時分析等。這款全新的SmartNIC充分利用了軟件定義和硬件加速等先進技術,將更多的安全和網絡處理工作從CPU卸載到網卡上來。

就在今年3月份,賽靈思推出了一體化SmartNIC Alveo U25,通過將SmartNIC平臺與FPGA引擎相結合,實現(xiàn)全可編程與一站式加速應用。賽靈思的這款產品賣點之一就是實現(xiàn)了網絡、存儲、計算加速能力的全集成。

而英偉達的這款ConnectX-6 Lx更強調的是安全加速功能。包括IPsec在線加密和硬件信任根(Hardware Root of Trust),可提升10倍性能的連接追蹤(Connection Tracking)功能等,實現(xiàn)了整個數(shù)據(jù)中心的在零信任下的安全保障(Zero Trust security)。RoCE(RDMA over converged Ethernet)技術、虛擬化和容器化技術,以及NVMe over Fabrics存儲卸載技術等,都成為高性能可擴展網絡的保障。

SmartNIC正在成為加速計算的下一個必爭之地。

云原生技術支持的EGX邊緣AI平臺

巨大的邊緣計算市場自然也是英偉達的重點。

本次發(fā)布的兩款EGX邊緣AI 平臺產品分別是:適用于較大型商業(yè)通用服務器上的 EGX A100聚合加速器,和適用于微型邊緣服務器的微型EGX Jetson Xavier NX。這兩款產品能夠在邊緣提供安全、高性能的AI處理能力。

EGX A100是首個基于NVIDIA Ampere架構的邊緣AI產品,結合了NVIDIA Ampere架構所具有的突破性計算性能與ConnectX-6 Dx SmartNIC所具備的網絡加速和關鍵性安全功能,能將標準型和專用型的邊緣服務器轉變?yōu)榘踩脑圃鶤I超級計算機。隨著AI日益向邊緣發(fā)展,企業(yè)機構可將EGX A100添加到其服務器中,從而實時處理和保護來自邊緣傳感器的海量流式數(shù)據(jù)。

EGX Jetson Xavier NX則號稱是全球體積最小、性能最強大的AI超級計算機,適用于微型服務器和邊緣智能物聯(lián)網盒。目前,生態(tài)圈內的合作伙伴已提供了超過20種解決方案。該產品將NVIDIA Xavier SoC的性能整合到了一個信用卡大小的模塊中。運行EGX云原生軟件堆棧的EGX Jetson Xavier NX可以快速處理來自多個高分辨率傳感器的流式數(shù)據(jù)。

這兩款產品可滿足不同尺寸、成本和性能方面的需求。例如搭載了EGX A100的服務器可以管理機場中的數(shù)百臺攝像頭,而EGX Jetson Xavier NX則可用于管理便利店中的少量攝像頭。但是,云原生技術支持能夠確保整個EGX產品家族都可以使用同一經過優(yōu)化的AI軟件構建和部署AI應用。

黃仁勛表示:“物聯(lián)網和AI的融合已開啟了“萬物智能”革命。就像手機行業(yè)通過智能手機為用戶提供智能服務一樣,大型行業(yè)現(xiàn)在也可以為用戶提供智能互聯(lián)的產品和服務。EGX邊緣AI平臺能夠將標準服務器轉變?yōu)橐粋€小型的云原生、安全型AI數(shù)據(jù)中心。借助于我們的AI應用框架,企業(yè)可以構建從智能零售到機器人工廠再到自動化呼叫中心等各類AI服務?!?

結語

英偉達1999年發(fā)明GPU后激發(fā)了PC游戲市場的增長,重新定義了現(xiàn)代計算機顯卡,并且對并行計算進行了革新。加速計算迅猛發(fā)展的25年,也是計算架構、計算系統(tǒng)與軟件堆棧風馳電掣般演進的25年。

以GPU深度學習為代表的技術已經點燃了全新的計算時代——現(xiàn)代人工智能,同時也帶動了CUDA軟件生態(tài)的繁榮和開發(fā)者數(shù)量的迅猛增長。

世界總在前行中,科技也在不斷創(chuàng)新。但科技總是為了讓生活更美好,正如黃仁勛在今年的Keynote中首先致敬疫情期間堅守在各自工作崗位的普通人,平凡背后蘊藏的巨大能量。黃仁勛仍在挖掘GPU背后的強大潛力。



本文由電子發(fā)燒友網原創(chuàng),未經授權禁止轉載。如需轉載,請?zhí)砑游?a target="_blank">信號elecfans999.

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4640

    瀏覽量

    128487
  • AI2020
    +關注

    關注

    1

    文章

    22

    瀏覽量

    5924
收藏 人收藏

    評論

    相關推薦

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強大并行計算能力來加速科學
    的頭像 發(fā)表于 10-25 09:23 ?90次閱讀

    英偉Blackwell GPU量產加速,Q4營收沖刺百億美元大關

    近日,全球領先的圖形處理單元(GPU)及人工智能芯片制造商英偉傳來重大利好消息。據(jù)摩根士丹利最新發(fā)布的行業(yè)分析報告指出,英偉基于Blac
    的頭像 發(fā)表于 09-26 15:58 ?236次閱讀

    挑戰(zhàn)英偉:聚焦本土GPU領軍企業(yè)崛起

    近年來,美國對中國半導體行業(yè)的制裁舉措,無疑加速了中國在本土芯片產業(yè)上的自主發(fā)展步伐,特別是隨著人工智能和基礎模型技術的蓬勃興起,更加堅定了中國在全球芯片領域扮演領導角色的決心。   面對英偉
    的頭像 發(fā)表于 09-18 15:24 ?567次閱讀

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    打破英偉CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA了

    電子發(fā)燒友網報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉GPU領域最大的護城河,尤其是隨著目前AI領域的發(fā)展
    的頭像 發(fā)表于 07-19 00:16 ?4369次閱讀

    英國公司實現(xiàn)英偉CUDA軟件在AMD GPU上的無縫運行

    7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現(xiàn)了英偉CUDA軟件在AMD GPU上的無縫遷移與運行,標志著在
    的頭像 發(fā)表于 07-18 14:40 ?541次閱讀

    英偉GPU新品規(guī)劃與HBM市場展望

    在COMPUTEX 2024主題演講中,英偉(NVIDIA)公布了其GPU產品的未來規(guī)劃。據(jù)英偉透露,B100、B200和GB200系列
    的頭像 發(fā)表于 06-13 09:44 ?698次閱讀

    進一步解讀英偉 Blackwell 架構、NVlink及GB200 超級芯片

    計算工作負載、釋放百億億次計算能力和萬億參數(shù)人工智能模型的全部潛力提供關鍵基礎。 NVLink釋放數(shù)萬億參數(shù)AI模型的加速性能,顯著提升大型多GPU
    發(fā)表于 05-13 17:16

    英偉、AMD、英特爾GPU產品及優(yōu)勢匯總

    電子發(fā)燒友網報道(文/李彎彎)隨著人工智能技術的快速發(fā)展,GPU的市場規(guī)模在全球范圍內持續(xù)提升。目前,GPU市場主要由英偉、AMD和英特爾等幾家大公司主導。其中,
    的頭像 發(fā)表于 05-10 00:59 ?4538次閱讀

    國內GPU新勢力:能否成為英偉的“終結者”?

    在當今的信息技術時代,圖形處理器(GPU)和人工智能(AI)加速卡在計算領域中扮演著至關重要的角色。英偉(NVIDIA),作為全球
    的頭像 發(fā)表于 04-24 11:07 ?388次閱讀
    國內<b class='flag-5'>GPU</b>新勢力:能否成為<b class='flag-5'>英偉</b><b class='flag-5'>達</b>的“終結者”?

    英偉發(fā)布性能大幅提升的新款B200 AI GPU

    英偉宣稱,B200在性能上比以往最好的GPU快30倍不止。由它構成的服務器集群相比上一代,運算能力飛躍性提升,甚至能使大語言模型的訓練速度
    的頭像 發(fā)表于 03-20 09:37 ?678次閱讀

    英偉H200性能怎么樣

    英偉H200性能卓越,集成了高性能CPU和GPU,通過高速NVLink連接,消除了傳統(tǒng)計算瓶頸
    的頭像 發(fā)表于 03-07 16:39 ?878次閱讀

    盤點英偉24年來最差的五款GPU

    英偉GPU也可能失敗。
    的頭像 發(fā)表于 01-04 17:06 ?1492次閱讀

    英偉用AI設計GPU算術電路有何優(yōu)勢

    大量的算術電路陣列為英偉GPU提供了動力,以實現(xiàn)前所未有的AI、高性能計算計算機圖形
    發(fā)表于 12-05 11:05 ?372次閱讀

    探秘英偉顯卡的制造之路 | 英偉斷供GPU,中國大模型何去何從?

    在當今時代,人工智能技術正以前所未有的速度發(fā)展,推動著各個領域的創(chuàng)新與變革。作為人工智能技術的核心引擎之一,高性能GPU扮演著至關重要的角色。在這個領域,英偉的H100無疑是一款備受
    的頭像 發(fā)表于 11-03 11:23 ?1110次閱讀
    探秘<b class='flag-5'>英偉</b><b class='flag-5'>達</b>顯卡的制造之路 | <b class='flag-5'>英偉</b><b class='flag-5'>達</b>斷供<b class='flag-5'>GPU</b>,中國大模型何去何從?