0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Nvidia發(fā)布世界最大GPU

mK5P_AItists ? 來源:未知 ? 作者:鄧佳佳 ? 2018-03-31 09:12 ? 次閱讀

日前,英偉達GTC 2018(GPU Technology Conference 2018,以下簡稱GTC)在美國圣何塞舉行。英偉達再一次在提升計算力的路上越走越遠。GPU產(chǎn)品依然是主旋律,Tesla V100系列、DGX系列和Quadro GPU系列都進行了更新。

新產(chǎn)品—全世界最大的GPU只要399

全新Tesla V100顯存將從原來的16GB提升至32GB。2017年5月11日,英偉達正式發(fā)布了全新Volta架構GPU——NVIDIA Tesla V100,它擁有超過210億個晶體管,是上代TeslaP100的1.37倍。它的單精度浮點性能高達15 TFLOPS,雙精度浮點7.5 TFLOPS。

基于此前的NVIDIA NVLink架構,英偉達還推出了全新的NVSwitch架構。這一互聯(lián)架構的帶寬比PCle交換機高5倍,足以支持更大規(guī)模和復雜的數(shù)據(jù)集運算,讓開發(fā)者和科學家可以構建更高級的系統(tǒng)。

基于Tesla V100的升級和全新的NVSwitch架構,英偉達將DGX 2的性能較前一代產(chǎn)品有大幅度提升。

在2016年的GTC上英偉達正式發(fā)布DGX 1,它擁有8顆帕斯卡架構GP100核心的Tesla P100 GPU,以及7TB的SSD,由兩顆16核心的Xeon E5-2698v3以及512GB的DDR4內(nèi)存驅(qū)動。售價為129000美元。2017年9月份,英偉達推出了一款基于Volta架構的DGX 1V,擁有8塊Tesla V100。

而DGX 2應用了最新的NVSwitch架構,通過12個NVSwitch支持16塊全新的Tesla V100共享同一的內(nèi)存空間,總計512 GB HBM2存儲,能實現(xiàn)每秒高達2千萬次的浮點運算。此外,基于NVSwitch架構的應用,16塊GPU可以實現(xiàn)2.4TB/秒的數(shù)據(jù)傳輸能力。

DGX 2內(nèi)含16顆Tesla V100芯片

“這是全球最大的GPU?!?a href="http://srfitnesspt.com/tags/黃仁勛/" target="_blank">黃仁勛表示,他還用“美麗、性感”等詞語來形容這一款最新的DGX系列產(chǎn)品。

DGX 2的售價,黃仁勛首先給出的是150萬美元,最后直接減價為39.9萬美元,將在今年的第三季度正式開放購買。

面向藝術及設計領域,英偉達還推出了搭載了NVIDIA RTX(實時光線追蹤)技術的NVIDIA Quadro GV100 GPU。單塊GPU擁有32GB內(nèi)存,可以基于NVLink技術將兩塊GV100 GPU并聯(lián),從而將內(nèi)存提升至64GB。在前一周的游戲開發(fā)者大會上,英偉達正式推出了NVIDIA RTX技術。

GV100 GPU基于最新的Volta架構,可以提供每秒7.4萬億次浮點運算的雙精度性能,每秒14.8萬億次浮點運算的單精度性能,以及每秒118.5萬億次浮點運算的深度學習性能。

黃仁勛手中的GV100 GPU

這款產(chǎn)品主要針對傳媒娛樂從業(yè)者、產(chǎn)品設計師、建筑設計師等專業(yè)設計與流媒體專業(yè)人員。其中,NVIDIA RTX內(nèi)置的NVIDIA OpitX AI-denoiser可以實現(xiàn)實時的AI降噪去噪。

硬件之外,英偉達還發(fā)布了針對軟件的更新——TensorRT 4軟件。這一軟件可用于優(yōu)化、驗證和部署在超大規(guī)模數(shù)據(jù)中心、嵌入式與汽車GPU平臺中經(jīng)過訓練的神經(jīng)網(wǎng)絡。

為了籠絡更多的開發(fā)者,英偉達與谷歌的工程師將TensorRT集成至谷歌的TensorFlow 1.7中。

自動駕駛—暫停自動駕駛研發(fā)

自動駕駛?cè)栽诒敬蜧TC的討論之列

英偉達的自動駕駛平臺可以統(tǒng)稱為Drive PX系列。但是其實,Drive PX只是NVIDIA車載AI平臺的系列名稱。而這個系列目前主要包括兩代產(chǎn)品:已經(jīng)量產(chǎn)的Drive PX 2平臺,以及在2018年初展示的新一代平臺Xavier。

不過黃仁勛卻在GTC 2018上宣布英偉達將暫停自動駕駛的研發(fā)工作,雖然沒有說明何時能再推進這一進程,但是他也表示“不會太久。”

在2018年2月9日對外發(fā)布的2018財年第四季度及全年財報中,英偉達曾經(jīng)提到過與Uber、Aurora合作打造自動駕駛汽車,采用的就是開源的NVIDIA Drive人工智能自動駕駛平臺。

美國當?shù)貢r間3月18日晚上,亞利桑那州一名女子被Uber自動駕駛汽車撞傷,之后不幸身亡。這是全球首例自動駕駛車輛致人死亡的事故,隨后Uber宣布將暫停其在美國和加拿大的自動駕駛項目。隨后在26日,亞利桑那州州長宣布暫禁Uber在亞利桑那州公路測試自駕車。

黃仁勛在回答媒體關于該案件的提問時表示,英偉達對于這個意外感到悲傷,但是自動駕駛的研究本身是沒有錯的,應該從這個案件中吸取經(jīng)驗,提升自動駕駛的安全性。作為Uber在自動駕駛領域的合作方之一,英偉達暫停自動駕駛的研發(fā)可能和Uber的自動駕駛汽車撞人致死案有關,但其并沒有完全放棄自動駕駛項目。

英偉達的DRIVE Constellation仿真系統(tǒng)

英偉達在GTC上推出了針對自動駕駛汽車測試的仿真系統(tǒng)——DRIVE Constellation。

DRIVE Constellation仿真系統(tǒng)是一套使用照片級真實感模擬,基于云的自動駕駛汽車測試系統(tǒng)。它基于兩個不同的服務器,第一臺服務器運行的是DRIVE Sim軟件,可以模擬自動駕駛汽車的傳感器,比如攝像頭、激光雷達和雷達等。

DRIVE Sim軟件可以通過生成照片級的數(shù)據(jù)流,從而創(chuàng)建不同的測試環(huán)境,比如晴天、暴雨、暴雪等不同的天氣狀況、日間和夜間等不同的光線狀況、急轉(zhuǎn)彎或陡坡等不同的路面狀況。并且在模擬過程中設置各種危險和突發(fā)狀況,比如行人突然穿越馬路等,以測試自動駕駛汽車的反應能力,以確定其不會對人帶來安全威脅。

第二臺服務器搭載的是NVIDIA DRIVE Pegasus AI汽車計算平臺,運行完整的自動駕駛汽車軟件堆棧,并能夠處理傳感器搜集模擬數(shù)據(jù)。經(jīng)過處理的數(shù)據(jù)會被反饋給傳感器,一直進行數(shù)據(jù)的循環(huán)。

從時間來看,英偉達推出的這個仿真系統(tǒng)和Uber的自動駕駛汽車撞人致死案并無太大關聯(lián),不過在長遠的未來,它將能有效幫助提升自動駕駛汽車測試的安全性。

新合作—與ARM合作布局IoT

英偉達還宣布與ARM達成了合作,共同為全球數(shù)十億臺IoT設備提供深度學習的能力。雙方將開源的英偉達深度學習加速器整合到ARM的Project Trillium機器學習平臺上。

2018年2月23日,ARM推出了Project Trillium項目,這是一套包括新的高度可擴展處理器的ARM IP組合,這些產(chǎn)品可以提供增強的機器學習(ML)和神經(jīng)網(wǎng)絡(NN)功能。當前的技術產(chǎn)品主要針對移動設備市場,將讓全新的搭載機器學習功能的設備具有先進的計算能力,包括先進的目標檢測功能。

在將英偉達深度學習加速器整合到Project Trillium之后,全球數(shù)十億臺的消費電子設備上的IoT芯片將具備機器學習能力。

GTC之外—計算力提升從創(chuàng)新驅(qū)動變?yōu)樾枨篁?qū)動

提到英偉達和黃仁勛,就不得不提到CPU。在2017年的GTC上,黃仁勛曾聲稱摩爾定律已經(jīng)終結(jié),設計人員無法再創(chuàng)造出可以實現(xiàn)更高指令集并行的GPU架構,晶體管數(shù)量每年增長50%,但CPU的性能每年僅增長10%。

在演講中,黃仁勛沒有放過任何一次揶揄CPU的機會。不管是更新后的Tesla V100、DGX 2,還是最新發(fā)布的GV100 GPU,黃仁勛聲稱“在提供相同的計算力下,它們都比CPU組成的集群要更節(jié)能、高效,占用更少的空間?!?/p>

“買得越多,省得越多?!币呀?jīng)成了他的口頭禪。然而回歸到英偉達本身,其本身的高速增長很大一部分是依賴于市場對圖形芯片的巨大需求。

在英偉達公布的2018財年第四季度財報中,雖然數(shù)據(jù)中心業(yè)務同比實現(xiàn)了一倍多的增長達到6.06億美元。但游戲圖形芯片業(yè)務的營收達17.4億美元,同比增長29%,占該季度總營收的一半以上。

“加密貨幣市場的強勁需求超出了我們的預期?!?英偉達首席財務官科萊特·克雷斯表示,“盡管加密貨幣對我們業(yè)務的總體貢獻仍難以量化,但我們認為,其在營收中所比例高于上一季度。”

從產(chǎn)品本身來說, GPU目前只能是不斷疊加性能,帶來的驚喜越來越少。以DGX系列為例,內(nèi)含的GPU芯片從4顆變成了8顆,今年從8顆增長到了16顆,改變的只不過是互聯(lián)的架構。單顆芯片的算力提升越來越難,英偉達的“橫向發(fā)展”只是另辟蹊徑。

不過,英特爾的Nervana芯片,谷歌的TPU(目前只在谷歌內(nèi)部使用)對于英偉達來說是潛在的競爭對手。有競爭在,更大的驚喜才有可能會到來。

未來智能實驗室是人工智能學家與科學院相關機構聯(lián)合成立的人工智能,互聯(lián)網(wǎng)和腦科學交叉研究機構。

未來智能實驗室的主要工作包括:建立AI智能系統(tǒng)智商評測體系,開展世界人工智能智商評測;開展互聯(lián)網(wǎng)(城市)云腦研究計劃,構建互聯(lián)網(wǎng)(城市)云腦技術和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4818

    瀏覽量

    102655
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4640

    瀏覽量

    128487
  • 人工智能
    +關注

    關注

    1789

    文章

    46401

    瀏覽量

    236650

原文標題:Nvidia黃仁勛發(fā)布了全球最大GPU

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    暴漲預警!NVIDIA GPU供應大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    新款Nvidia Titan GPU正在開發(fā)中?或?qū)魯∥?b class='flag-5'>發(fā)布的RTX 5090

    ABSTRACT摘要最近有消息透露,NVIDIA正在開發(fā)一款名為TITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發(fā)布其RTX40系列
    的頭像 發(fā)表于 07-26 08:26 ?355次閱讀
    新款<b class='flag-5'>Nvidia</b> Titan <b class='flag-5'>GPU</b>正在開發(fā)中?或?qū)魯∥?b class='flag-5'>發(fā)布</b>的RTX 5090

    NVIDIA全面轉(zhuǎn)向開源GPU內(nèi)核模塊

    借助 R515 驅(qū)動程序,NVIDIA 于 2022 年 5 月發(fā)布了一套開源的 Linux GPU 內(nèi)核模塊,該模塊采用雙許可證,即 GPL 和 MIT 許可。初始版本主要面向數(shù)據(jù)中心計算
    的頭像 發(fā)表于 07-25 09:56 ?306次閱讀
    <b class='flag-5'>NVIDIA</b>全面轉(zhuǎn)向開源<b class='flag-5'>GPU</b>內(nèi)核模塊

    NVIDIA推出兩款基于NVIDIA Ampere架構的全新臺式機GPU

    兩款 NVIDIA Ampere 架構 GPU 為工作站帶來實時光線追蹤功能和生成式 AI 工具支持。
    的頭像 發(fā)表于 04-26 11:25 ?528次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?583次閱讀

    RTX 5880 Ada Generation GPU與RTX? A6000 GPU對比

    NVIDIA RTX? 5880 Ada Generation GPU 是目前國內(nèi)重量級 GPU,基于全新 NVIDIA Ada Lovelace 架構構建,采用 4nm 制成工藝,擁
    的頭像 發(fā)表于 04-19 10:20 ?1447次閱讀
    RTX 5880 Ada Generation <b class='flag-5'>GPU</b>與RTX? A6000 <b class='flag-5'>GPU</b>對比

    NVIDIA 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 GPU 計算和 AI 基礎設施

    NVIDIA 軟件實現(xiàn)了跨 ?Blackwell GPU、新交換機和 BlueField-3 SuperNIC 的分布式計算,大幅提升了 AI、數(shù)據(jù)處理、高性能計算和云工作負載的性能 ? ? 美國加利福尼亞州
    發(fā)表于 03-19 10:05 ?297次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>發(fā)布</b>全新交換機,全面優(yōu)化萬億參數(shù)級 <b class='flag-5'>GPU</b> 計算和 AI 基礎設施

    NVIDIA將在今年第二季度發(fā)布Blackwell架構的新一代GPU加速器“B100”

    根據(jù)各方信息和路線圖,NVIDIA預計會在今年第二季度發(fā)布Blackwell架構的新一代GPU加速器“B100”。
    的頭像 發(fā)表于 03-04 09:33 ?1178次閱讀
    <b class='flag-5'>NVIDIA</b>將在今年第二季度<b class='flag-5'>發(fā)布</b>Blackwell架構的新一代<b class='flag-5'>GPU</b>加速器“B100”

    NVIDIA的Maxwell GPU架構功耗不可思議

    整整10年前的2013年2月19日,NVIDIA正式推出了新一代Maxwell GPU架構,它有著極高的能效,出場方式也非常特別。
    的頭像 發(fā)表于 02-19 16:39 ?892次閱讀
    <b class='flag-5'>NVIDIA</b>的Maxwell <b class='flag-5'>GPU</b>架構功耗不可思議

    巨頭豪購35萬塊NVIDIA最強GPU H100

    NVIDIA AI GPU無疑是當下的硬通貨,從科技巨頭到小型企業(yè)都在搶。
    的頭像 發(fā)表于 01-29 09:58 ?960次閱讀
    巨頭豪購35萬塊<b class='flag-5'>NVIDIA</b>最強<b class='flag-5'>GPU</b> H100

    NVIDIA RTX GPU助力打造城市新區(qū)綠化

    世界各地的設計公司如今正在持續(xù)探索如何將先進技術引入工作流程,以提升品質(zhì)和效率。跨國設計公司 SWA 已深耕景觀建筑、規(guī)劃、城市設計領域 65 年,其獨立辦公室 SWA 上海借助 NVIDIA
    的頭像 發(fā)表于 01-18 10:14 ?363次閱讀
    <b class='flag-5'>NVIDIA</b> RTX <b class='flag-5'>GPU</b>助力打造城市新區(qū)綠化

    如何選擇NVIDIA GPU和虛擬化軟件的組合方案呢?

    NVIDIA vGPU 解決方案能夠?qū)?NVIDIA GPU 的強大功能帶入虛擬桌面、應用程序和工作站,加速圖形和計算,使在家辦公或在任何地方工作的創(chuàng)意和技術專業(yè)人員能夠訪問虛擬化工作空間。
    的頭像 發(fā)表于 01-12 09:26 ?922次閱讀
    如何選擇<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>和虛擬化軟件的組合方案呢?

    NVIDIA DOCA 2.5 長期支持版本發(fā)布

    正值 NVIDIA DOCA 面世三周年之際,NVIDIA 于近日發(fā)布了適用于 NVIDIA BlueField-3 網(wǎng)絡平臺的 NVIDIA
    的頭像 發(fā)表于 12-26 18:25 ?352次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 2.5 長期支持版本<b class='flag-5'>發(fā)布</b>

    NVIDIA GPU的核心架構及架構演進

    在探討 NVIDIA GPU 架構之前,我們先來了解一些相關的基本知識。GPU 的概念,是由 NVIDIA 公司在 1999 年發(fā)布 Gef
    發(fā)表于 11-21 09:40 ?1331次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>的核心架構及架構演進

    177倍加速!NVIDIA最新開源 | GPU加速各種SDF建圖!

    但最近,NVIDIA和ETHZ就聯(lián)合提出了nvblox,是一個使用GPU加速SDF建圖的庫。計算速度非常快,相較CPU計算TSDF甚至快了177倍。更重要的是,因為所有數(shù)據(jù)都已經(jīng)存儲在GPU上,所以很容易和深度學習方案結(jié)合!
    的頭像 發(fā)表于 11-09 16:46 ?1041次閱讀
    177倍加速!<b class='flag-5'>NVIDIA</b>最新開源 | <b class='flag-5'>GPU</b>加速各種SDF建圖!