日本特大a级猛片在线观看,亚洲欧美久久精品电影,亚洲一成A人片在线

MLPerf組織今天發(fā)布最新的推理基準測試（Benchmark）MLPerf Inference v0.7結(jié)果，總共有23個組織提交了結(jié)果，相比上一個版本（MLPerf Inference v0.5）的12個提交者增加了近一倍。

結(jié)果顯示，今年5月NVIDIA（Nvidia）發(fā)布的安培（Ampere）架構(gòu)A100 Tensor Core GPU，在云端推理的基準測試性能是最先進Intel CPU的237倍。

最新測試：NVIDIA的安培GPU測試性能是最先進 CPU的237倍

MLPerf Inference V0.7部分結(jié)果截圖

最新的AI推理測試結(jié)果意味著，NVIDIA未來可能在AI推理和訓(xùn)練市場都占據(jù)領(lǐng)導(dǎo)地位，給云端AI推理市場擁有優(yōu)勢的Intel帶來更大壓力的同時，也將讓其他追趕者面臨更大挑戰(zhàn)。

MLPerf推理基準測試進一步完善的價值

與2019年的MLPerf Inference v0.5版本相比，最新的0.7版本將測試從AI研究的核心視覺和語言的5項測試，擴展了到了包括推薦系統(tǒng)、自然語言理解、語音識別和醫(yī)療影像應(yīng)用的6項測試，并且有分別針對云端和終端推理的測試，還加入了手機和筆記本電腦的結(jié)果。

擴展的測試項從MLPerf和業(yè)界兩個角度都有積極意義。

最新測試：NVIDIA的安培GPU測試性能是最先進 CPU的237倍

任何一個基準測試都需要給業(yè)界具有參考價值的指標。MLPerf基準測試是在業(yè)界缺乏對AI芯片公認的評價標準的2018年誕生，因此，MLPerf組織既需要給出各方都認可的成績，還需要根據(jù)AI行業(yè)的發(fā)展完善評價標準。

不過，AI行業(yè)發(fā)展迅速，AI模型的參數(shù)越來越多，應(yīng)用的場景也越來越廣泛。評價AI芯片和系統(tǒng)的推理性能需要涵蓋可編程性、延遲、準確性、模型大小、吞吐量、能效等指標，也需要選擇更具指導(dǎo)價值的模型和應(yīng)用。

此次增加的推薦系統(tǒng)測試對于互聯(lián)網(wǎng)公司意義重大。在王喆的《深度學(xué)習(xí)推薦系統(tǒng)》一書中提到，2019年天貓“雙11”的成交額是2684億元，假設(shè)推薦系統(tǒng)進行了優(yōu)化，整體的轉(zhuǎn)化率提高1%，那么增加的成交額大約為26.84億元。

另外，MLPerf Inference v0.7中增加醫(yī)療影像3D U-Net模型測試與新冠大流行以及AI在醫(yī)療行業(yè)的重要性與日俱增密切相關(guān)，比如一家初創(chuàng)公司使用AI簡化了超聲心電圖的采集工作，在新冠大流行初期發(fā)揮了作用。

基準測試從v0.5到v0.7，能夠為要選用AI芯片和系統(tǒng)的公司提供更直觀和有價值的參考是MLPerf基準測試的價值所在，比如，幫助金融結(jié)構(gòu)的會話式AI更快速回答客戶問題，幫助零售商使用AI保證貨架庫存充足。

與此同時，這也將促進MLPerf組織在業(yè)界的受認可程度，從接近翻倍的提交成績的組織就能看出來。

GPU云端推理性能最高是CPU的237倍

過去幾年，云端AI訓(xùn)練市場NVIDIA擁有絕對優(yōu)勢，云端AI推理市場被Intel賺取了大部分利潤是事實。這讓不少人都產(chǎn)生了GPU更適合訓(xùn)練而CPU更適合推理的認知，但MLPerf最新的推理測試結(jié)果可能會改變這一觀點。

MLPerf Inference V0.7的測試結(jié)果顯示，在數(shù)據(jù)中心OFFLINE（離線）測試模式下，賽靈思U250和IntelCooper Lake在各個測試模型下與NVIDIAT4的差距不大，但A100對比CPU、FPGA和自家的T4就有明顯的性能差距。

在SERVER模式下的推薦系統(tǒng)DLRM模型下，A100 GPU對比IntelCooper Lake有最高237倍的性能差距，在其他模型下也有比較顯著的差距。值得注意的是，Intel的Cooper Lake系統(tǒng)的狀態(tài)還是預(yù)覽，其余三款芯片的系統(tǒng)都已經(jīng)可用。

A100 GPU的優(yōu)勢也在邊緣推理中也十分明顯。在單數(shù)據(jù)流（Singel-Stream）測試中，A100對比NVIDIAT4和面向邊緣終端的NVIDIAJetson AGX Xavier有幾倍到十幾倍的性能優(yōu)勢。在多數(shù)據(jù)流（Multi-Stream）測試中，A100對比另外兩款自家產(chǎn)品在不同AI模型中有幾倍到二十多倍的性能優(yōu)勢。

在邊緣OFFLINE模式下，A100對比T4和Jetson AGX Xavier也有幾倍到二十多倍的性能優(yōu)勢。

這很好地說明A100的安培架構(gòu)以及其第三代Tensor Core優(yōu)勢的同時，也表明了NVIDIA能夠覆蓋整個AI推理市場。

在此次提交結(jié)果的23家公司中，除了NVIDIA外還有11家其合作伙伴提交了基于NVIDIA GPU的1029個測試結(jié)果，占數(shù)據(jù)中心和邊緣類別中參評測試結(jié)果總數(shù)的85％以上。

從提交結(jié)果的合作伙伴的系統(tǒng)中可以看到，NVIDIAT4仍然是企業(yè)的邊緣服務(wù)器推理平臺的主要選擇。A100提升到新高度的性能意味著未來企業(yè)邊緣服務(wù)器在選擇AI推理平臺的時候，可以從T4升級到A100，對于功耗受限的設(shè)備，可以選擇Jeston系列產(chǎn)品。

特別值得注意的是，NVIDIA GPU首次在公有云中實現(xiàn)了超越CPU的AI推理能力。

臨界點到來？AI推理芯片市場競爭門檻更高

五年前，只有少數(shù)領(lǐng)先的高科技公司使用GPU進行推理。如今，NVIDIAGPU首次在公有云市場實現(xiàn)超越CPU的AI推理能力，或許意味著AI推理市場臨界點的到來。NVIDIA還預(yù)測，基于其GPU的總體云端AI推理計算能力每兩年增長約10倍，增長速度高于CPU。

另外，NVIDIA還強調(diào)基于A100高性能系統(tǒng)的成本效益。NVIDIA表示，一套DGX A100系統(tǒng)可以提供相當于近1000臺雙插槽CPU服務(wù)器的性能，能為客戶AI推薦系統(tǒng)模型從研發(fā)走向生產(chǎn)的過程，具有極高的成本效益。

同時，NVIDIA也在不斷優(yōu)化推理軟件堆棧，進一步提升在推理市場的競爭力。

最先感受到影響的會是Intel，但在云端AI推理市場體現(xiàn)出顯著變化至少需要幾年時間，因為企業(yè)在更換平臺的時候會更加謹慎，生態(tài)的護城河此時也更能體現(xiàn)出價值。

但無論如何，我們都看到NVIDIA在AI市場的強勢地位。雷鋒網(wǎng)七月底報道，在MLPerf發(fā)布的MLPerf Training v0.7基準測試中，A100 Tensor Core GPU，和HDR InfiniBand實現(xiàn)多個DGX A100 系統(tǒng)互聯(lián)的龐大集群DGX SuperPOD系統(tǒng)在性能上開創(chuàng)了八個全新里程碑，共打破16項紀錄。

安培架構(gòu)A100在MLPerf最新的訓(xùn)練和推理成績表明NVIDIA不僅給云端AI訓(xùn)練的競爭者更大的壓力，也可能改變AI推理市場的格局。

NVIDIA將其在云端訓(xùn)練市場的優(yōu)勢進一步拓展到云端和邊緣推理市場符合AI未來的發(fā)展趨勢。有預(yù)測指出，隨著AI模型的成熟，市場對云端AI訓(xùn)練需求的增速將會降低，云端AI推理的市場規(guī)模將會迅速增加，并有望在2022年超過訓(xùn)練市場。

另據(jù)市場咨詢公司ABI Research的數(shù)據(jù)，預(yù)計到2025年，邊緣AI芯片市場收入將達到122億美元，云端AI芯片市場收入將達到119億美元，邊緣AI芯片市場將超過云端AI芯片市場。

憑借強大的軟硬件生態(tài)系統(tǒng)，NVIDIA和Intel依舊會是AI市場的重要玩家，只是隨著他們競爭力的不斷提升，其他參與AI市場競爭的AI芯片公司們面臨的壓力也隨之增加。
責(zé)編AJX

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

cpu

cpu

+關(guān)注

關(guān)注
68

文章
10780

瀏覽量
210497
NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4818

瀏覽量
102646
gpu

gpu

+關(guān)注

關(guān)注
27

文章
4639

瀏覽量
128474

嵌入式MXM模塊(NVIDIA安培架構(gòu))

電子發(fā)燒友網(wǎng)站提供《嵌入式MXM模塊(NVIDIA安培架構(gòu)).pdf》資料免費下載

發(fā)表于 10-09 11:09 ?0次下載

IB Verbs和NVIDIA DOCA GPUNetIO性能測試

NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個庫，專門為實時在線 GPU 數(shù)據(jù)包處理而設(shè)計。它結(jié)合了 GPUDirect RDMA 和 GPUDirect

發(fā)表于 08-23 17:03 ?373次閱讀

IB Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO<b class='flag-5'>性能</b><b class='flag-5'>測試</b>

摩爾線程與智譜AI完成大模型性能測試與適配

近日，摩爾線程與智譜AI在人工智能領(lǐng)域開展了一輪深入的合作，共同對GPU大模型進行了適配及性能測試。此次測試不僅涵蓋了大模型的推理能力，還涉及了基于摩爾線程夸娥（KUAE）千卡智算集群

發(fā)表于 06-14 16:40 ?860次閱讀

性能測試的實現(xiàn)方法是什么

性能測試是一種評估軟件系統(tǒng)在不同負載下性能表現(xiàn)的測試方法。它可以幫助開發(fā)團隊發(fā)現(xiàn)性能瓶頸，優(yōu)化系統(tǒng)性能

發(fā)表于 05-29 15:44 ?455次閱讀

性能測試主要測什么性能測試的指標有哪些

性能測試是軟件測試的一個重要組成部分，主要用于評估軟件系統(tǒng)在各種負載條件下的性能表現(xiàn)。性能測試的

發(fā)表于 05-29 15:42 ?1707次閱讀

功能測試和性能測試的區(qū)別與聯(lián)系

功能測試和性能測試是軟件測試的兩個重要方面。它們在確保軟件質(zhì)量和性能方面發(fā)揮著關(guān)鍵作用。本文將詳細探討功能

發(fā)表于 05-29 15:40 ?722次閱讀

進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

，推理能力提升 15 倍 GB200由兩個B200Blackwell GPU和一個基于Arm的Grace CPU組成，采用[臺積電]4納米工藝制程，共有2080億個[晶體管]，其AI性能

發(fā)表于 05-13 17:16

龍芯：自主研發(fā)CPU提升性能，單核通用性能提高20倍

張戈強調(diào)，龍芯CPU的主要IP核均為自主研發(fā)，這使得其性價比得到顯著提升。他指出，國產(chǎn)CPU與主流CPU的差距主要體現(xiàn)在單核性能上，而非多核性能

發(fā)表于 04-25 15:26 ?701次閱讀

信創(chuàng)測試究竟是什么？與性能測試的差別是什么？

信創(chuàng)測試和性能測試在多個方面存在顯著的區(qū)別。首先，信創(chuàng)測試是一個更為全面和系統(tǒng)的測試過程，它主要針對信創(chuàng)工程項目中的產(chǎn)品、系統(tǒng)等進行

發(fā)表于 04-24 15:34 ?641次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于

發(fā)表于 04-20 09:39 ?578次閱讀

搭載英偉達GPU，全球領(lǐng)先的向量數(shù)據(jù)庫公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫

基于GPU的向量索引和搜索加速能力，性能可提升 50 倍。 Milvus 2.4 的 GPU 加速性能提升效果令人驚嘆?；鶞?/div>
發(fā)表于 04-01 14:33 ?412次閱讀

gpu是什么和cpu的區(qū)別

GPU和CPU是兩種常見的計算機處理器，它們在結(jié)構(gòu)和功能上有很大的區(qū)別。在這篇文章中，我們將探討GPU和CPU的區(qū)別，并詳細介紹它們的原理、應(yīng)用領(lǐng)域和

發(fā)表于 02-20 11:24 ?1.8w次閱讀

通用CPU性能基準測試的研究現(xiàn)狀

經(jīng)過持續(xù)迭代升級，TPC已發(fā)展成為能夠滿足多種應(yīng)用場景性能測試需求的基準測試簇，根據(jù)測試場景和測試事務(wù)的不同，可將 TPC

發(fā)表于 02-20 10:22 ?575次閱讀

177倍加速！NVIDIA最新開源 | GPU加速各種SDF建圖！

但最近，NVIDIA和ETHZ就聯(lián)合提出了nvblox，是一個使用GPU加速SDF建圖的庫。計算速度非?？?，相較CPU計算TSDF甚至快了177倍。更重要的是，因為所有數(shù)據(jù)都已經(jīng)存儲在

發(fā)表于 11-09 16:46 ?1041次閱讀

電源電性能測試之諧波測試

開關(guān)電源電性能測試需要做諧波測試，它是屬于輸入特性方面的測試。

發(fā)表于 11-03 14:18 ?1456次閱讀