0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一款基準(zhǔn)測量工具的雛形——MLPerf

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-05-09 05:41 ? 次閱讀

AI基準(zhǔn)大戰(zhàn)已經(jīng)開始。

5月2日,由各大領(lǐng)先的科技公司和大學(xué)組成的團(tuán)隊(duì)發(fā)布了一款基準(zhǔn)測量工具的雛形——MLPerf,其目的是測量各種AI框架和芯片中不同機(jī)器學(xué)習(xí)任務(wù)的訓(xùn)練速度和推理時(shí)間。

在這一任務(wù)的參與者中,有許多知名公司和大學(xué),其中既有谷歌、英特爾、百度、AMD這樣的巨頭,也有一些AI硬件創(chuàng)企,例如SambaNova和Wave Computing。同時(shí)還有世界頂尖大學(xué):斯坦福大學(xué)、哈佛大學(xué)、加州大學(xué)伯克利分校、明尼蘇達(dá)大學(xué)和多倫多大學(xué)。

MLPerf的誕生是小部分公司自我組織進(jìn)行產(chǎn)品對比的結(jié)果。上周,RiseML的博客對比了谷歌的TPUv2和NVIDIA V100的性能。5月4日,英特爾發(fā)表博客,展示了為機(jī)器翻譯所用的RNN的數(shù)據(jù),題目稱“英特爾Xeon大規(guī)模處理器表現(xiàn)出令人驚訝的推理性能”。這種對比會給人一些參考,但通常也會讓人覺得供應(yīng)商自認(rèn)為比其他廠商優(yōu)越。而一個(gè)標(biāo)準(zhǔn)化的基準(zhǔn)可以讓測試簡單化,得到人們想要的結(jié)果。

除此之外,想要跟蹤記錄各大公司和創(chuàng)企的芯片制造以及軟件更新是非常困難的,更不要說在市場的夸大作用下還能進(jìn)行真實(shí)評估了。某些芯片廠商經(jīng)常承諾達(dá)到了革命性的提速,但從來不透露產(chǎn)品規(guī)格(咳咳,英特爾注意)。

在很長一段時(shí)間內(nèi),人們都在討論是否有必要設(shè)立一個(gè)有意義的AI基準(zhǔn)。支持者認(rèn)為,標(biāo)準(zhǔn)的缺失限制了AI的應(yīng)用。MLPerf的推動者之一吳恩達(dá)表示:“AI正在改變多個(gè)行業(yè),但是為了發(fā)揮它最大的潛能,我們?nèi)孕枰斓挠布蛙浖??!敝С终邆兿M鶞?zhǔn)的確立能幫助AI開發(fā)者創(chuàng)造出更好的產(chǎn)品,讓使用者充分了解所需產(chǎn)品。

MLPerf聲明它的基礎(chǔ)目標(biāo)是:

用公平、有幫助的測量方法加速機(jī)器學(xué)習(xí)的發(fā)展

對各競爭系統(tǒng)進(jìn)行公平對比,以鼓勵機(jī)器學(xué)習(xí)的發(fā)展

保證讓所有人都能參與基準(zhǔn)評比

既服務(wù)于商業(yè)群體,也服務(wù)于研究領(lǐng)域

基準(zhǔn)要可復(fù)制,確保結(jié)果的可靠

MLPerf是仿效過去其他的基準(zhǔn)測試,例如SPEC(The Standard Performance Evaluation Corporation)。該基準(zhǔn)于1988年由一家計(jì)算公司的財(cái)團(tuán)提出,它有效提高了通用計(jì)算的速度。而MLPerf結(jié)合了此前許多基準(zhǔn)的標(biāo)準(zhǔn),例如SPEC的程序,SORT用于對比和培育新思想的方法,DeepBench對軟件應(yīng)用的評估,以及DAWNBench的精確度標(biāo)準(zhǔn)。

Intersect360的CEO Addison Snell注意到:“現(xiàn)在許多企業(yè)都想部署AI,所以推出一套中立的基準(zhǔn)非常重要,尤其在多種技術(shù)爭相競爭的時(shí)代。但是,AI領(lǐng)域多種多樣,我不禁懷疑是否最后只剩一種標(biāo)準(zhǔn)。想想五年前人們對大數(shù)據(jù)和分析的熱情,盡管人人都想定義它,但是至今也沒有一個(gè)通用的衡量標(biāo)準(zhǔn)。我認(rèn)為AI也會面臨這種情況?!?/p>

Hyperion研究公司的高級研究副總裁Steve Conway認(rèn)為:“MLPerf是一款有用、優(yōu)秀的工具。因?yàn)榻┠暌恢比鄙籴槍I賣雙方的真正標(biāo)準(zhǔn)。這個(gè)基準(zhǔn)似乎是針對人工智能早期問題指定的,大多都是有邊界問題。后來我們需要其他標(biāo)準(zhǔn),因?yàn)槿斯ぶ悄荛_始出現(xiàn)了無邊界的問題。有邊界的問題比較簡單,如語音、圖像識別或游戲。而無界線問題包括癌癥診斷和閱讀磁核共振報(bào)告;現(xiàn)在,人工智能能為復(fù)雜問題提出推薦方案了?!?/p>

MLPerf現(xiàn)已在GitHub上發(fā)布,但仍處于初期階段,為α版本,未來將在許多方面得到改進(jìn)。目前,MLPerf套件上能進(jìn)行測試的有七個(gè)方面:

每個(gè)參考都提供了以下內(nèi)容:至少在一個(gè)框架中實(shí)現(xiàn)模型的代碼;一個(gè)可在container中運(yùn)行基準(zhǔn)測試的Dockerfile;一個(gè)可下載適當(dāng)數(shù)據(jù)集的腳本;一個(gè)可以運(yùn)行并計(jì)時(shí)模型訓(xùn)練的腳本;數(shù)據(jù)集、模型和機(jī)器設(shè)置的文檔記錄。

根據(jù)GitHub上的記錄,基準(zhǔn)測試已經(jīng)在以下配置中進(jìn)行測試:

16個(gè)CPU,一個(gè)NVIDIA P100

Ubuntu 16.04,包括具有NVIDIA支持的docker

600GB的硬盤(盡管很多基準(zhǔn)要求的硬盤更?。?/p>

在這樣一個(gè)年輕的市場,如果有更多的AI基準(zhǔn)出現(xiàn),那將變得很有趣。例如,斯坦福大學(xué)是MLPerf的其中一個(gè)成員,他最近運(yùn)行了第一個(gè)DAWNBenchv1深度學(xué)習(xí)結(jié)果。

斯坦福報(bào)道說:“2018年4月20日表示第一個(gè)衡量深度學(xué)習(xí)端到端性能的基準(zhǔn)和競爭的開始:測量深度學(xué)習(xí)任務(wù)達(dá)到最佳精確度時(shí)所需要的時(shí)間和成本是多少,以及在這個(gè)最先進(jìn)的精確度水平下進(jìn)行推理的成本是多少。對端到端性能的關(guān)注提供了一種客觀的方法,用于對計(jì)算框架、硬件、優(yōu)化算法、超參數(shù)設(shè)置以及影響性能的其他因素進(jìn)行標(biāo)準(zhǔn)化?!?/p>

DAWN的一個(gè)競爭對手——fast.ai(一家提供人工智能培訓(xùn)和開發(fā)人工智能軟件工具的初創(chuàng)公司)在HPCwire上宣傳它的產(chǎn)品性能。所以這些基準(zhǔn)很重要,應(yīng)該認(rèn)真對待,像MLPerf這樣的工具能幫助清除AI產(chǎn)品對比中的干擾因素。

“基準(zhǔn)提高了產(chǎn)品可信度,并展示了更好的性能或能帶來更多益處的地方。如果你正在考慮為一個(gè)數(shù)百萬美元的項(xiàng)目使用硬件加速器或軟件框架,那么你會不會更喜歡’榜上有名’的產(chǎn)品?”谷歌工程師Peter Mattson表示。

MLPerf希望用可復(fù)制的、公平可靠的基準(zhǔn)測量方法來推動機(jī)器學(xué)習(xí)行業(yè)和研究的發(fā)展。產(chǎn)品之間的對比還應(yīng)促進(jìn)供應(yīng)商和學(xué)者之間的競爭。同時(shí)還應(yīng)該為沒人提供做實(shí)驗(yàn)的條件,讓更多人參與其中。

Mattson補(bǔ)充道:“基準(zhǔn)在短期內(nèi)很重要,因?yàn)椴还苁菍ρ邪l(fā)公司還是想要購買產(chǎn)品的公司來說,硬件是一項(xiàng)巨大的投資。長期來看,基準(zhǔn)有助于研究者和供應(yīng)商將性能作為共同的發(fā)展目標(biāo),這樣才能解鎖更多機(jī)器學(xué)習(xí)的能量,造福更多人?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29435

    瀏覽量

    267737
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8325

    瀏覽量

    132196
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5442

    瀏覽量

    120799
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    620

原文標(biāo)題:MLPerf——機(jī)器學(xué)習(xí)新基準(zhǔn)能否驅(qū)動AI向前?

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    如果設(shè)計(jì)一款桌面的機(jī)器玩具,最吸引人的外觀與功能要有哪些?

    初步設(shè)想制作如下其中一款,有感興趣的朋友可以幫提提意見。 A一款圓敦敦的音響狀的“個(gè)人日程助手”,具備番茄鬧鐘、音樂播放、減壓交互、語言對話、工作日報(bào)生成。 B一款迷你瓦利機(jī)器人,有
    發(fā)表于 10-19 18:25

    DaVinci系統(tǒng)級基準(zhǔn)測試測量

    電子發(fā)燒友網(wǎng)站提供《DaVinci系統(tǒng)級基準(zhǔn)測試測量.pdf》資料免費(fèi)下載
    發(fā)表于 10-16 11:32 ?0次下載
    DaVinci系統(tǒng)級<b class='flag-5'>基準(zhǔn)</b>測試<b class='flag-5'>測量</b>

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準(zhǔn)測試五項(xiàng)性能全球第

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協(xié)會發(fā)布最新MLPerf? Storage v1.0 AI存儲基準(zhǔn)測試成績。浪潮信息分布式存儲平臺AS13000G7表現(xiàn)出
    的頭像 發(fā)表于 09-28 16:46 ?157次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲<b class='flag-5'>基準(zhǔn)</b>測試五項(xiàng)性能全球第<b class='flag-5'>一</b>

    具有低側(cè)基準(zhǔn)個(gè)IDAC電流源的三線PT100 RTD測量電路

    電子發(fā)燒友網(wǎng)站提供《具有低側(cè)基準(zhǔn)個(gè)IDAC電流源的三線PT100 RTD測量電路.pdf》資料免費(fèi)下載
    發(fā)表于 09-23 12:35 ?0次下載
    具有低側(cè)<b class='flag-5'>基準(zhǔn)</b>和<b class='flag-5'>一</b>個(gè)IDAC電流源的三線PT100 RTD<b class='flag-5'>測量</b>電路

    TPS手指觸感測量一款可以精準(zhǔn)測量力和時(shí)間變化的系統(tǒng)

    TPS手指觸感測量一款可以精準(zhǔn)測量力和時(shí)間變化的系統(tǒng) 它是一款高靈敏度傳感器,采用高敏感電容式壓力傳感器,能夠精確感知手指與物體接觸時(shí)的微小壓力變化,甚至可以檢測到非常細(xì)微的觸感差異,
    發(fā)表于 09-13 09:46

    Adobe將推出一款人工智能視頻生產(chǎn)工具

    Adobe即將在今年晚些時(shí)候震撼發(fā)布其最新力作——Adobe Firefly Video Model,一款專為創(chuàng)意專業(yè)人士打造的生成式視頻創(chuàng)作與編輯神器。作為Firefly圖像生成系列的新成員,該工具以測試版形式率先亮相,旨在通過人工智能技術(shù),為視頻創(chuàng)作領(lǐng)域帶來前所未有的
    的頭像 發(fā)表于 09-12 16:37 ?387次閱讀

    精密串聯(lián)基準(zhǔn)中的噪聲測量技術(shù)

    電子發(fā)燒友網(wǎng)站提供《精密串聯(lián)基準(zhǔn)中的噪聲測量技術(shù).pdf》資料免費(fèi)下載
    發(fā)表于 08-23 10:16 ?0次下載
    精密串聯(lián)<b class='flag-5'>基準(zhǔn)</b>中的噪聲<b class='flag-5'>測量</b>技術(shù)

    如何設(shè)計(jì)一款50HZ陷波電路?

    如何設(shè)計(jì)一款50HZ陷波電路,有現(xiàn)成的參考電路設(shè)計(jì)嗎
    發(fā)表于 07-30 06:12

    Synopsys推出一款低功耗靜態(tài)規(guī)則檢查工具—VCLP

    VCLP(VC Low Power)是Synopsys提供的一款低功耗靜態(tài)規(guī)則檢查工具,它能夠幫助驗(yàn)證和清潔IEEE 1801 Unified Power Format (UPF)低功耗設(shè)計(jì)意圖,并確保UPF中的功耗意圖與實(shí)現(xiàn)
    的頭像 發(fā)表于 04-15 11:25 ?1878次閱讀
    Synopsys推出<b class='flag-5'>一款</b>低功耗靜態(tài)規(guī)則檢查<b class='flag-5'>工具</b>—VCLP

    一款適合嵌入式工程師使用的在線工具

    一款適合嵌入式工程師使用的在線工具,工具有如下功能,如下圖所示: 1. 報(bào)文校驗(yàn)功能,如下圖所示 2. UDP服務(wù)端測試工具:該UDP服務(wù)端
    發(fā)表于 04-09 22:20

    安森美推出一款基于PLECS的具有獨(dú)特功能的領(lǐng)先在線仿真工具

    Elite Power仿真工具是安森美(onsemi)推出的一款基于PLECS的具有獨(dú)特功能的領(lǐng)先在線仿真工具,適用于軟/硬開關(guān)應(yīng)用,使工程師在開發(fā)周期的早期階段,
    的頭像 發(fā)表于 03-20 09:58 ?569次閱讀

    使用LTC6655系列作為基準(zhǔn)源設(shè)計(jì)一款采集器,如何測量設(shè)計(jì)后基準(zhǔn)源的1/f噪聲?

    最近在設(shè)計(jì)中使用LTC6655系列作為基準(zhǔn)源設(shè)計(jì)一款采集器,LTC6655的datasheet的理論值為
    發(fā)表于 01-08 07:09

    【飛騰派4G版免費(fèi)試用】Ubuntu系統(tǒng)上運(yùn)行的一款賊好用的截圖工具:Flameshot

    0. 起因 最近使用了Ubuntu 桌面系統(tǒng),發(fā)現(xiàn)對截圖工具支持的不是很好,自帶的截圖工具因?yàn)槲募笔?bào)錯不能使用。 于是簡單搜索了下,發(fā)現(xiàn)了一款很好用的截圖
    發(fā)表于 12-22 10:03

    【開源三方庫】Arouter:一款輕量、高效的頁面路由工具

    點(diǎn)擊藍(lán)字 ╳ 關(guān)注我們 開源項(xiàng)目 OpenHarmony 是每個(gè)人的 OpenHarmony 孫澳 OpenHarmony知識體系組 簡介 Arouter是一款適用于OpenAtom
    的頭像 發(fā)表于 11-24 21:15 ?1105次閱讀
    【開源三方庫】Arouter:<b class='flag-5'>一款</b>輕量、高效的頁面路由<b class='flag-5'>工具</b>

    高精密基準(zhǔn)電壓源分享

    JA3920是一款超低溫漂.寬壓輸入、高精度、輸出電壓為2.048V的全國產(chǎn)基準(zhǔn)電壓源芯片。本基準(zhǔn)電壓源既能吸收電流又能提供電流,并具有良好的線性和負(fù)載調(diào)節(jié)。
    發(fā)表于 11-03 11:17 ?521次閱讀
    高精密<b class='flag-5'>基準(zhǔn)</b>電壓源分享