0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

巨頭們的人工智能芯片研發(fā)得怎么樣了

0BFC_eet_china ? 來(lái)源:未知 ? 作者:鄧佳佳 ? 2018-03-04 16:31 ? 次閱讀

前言

根據(jù)百度(Baidu)深度學(xué)習(xí)(deep learning)資深研究人員針對(duì)最新加速器進(jìn)行的測(cè)試結(jié)果顯示,現(xiàn)有的加速器芯片和軟件仍然存在一些美中不足之處,應(yīng)該盡快迎頭趕上。

這些結(jié)果有一部份來(lái)自于使用DeepBench測(cè)試。DeepBench是使用32位浮點(diǎn)數(shù)學(xué)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的開(kāi)放來(lái)源基準(zhǔn)。號(hào)稱(chēng)“中國(guó)Google”的百度于2016年9月發(fā)布DeepBench,并在去年6月進(jìn)行了更新,使其涵蓋推論工作以及使用16位數(shù)學(xué)運(yùn)算。

DeepBench利用神經(jīng)網(wǎng)絡(luò)庫(kù)測(cè)試不同硬件的基本運(yùn)算效能(來(lái)源:Baidu)

百度硅谷人工智能實(shí)驗(yàn)室(Silicon Valley AI Lab)資深研究員Greg Daimos解釋。在一些像矩陣乘法這樣的底層作業(yè)中,具有專(zhuān)用硬件的芯片(例如Nvidia Volta GPU的張量核心)能夠提供“數(shù)百TeraFlops (每秒1兆次浮點(diǎn)運(yùn)算)。..比前一代的5-10TFLOPS更快幾個(gè)數(shù)量級(jí)。”

然而,他說(shuō):“在實(shí)際應(yīng)用中所使用的一些底層作業(yè)并沒(méi)有足夠的(數(shù)據(jù))區(qū)域性,讓這些專(zhuān)用處理器充份發(fā)揮效能,所以我們必須為其適度地加速,或者改變算法。”

百度研究小組目前正探索兩種方式使用新芯片獲得更大回報(bào)。一方面,研究人員在其算法中開(kāi)啟控制功能,以便同時(shí)接收饋入數(shù)據(jù),期望能提高10倍的資料平行性。

另一條途徑是讓所有的模型看起來(lái)更像一般用于成像應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)。Daimos說(shuō),CNN比一般用于文本或音頻應(yīng)用(app)等循序數(shù)據(jù)的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)具有更多區(qū)域性。

研究人員在從文本產(chǎn)生音頻的百度模型中,“以CNN層取代RNN層堆?!?,使得“運(yùn)算密度提高了40倍”,從而帶來(lái)了更好的新硬件利用率。他強(qiáng)調(diào),“我們必須透過(guò)編寫(xiě)的所有應(yīng)用程序來(lái)檢視是否可以普遍使用這種方法,或只是將其用于語(yǔ)音合成?!?/p>

目前尚不清楚這兩種方法的研究成果何時(shí)可用于生產(chǎn)系統(tǒng)。同時(shí),Daimos也分享了硬件測(cè)試的其它觀(guān)察結(jié)果。

編程、內(nèi)存與靈活性

雖然百度取得將近90%的Nvidia Volta最佳利用率,但編程GPU并非易事。Diamos說(shuō),該芯片“有著成千上萬(wàn)個(gè)線(xiàn)程,你必須在一個(gè)問(wèn)題上進(jìn)行協(xié)調(diào)和同步。..。..編寫(xiě)這樣的程序代碼并不容易,而當(dāng)面對(duì)的是像張量核心這樣的對(duì)象時(shí)就更困難了?!?/p>

的確,Diamos表示,“讓這些任務(wù)變得更易于編程,正是我們面臨的最大挑戰(zhàn)。....而其中最大的問(wèn)題就出在內(nèi)存。我們想要執(zhí)行更大的神經(jīng)網(wǎng)絡(luò),但內(nèi)存比預(yù)期地更快耗盡,這并不是透過(guò)打造更好的處理器就能解決的問(wèn)題?!?/p>

他補(bǔ)充說(shuō),該問(wèn)題的一部份答案在于尋找能與新興內(nèi)存搭配作業(yè)的技術(shù),例如許多最新加速器所使用的高帶寬內(nèi)存(HBM)芯片堆棧等。

在百度的測(cè)試中,英特爾Intel)多核心x86處理器Xeon Phi的利用率甚至高于Nvidia Volta。然而,英特爾的芯片還沒(méi)有任何張量專(zhuān)用核心,因此該芯片在神經(jīng)網(wǎng)絡(luò)作業(yè)上的性能不若Volta。

Nvidia Volta配備640個(gè)Tensor核心,每秒提供超過(guò)100TFLOPS的深度學(xué)習(xí)效能(來(lái)源:Nvidia)

直接進(jìn)行比較并不容易,因?yàn)椴煌男酒ǔJ褂貌煌倪\(yùn)算格式。例如,Xeon Phi采用定點(diǎn)數(shù)學(xué),而Volta則混合使用16位和32位浮點(diǎn)運(yùn)算。

Diamos說(shuō):“英特爾芯片的測(cè)試結(jié)果顯示,對(duì)于一些CNN來(lái)說(shuō),定點(diǎn)數(shù)學(xué)運(yùn)算沒(méi)問(wèn)題。然而Nvidia發(fā)布的結(jié)果顯示在影像和語(yǔ)音應(yīng)用上表現(xiàn)良好,所以我們?nèi)〉昧艘恍?shù)據(jù),但還需要進(jìn)行更多研究?!?/p>

他稱(chēng)贊AMD最新的GPU及其新的機(jī)器學(xué)習(xí)開(kāi)放軟件是正確的發(fā)展方向,但指出他們也缺乏張量核心。他表示,對(duì)于英特爾Nirvana和Graphcore Colossus等芯片“沒(méi)啥可分享的消息”,也許是因?yàn)榘俣瓤赡苓€在測(cè)試其預(yù)先發(fā)布的樣片。

擁有大量的矩陣乘法單元通常是一件好事。但是,Volta、Nervana和Colossus處理器則以充滿(mǎn)矩陣乘法數(shù)組的芯片將其性能指針推進(jìn)到或接近其工藝節(jié)點(diǎn)所能實(shí)現(xiàn)的極限。

他說(shuō):“最終你的收益會(huì)遞減。..。..讓你不得不放棄靈活度,以便為更多不同的工作負(fù)載進(jìn)行更精密的運(yùn)算。因此,我們應(yīng)該找到曲線(xiàn)的轉(zhuǎn)折點(diǎn),讓芯片不僅在CNN上運(yùn)作良好,在其它方面也表現(xiàn)出色?!?/p>

神經(jīng)網(wǎng)絡(luò)軟件架構(gòu)各執(zhí)一端

除了底層數(shù)學(xué)之外,加速器還可能缺少優(yōu)化,因?yàn)樗鼈儾⒉煌耆私馍疃葘W(xué)習(xí)應(yīng)用的所有范圍。

當(dāng)今用于設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的競(jìng)爭(zhēng)軟件架構(gòu)各執(zhí)一端,可能會(huì)讓情況變得復(fù)雜。遺憾的是,跨不同架構(gòu)建立標(biāo)準(zhǔn)規(guī)格的努力也是各自為政,Diamos指出他的團(tuán)隊(duì)注意到目前有11種開(kāi)發(fā)中規(guī)格分別處于不同的完善階段。

他說(shuō),由Facebook和微軟(Microsoft)發(fā)起的開(kāi)放神經(jīng)網(wǎng)絡(luò)交換格式(ONNX)“正朝著正確的方向發(fā)展,但仍缺乏一些像是如何表達(dá)控制流程和反向傳播的特性?!?/p>

最近有20多家廠(chǎng)商(主要是半導(dǎo)體供應(yīng)商)宣布了神經(jīng)網(wǎng)絡(luò)交換格式(Neural Network Exchange Format),他們認(rèn)為該格式對(duì)芯片廠(chǎng)商來(lái)說(shuō)更好。Diamos說(shuō):“要搞清這些格式中是否有些能成功實(shí)施可能還為時(shí)過(guò)早,但我們正踏上一條更好的發(fā)展道路,確實(shí)也需要其中某一種規(guī)格勝出?!?/p>

他補(bǔ)充說(shuō):“在2014年,我當(dāng)時(shí)認(rèn)為未來(lái)將會(huì)看到人工智能(AI)架構(gòu)的融合,就像如今在繪圖API中所看到的,但人們?nèi)匀辉诎l(fā)明新的神經(jīng)網(wǎng)絡(luò)類(lèi)型,有時(shí)還會(huì)創(chuàng)造新的原型,所以它可能會(huì)像編程語(yǔ)言的多樣性一樣不斷地與時(shí)俱進(jìn)?!?/p>

也就是說(shuō),Daimos仍然看好深度學(xué)習(xí)。在今年稍早時(shí),他的團(tuán)隊(duì)發(fā)表研究指出,這一領(lǐng)域尚未成熟,預(yù)計(jì)接下來(lái)將會(huì)看到更多的突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46420

    瀏覽量

    236658
  • 人工智能芯片
    +關(guān)注

    關(guān)注

    1

    文章

    119

    瀏覽量

    28947

原文標(biāo)題:巨頭們的人工智能芯片研發(fā)得怎么樣了?

文章出處:【微信號(hào):eet-china,微信公眾號(hào):電子工程專(zhuān)輯】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    探討了人工智能如何通過(guò)技術(shù)創(chuàng)新推動(dòng)能源科學(xué)的進(jìn)步,為未來(lái)的可持續(xù)發(fā)展提供強(qiáng)大的支持。 首先,書(shū)中通過(guò)深入淺出的語(yǔ)言,介紹人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對(duì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    研究的進(jìn)程。從蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)到基因測(cè)序與編輯,再到藥物研發(fā)人工智能技術(shù)在生命科學(xué)的各個(gè)層面都發(fā)揮著重要作用。特別是像AlphaFold這樣的工具,成功解決困擾生物學(xué)界半個(gè)多世紀(jì)的蛋白質(zhì)折疊問(wèn)題,將
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    的效率,還為科學(xué)研究提供前所未有的洞察力和精確度。例如,在生物學(xué)領(lǐng)域,AI能夠幫助科學(xué)家快速識(shí)別基因序列中的關(guān)鍵變異,加速新藥研發(fā)進(jìn)程。 2. 跨學(xué)科融合的新范式 書(shū)中強(qiáng)調(diào),人工智能的應(yīng)用促進(jìn)了多個(gè)
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    和使用該技術(shù),無(wú)需支付專(zhuān)利費(fèi)或使用費(fèi)。這大大降低了人工智能圖像處理技術(shù)的研發(fā)成本,并吸引大量的開(kāi)發(fā)者、企業(yè)和研究機(jī)構(gòu)參與其生態(tài)建設(shè)。 靈活性則體現(xiàn)在RISC-V可以根據(jù)不同的應(yīng)用場(chǎng)景進(jìn)行定制和優(yōu)化,從而
    發(fā)表于 09-28 11:00

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    材料基因組工程的推動(dòng)下,人工智能如何與材料科學(xué)結(jié)合,加快傳統(tǒng)材料和新型材料的開(kāi)發(fā)過(guò)程。 第4章介紹人工智能在加快藥物研發(fā)、輔助基因研究方面及在合成生物學(xué)中的普遍應(yīng)用。 第5章介紹
    發(fā)表于 09-09 13:54

    人工智能如何改變著各行各樣

    人工智能的風(fēng)起云涌,幾乎顛覆千行百業(yè)創(chuàng)新的節(jié)奏,今天的人工智能就如同揮舞著“指揮棒”一,改變著各行各樣本來(lái)的“模樣”。
    的頭像 發(fā)表于 07-19 10:58 ?431次閱讀
    <b class='flag-5'>人工智能</b>如何改變著各行各樣

    東土科技自主研發(fā)的人工智能交通服務(wù)器實(shí)現(xiàn)規(guī)?;瘧?yīng)用

    智能交通領(lǐng)域,一場(chǎng)由東土科技引領(lǐng)的技術(shù)革新正悄然改變著城市交通的面貌。近日,東土科技自主研發(fā)的人工智能交通服務(wù)器在北京城市副中心通州區(qū)成功實(shí)現(xiàn)580處交通路口的規(guī)?;瘧?yīng)用,標(biāo)志著我
    的頭像 發(fā)表于 07-17 15:42 ?379次閱讀

    Python中的人工智能框架與實(shí)例

    人工智能(AI)領(lǐng)域,Python因其簡(jiǎn)潔的語(yǔ)法、豐富的庫(kù)和強(qiáng)大的社區(qū)支持,成為了最受歡迎的編程語(yǔ)言之一。本文將詳細(xì)介紹Python中的人工智能框架,并通過(guò)具體實(shí)例展示如何使用這些框架來(lái)實(shí)現(xiàn)不同的人工智能應(yīng)用。
    的頭像 發(fā)表于 07-15 14:54 ?1238次閱讀

    Google開(kāi)發(fā)專(zhuān)為視頻生成配樂(lè)的人工智能技術(shù)

    近日,科技巨頭Google旗下的人工智能研究實(shí)驗(yàn)室DeepMind宣布一項(xiàng)引人注目的技術(shù)突破——V2A技術(shù)(Video to Audio),這是一項(xiàng)專(zhuān)為視頻生成配樂(lè)的人工智能技術(shù)。這
    的頭像 發(fā)表于 06-20 11:03 ?446次閱讀

    三星牽頭對(duì)人工智能芯片公司Tenstorrent進(jìn)行投資

    近日,據(jù)外媒報(bào)道,科技巨頭三星牽頭對(duì)多倫多的人工智能芯片公司Tenstorrent進(jìn)行了一輪大規(guī)模的投資。據(jù)悉,此輪融資規(guī)模至少達(dá)到3億美元,進(jìn)一步鞏固Tenstorrent在
    的頭像 發(fā)表于 06-17 18:22 ?717次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開(kāi)發(fā)(SC171開(kāi)發(fā)套件V2)

    人工智能 工業(yè)檢測(cè):芯片模組外觀(guān)檢測(cè)實(shí)訓(xùn)part1 11分40秒 https://t.elecfans.com/v/25609.html *附件:芯片模組外觀(guān)檢測(cè)實(shí)訓(xùn).pdf 人工智能
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開(kāi)發(fā)(SC171開(kāi)發(fā)套件V1)

    https://t.elecfans.com/v/27186.html *附件:引體向上測(cè)試案例_20240126.pdf 人工智能 工業(yè)檢測(cè):芯片模組外觀(guān)檢測(cè)實(shí)訓(xùn)part1 11分40秒 https
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    。 國(guó)內(nèi)外科技巨頭紛紛爭(zhēng)先入局,在微軟、谷歌、蘋(píng)果、臉書(shū)等積極布局人工智能的同時(shí),國(guó)內(nèi)的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業(yè)的方向有哪些呢? 嵌入式AI開(kāi)發(fā)
    發(fā)表于 02-26 10:17

    身邊的人工智能有哪些

    身邊的人工智能有哪些? 身邊的人工智能應(yīng)用已經(jīng)滲透到了我們?nèi)粘I畹姆椒矫婷?。?b class='flag-5'>智能手機(jī)中的語(yǔ)音助手到智能家居設(shè)備,人工智能正逐漸改變著我們
    的頭像 發(fā)表于 12-07 16:32 ?3231次閱讀

    人工智能大模型、應(yīng)用場(chǎng)景、應(yīng)用部署教程超詳細(xì)資料

    人工智能是IC行業(yè)近幾年的熱詞,目前此技術(shù)已經(jīng)有很多成熟的模型和落地案例。在此跟大家做個(gè)分享,更多詳細(xì)資料,請(qǐng)自行搜索:【展銳坦克邦】,坦克邦-智算天地集算法模型、部署說(shuō)明于一體,為廣大客戶(hù)提供
    發(fā)表于 11-13 14:49