0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種讓AI更快的可重構(gòu)處理器

芯長(zhǎng)征科技 ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2022-12-09 10:27 ? 次閱讀

深度學(xué)習(xí)是一種關(guān)鍵的計(jì)算方法,它正在推動(dòng)技術(shù)的發(fā)展——處理海量數(shù)據(jù)并發(fā)現(xiàn)人類永遠(yuǎn)無法自行辨別的微妙模式。但為了獲得最佳性能,深度學(xué)習(xí)算法需要得到正確的軟件編譯器和硬件組合的支持。特別是,允許根據(jù)需要靈活使用硬件資源進(jìn)行計(jì)算的可重構(gòu)處理器是關(guān)鍵。

在最近的一項(xiàng)研究中,香港的研究人員報(bào)告了一種名為 ReAAP 的新型可重構(gòu)處理器,其性能優(yōu)于幾種常用于支持深度神經(jīng)網(wǎng)絡(luò) (DNN) 的計(jì)算平臺(tái),深度學(xué)習(xí)是一種有用的形式,通常涉及具有許多計(jì)算密集型的大型數(shù)據(jù)集數(shù)據(jù)層。他們?cè)?10 月 10 日發(fā)表在IEEE Transactions on Computers上的一篇論文中對(duì)其進(jìn)行了描述。

在他們的研究中,研究人員將他們?cè)?ReAAP 中提出的軟件編譯器與 Nvidia GPUARM CPU 上的其他三個(gè)基線軟件編譯器進(jìn)行了比較。結(jié)果表明,它的執(zhí)行速度是運(yùn)行在GPU并且是運(yùn)行相同軟件編譯器的 1.6 到 3.3 倍在中央處理器上.

此外,Zheng 指出,ReAAP 為各種不同的計(jì)算密集層實(shí)現(xiàn)了硬件資源的持續(xù)高利用率。

雖然 ReAAP 擅長(zhǎng)處理具有典型數(shù)據(jù)密集型工作負(fù)載的 DNN,但它目前不太適合在數(shù)據(jù)稀疏時(shí)支持 DNN。鄭說他的團(tuán)隊(duì)希望在未來解決這個(gè)問題。更重要的是,研究人員希望以 ReAAP 為基礎(chǔ),使其能夠更好地處理量化數(shù)據(jù)(處理的數(shù)據(jù)以一種顯著降低神經(jīng)網(wǎng)絡(luò)的內(nèi)存需求和計(jì)算成本的方式)。

“在 [ReAAP 更好地處理量化數(shù)據(jù)] 的擴(kuò)展完成和評(píng)估后,我們將考慮將其與其他幾個(gè)人工智能計(jì)算加速解決方案一起商業(yè)化,”鄭說,并指出這將使 ReAAP 在資源方面更有效率受限平臺(tái),例如各種物聯(lián)網(wǎng) (IoT) 設(shè)備。

而普通處理器通常允許數(shù)據(jù)使用特定的硬件路徑進(jìn)行處理,可重構(gòu)處理器提供了一種更具適應(yīng)性的選擇:重新配置最有效的硬件資源以根據(jù)需要處理數(shù)據(jù)。

“可重構(gòu)處理器結(jié)合了軟件靈活性和硬件并行性的優(yōu)勢(shì),”參與該研究的香港科技大學(xué)電子與計(jì)算機(jī)工程系博士后研究員鄭建偉解釋道。

這些優(yōu)勢(shì)促使他的團(tuán)隊(duì)創(chuàng)建了 ReAAP,這是一個(gè)集成的軟硬件系統(tǒng)。它的軟件編譯器負(fù)責(zé)評(píng)估和優(yōu)化各種深度學(xué)習(xí)工作負(fù)載。一旦確定了并行處理數(shù)據(jù)的最佳解決方案,它就會(huì)發(fā)送指令重新配置硬件協(xié)處理器,從而分配適當(dāng)?shù)挠布Y源來進(jìn)行并行計(jì)算。“作為端到端系統(tǒng),ReAAP 可以部署以加速各種深度學(xué)習(xí)應(yīng)用程序,只需在 [the] 軟件中為每個(gè)應(yīng)用程序定制一個(gè) Python 腳本,”Zheng 解釋說。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19044

    瀏覽量

    228506
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29401

    瀏覽量

    267706
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1199

    瀏覽量

    24594

原文標(biāo)題:一種讓AI更快的可重構(gòu)處理器

文章出處:【微信號(hào):芯長(zhǎng)征科技,微信公眾號(hào):芯長(zhǎng)征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    BitEnergy AI公司開發(fā)出一種AI處理方法

    BitEnergy AI公司,家專注于人工智能(AI)推理技術(shù)的企業(yè),其工程師團(tuán)隊(duì)創(chuàng)新性地開發(fā)了一種名為線性復(fù)雜度乘法(L-Mul)的AI
    的頭像 發(fā)表于 10-22 15:15 ?205次閱讀

    對(duì)稱多處理器和非對(duì)稱多處理器的區(qū)別

    (Symmetric Multi-Processing,簡(jiǎn)稱SMP)和非對(duì)稱多處理器(Asymmetric Multi-Processing,簡(jiǎn)稱AMP)。這兩架構(gòu)在設(shè)計(jì)理念、資源管理、任務(wù)分配和性能優(yōu)化等方面存在顯著差異。 對(duì)稱多
    的頭像 發(fā)表于 10-10 15:58 ?234次閱讀

    英特爾?至強(qiáng)?擴(kuò)展處理器助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

    在現(xiàn)代醫(yī)療行業(yè),人工智能(AI)、物聯(lián)網(wǎng)(IoT)和5G網(wǎng)絡(luò)等前沿技術(shù)正在重新定義醫(yī)療服務(wù)的提供方式。英特爾?至強(qiáng)?擴(kuò)展處理器通過在醫(yī)院從邊緣到云端的全面部署,構(gòu)建了個(gè)高效的數(shù)字化
    發(fā)表于 09-29 11:13 ?5987次閱讀
    英特爾?至強(qiáng)?<b class='flag-5'>可</b>擴(kuò)展<b class='flag-5'>處理器</b>助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

    代高功能新AI加速(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下代高功能新AI加速(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)
    發(fā)表于 08-15 11:06 ?0次下載
    下<b class='flag-5'>一</b>代高功能新<b class='flag-5'>一</b>代<b class='flag-5'>AI</b>加速<b class='flag-5'>器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級(jí)<b class='flag-5'>AI</b>系統(tǒng)高級(jí)<b class='flag-5'>AI</b>中<b class='flag-5'>更快</b>的嵌入<b class='flag-5'>處理</b>

    國產(chǎn)新型AI PC處理器亮相上海

    處理器
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年08月01日 09:21:01

    英特爾酷睿Ultra處理器突破500個(gè)AI模型優(yōu)化

    英特爾在最新推出的英特爾? 酷睿? Ultra處理器上宣布,超過500款AI模型已得到優(yōu)化運(yùn)行。這款處理器無疑是市場(chǎng)上領(lǐng)先的AI PC處理器
    的頭像 發(fā)表于 05-09 11:18 ?675次閱讀

    嵌入式微處理器般可分為哪四類型

    嵌入式微處理器一種專門設(shè)計(jì)用于嵌入式系統(tǒng)中的微處理器。它們通常用于控制和管理電子設(shè)備的各種任務(wù),例如自動(dòng)化系統(tǒng)、家電、電子設(shè)備以及工業(yè)機(jī)械等。嵌入式微處理器可以根據(jù)應(yīng)用的需求分為四
    的頭像 發(fā)表于 04-21 09:45 ?1171次閱讀

    dsp是嵌入式微處理器一種設(shè)備嗎 ARM嵌入式微處理器有何特點(diǎn)?

    DSP(Digital Signal Processor)不是一種嵌入式微處理器的設(shè)備。DSP是一種專門用于數(shù)字信號(hào)處理的微處理器,它具有高
    的頭像 發(fā)表于 04-21 09:37 ?833次閱讀

    瑞薩發(fā)布下代動(dòng)態(tài)重構(gòu)人工智能處理器加速

    瑞薩最新發(fā)布的動(dòng)態(tài)重構(gòu)人工智能處理器(DRP-AI)加速,在業(yè)界引起了廣泛關(guān)注。這款加速
    的頭像 發(fā)表于 03-08 13:45 ?655次閱讀

    英特爾酷睿Ultra處理器開售:引領(lǐng)AI與高性能的未來

     該處理器大亮點(diǎn)是其強(qiáng)大的AI功能。內(nèi)置的NPU(神經(jīng)網(wǎng)絡(luò)處理器)為AI應(yīng)用提供了強(qiáng)大的加速能力,使得大型語言模型的本地運(yùn)行成為可能。
    的頭像 發(fā)表于 12-27 16:57 ?952次閱讀

    英特爾專家為您揭秘第五代英特爾? 至強(qiáng)? 擴(kuò)展處理器如何為AI加速

    近日,英特爾發(fā)布了第五代至強(qiáng) 擴(kuò)展處理器,尤其是其“為 AI 加速”的口號(hào)引起了廣泛關(guān)注。 在 AI 快速發(fā)展的今天,第五代英特爾 至強(qiáng)
    的頭像 發(fā)表于 12-23 12:20 ?674次閱讀

    一種重構(gòu)的莫爾相干納米激光陣列

    ,展示了納米激光能夠以“P”“K”“U”和“中”“國”等圖形生成重構(gòu)的陣列化相干激射。研究成果以《相位同步重構(gòu)莫爾納米激光陣列》(“Reconfigurable moiré nan
    的頭像 發(fā)表于 12-16 11:42 ?577次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>的莫爾相干納米激光陣列

    英特爾放大招:AI芯片和服務(wù)齊登場(chǎng)

    與此同時(shí),英特爾用于筆記本電腦和臺(tái)式電腦的酷睿Ultra處理器個(gè)人電腦擁有直接運(yùn)行人工智能應(yīng)用的功能。酷睿Ultra內(nèi)置AI加速引擎,即被稱為NPU的神經(jīng)網(wǎng)絡(luò)處理單元,
    的頭像 發(fā)表于 12-15 17:10 ?781次閱讀
    英特爾放大招:<b class='flag-5'>AI</b>芯片和服務(wù)<b class='flag-5'>器</b>齊登場(chǎng)

    英特爾新處理器,掀AI PC戰(zhàn)火

    隨著ai時(shí)代的到來,英特爾正在構(gòu)想新的酷睿Ultra處理器(代號(hào)Meteor Lake),這是英特爾的第個(gè)基于npu的處理器,旨在在pc上應(yīng)用ai
    的頭像 發(fā)表于 12-11 11:26 ?876次閱讀

    x86處理器也有AI智能,解讀AMD Ryzen AI引擎

    在完成收購賽靈思不久之后,AMD就成功地將賽靈思的AI模塊集成到銳龍處理器中,也就是我們今天看到的銳龍7040系列移動(dòng)處理器中的Ryzen AI引擎。這樣的改變,其實(shí)和AMD對(duì)
    的頭像 發(fā)表于 11-13 16:30 ?711次閱讀
    <b class='flag-5'>讓</b>x86<b class='flag-5'>處理器</b>也有<b class='flag-5'>AI</b>智能,解讀AMD Ryzen <b class='flag-5'>AI</b>引擎