深度學(xué)習(xí)是一種關(guān)鍵的計(jì)算方法,它正在推動(dòng)技術(shù)的發(fā)展——處理海量數(shù)據(jù)并發(fā)現(xiàn)人類永遠(yuǎn)無法自行辨別的微妙模式。但為了獲得最佳性能,深度學(xué)習(xí)算法需要得到正確的軟件編譯器和硬件組合的支持。特別是,允許根據(jù)需要靈活使用硬件資源進(jìn)行計(jì)算的可重構(gòu)處理器是關(guān)鍵。
在最近的一項(xiàng)研究中,香港的研究人員報(bào)告了一種名為 ReAAP 的新型可重構(gòu)處理器,其性能優(yōu)于幾種常用于支持深度神經(jīng)網(wǎng)絡(luò) (DNN) 的計(jì)算平臺(tái),深度學(xué)習(xí)是一種有用的形式,通常涉及具有許多計(jì)算密集型的大型數(shù)據(jù)集數(shù)據(jù)層。他們?cè)?10 月 10 日發(fā)表在IEEE Transactions on Computers上的一篇論文中對(duì)其進(jìn)行了描述。
在他們的研究中,研究人員將他們?cè)?ReAAP 中提出的軟件編譯器與 Nvidia GPU 和 ARM CPU 上的其他三個(gè)基線軟件編譯器進(jìn)行了比較。結(jié)果表明,它的執(zhí)行速度是運(yùn)行在GPU并且是運(yùn)行相同軟件編譯器的 1.6 到 3.3 倍在中央處理器上.
此外,Zheng 指出,ReAAP 為各種不同的計(jì)算密集層實(shí)現(xiàn)了硬件資源的持續(xù)高利用率。
雖然 ReAAP 擅長(zhǎng)處理具有典型數(shù)據(jù)密集型工作負(fù)載的 DNN,但它目前不太適合在數(shù)據(jù)稀疏時(shí)支持 DNN。鄭說他的團(tuán)隊(duì)希望在未來解決這個(gè)問題。更重要的是,研究人員希望以 ReAAP 為基礎(chǔ),使其能夠更好地處理量化數(shù)據(jù)(處理的數(shù)據(jù)以一種顯著降低神經(jīng)網(wǎng)絡(luò)的內(nèi)存需求和計(jì)算成本的方式)。
“在 [ReAAP 更好地處理量化數(shù)據(jù)] 的擴(kuò)展完成和評(píng)估后,我們將考慮將其與其他幾個(gè)人工智能計(jì)算加速解決方案一起商業(yè)化,”鄭說,并指出這將使 ReAAP 在資源方面更有效率受限平臺(tái),例如各種物聯(lián)網(wǎng) (IoT) 設(shè)備。
而普通處理器通常允許數(shù)據(jù)使用特定的硬件路徑進(jìn)行處理,可重構(gòu)處理器提供了一種更具適應(yīng)性的選擇:重新配置最有效的硬件資源以根據(jù)需要處理數(shù)據(jù)。
“可重構(gòu)處理器結(jié)合了軟件靈活性和硬件并行性的優(yōu)勢(shì),”參與該研究的香港科技大學(xué)電子與計(jì)算機(jī)工程系博士后研究員鄭建偉解釋道。
這些優(yōu)勢(shì)促使他的團(tuán)隊(duì)創(chuàng)建了 ReAAP,這是一個(gè)集成的軟硬件系統(tǒng)。它的軟件編譯器負(fù)責(zé)評(píng)估和優(yōu)化各種深度學(xué)習(xí)工作負(fù)載。一旦確定了并行處理數(shù)據(jù)的最佳解決方案,它就會(huì)發(fā)送指令重新配置硬件協(xié)處理器,從而分配適當(dāng)?shù)挠布Y源來進(jìn)行并行計(jì)算。“作為端到端系統(tǒng),ReAAP 可以部署以加速各種深度學(xué)習(xí)應(yīng)用程序,只需在 [the] 軟件中為每個(gè)應(yīng)用程序定制一個(gè) Python 腳本,”Zheng 解釋說。
審核編輯 :李倩
-
處理器
+關(guān)注
關(guān)注
68文章
19044瀏覽量
228506 -
AI
+關(guān)注
關(guān)注
87文章
29401瀏覽量
267706 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1199瀏覽量
24594
原文標(biāo)題:一種讓AI更快的可重構(gòu)處理器
文章出處:【微信號(hào):芯長(zhǎng)征科技,微信公眾號(hào):芯長(zhǎng)征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論