0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI芯片如果有羅馬大道 必定歸功可重構(gòu)計(jì)算

電子工程師 ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-12-06 08:44 ? 次閱讀

芯片架構(gòu)設(shè)計(jì)領(lǐng)域中,可重構(gòu)計(jì)算技術(shù)并非一項(xiàng)新的存在。20世紀(jì)60年代末,加利福尼亞大學(xué)的Geraid Estrin首次提出重構(gòu)計(jì)算,后過(guò)去二十余年,Xilinx才基于這一原型系統(tǒng)推出該技術(shù)的重要分支——FPGA架構(gòu),正式開啟現(xiàn)代重構(gòu)計(jì)算技術(shù)。

即便如此,由于此前芯片發(fā)展一直走在摩爾定律預(yù)設(shè)的方向上,F(xiàn)PGA始終無(wú)法進(jìn)入公眾的視野中,而在學(xué)術(shù)研究領(lǐng)域,它也一直只是芯片技術(shù)研究中少有人關(guān)注的冷門項(xiàng)目。不曾想,在這一波AI浪潮的推動(dòng)下,可重構(gòu)計(jì)算技術(shù)迅速?gòu)膶W(xué)術(shù)邊緣走向了主流。

AI浪潮與芯片架構(gòu)創(chuàng)新

任何技術(shù)的興起都是市場(chǎng)需求、技術(shù)迭代與產(chǎn)業(yè)發(fā)展合力推動(dòng)的結(jié)果,AI不例外,芯片的變革更是如此。

在算力需求持續(xù)增長(zhǎng)的背景下,AI算法對(duì)芯片運(yùn)算能力的要求上升到傳統(tǒng)芯片的百倍以上,想像一下,采用了人工智能算法的AlphaGo需要用到上千塊傳統(tǒng)處理器CPU)和上百塊圖形處理器(GPU)。類似,傳統(tǒng)處理器根本無(wú)力支持智能家居、自動(dòng)駕駛智能終端等應(yīng)用場(chǎng)景的巨大算力需求,因此基于傳統(tǒng)CPU搭建出新的架構(gòu)就顯得迫在眉睫,AI芯片也就此誕生。

對(duì)于這一新興的芯片市場(chǎng),摩根大通的分析師Harlan Sur曾公開表示,到2022年為止,AI芯片市場(chǎng)將以每年59%的成長(zhǎng)速度增長(zhǎng),屆時(shí)市場(chǎng)規(guī)模有望達(dá)到330億美元。

用迅猛之勢(shì)來(lái)形容AI芯片產(chǎn)業(yè)的發(fā)展毫不為過(guò),這一新興事物也打破了整個(gè)市場(chǎng)既有的產(chǎn)業(yè)形態(tài)。在新興芯片市場(chǎng)占據(jù)龍頭地位的英偉達(dá),其CEO黃仁勛就多次在公開場(chǎng)合中表示:“摩爾定律時(shí)代已經(jīng)終結(jié)。”這也并非一家之言,作為摩爾定律的提出者,Intel也多次公開承認(rèn)這一點(diǎn)。

沒有摩爾定律的約束,在接下來(lái)很長(zhǎng)一段時(shí)間內(nèi),芯片產(chǎn)業(yè)勢(shì)必將進(jìn)入自由生長(zhǎng)狀態(tài),AI芯片產(chǎn)業(yè)呈現(xiàn)了前所未有的百花齊放。但其實(shí)深入去看,它卻也被有章法的推進(jìn)著。事實(shí)上,最為明顯的就是,伴隨著整個(gè)市場(chǎng)對(duì)功能的需求變化和終端的發(fā)展,GPU、ASIC等主流芯片架構(gòu)技術(shù)正逐步有序得的迭代和擴(kuò)大自己的市場(chǎng)占比。

目前,因市場(chǎng)對(duì)智能的實(shí)現(xiàn)尚處于初期,AI中關(guān)鍵的應(yīng)用需求更偏向于訓(xùn)練端,因而,在訓(xùn)練市場(chǎng)中獨(dú)大的GPU成為芯片市場(chǎng)的主流架構(gòu)也就毫不奇怪。但真正的智能一定離不開邏輯推理部分。自然,作為這一功能實(shí)現(xiàn)的主力軍,ASIC和FPGA備受業(yè)內(nèi)關(guān)注,其中,熱度蹭蹭上漲的FPGA可以說(shuō)是格外引入注目。

FPGA熱潮啟示錄

在AI并不火熱的時(shí)間段,F(xiàn)PGA常年來(lái)被用作專用芯片(ASIC)的小批量替代品。因傳統(tǒng)計(jì)算機(jī)馮·諾依曼結(jié)構(gòu)的約束,比CPU甚至GPU能效更高的FPGA一直未有用武之地,直到神經(jīng)網(wǎng)絡(luò)算法的出現(xiàn)。

不得不說(shuō),從初入商用市場(chǎng)到獨(dú)立成產(chǎn)品,F(xiàn)PGA架構(gòu)技術(shù)似乎從未和AI算法分離開過(guò),硬件上的節(jié)點(diǎn)與算法的神經(jīng)元結(jié)構(gòu)形成天然的呼應(yīng),頗有天造地設(shè)的意味。

如所料,F(xiàn)PGA最早一出現(xiàn)就伴隨著神經(jīng)網(wǎng)絡(luò)算法研究,2011年,Altera推出OpenCL,其中的CNN算法研究就是基于FPGA的,這讓FPGA重回了人們的視野中;后時(shí)隔三年,微軟推出Catapult項(xiàng)目,開發(fā)了高吞吐CNN FPGA加速器,將這種架構(gòu)更緊密的與神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)綁在了一起;2015年,陷入轉(zhuǎn)型焦慮的Intel直接選擇收購(gòu)Altera,這一舉動(dòng)后來(lái)甚至帶起了一波CPU+FPGA熱,但這一刻FPGA的魅力還沒有真正被展現(xiàn)出來(lái)。直到一年后,Intel終利用BP算法在FPGA上實(shí)現(xiàn)了5GOPS處理能力,這一架構(gòu)的優(yōu)勢(shì)終鋒芒初現(xiàn)。

一步一步,伴隨著深度學(xué)習(xí)的應(yīng)用和滲透,F(xiàn)PGA架構(gòu)技術(shù)也越來(lái)越受各芯片廠商關(guān)注,在多次大會(huì)的行業(yè)交流中,多位芯片研發(fā)人員都指出:綜合考慮成本、可行性等因素,在可見的未來(lái)里,架構(gòu)創(chuàng)新是唯一算力提升解決方案。而FPGA無(wú)疑為整個(gè)行業(yè)帶來(lái)架構(gòu)設(shè)計(jì)上的新思路。

第一次,F(xiàn)PGA被用于產(chǎn)品端是在iPhone 7上,蘋果集成了Lattice iCE40 FPGA,將其作為超低功耗的邏輯處理兼傳感器部件。從技術(shù)到產(chǎn)品端,這一技術(shù)架構(gòu)只用了短短七年,而蘋果的成功嘗試也為這一技術(shù)架構(gòu)加分不少?,F(xiàn)在,業(yè)內(nèi)人士也普遍將它列為舊有半導(dǎo)體甚至終端架構(gòu)的關(guān)鍵顛覆者,也因此,F(xiàn)PGA這七年的持續(xù)熱度給出了整個(gè)行業(yè)的風(fēng)向標(biāo):半導(dǎo)體架構(gòu)進(jìn)入了新的征程,尤其為AI芯片的設(shè)計(jì)提供了關(guān)鍵思路。

站在FPGA的肩膀上,可重構(gòu)芯片誕生

對(duì)于AI芯片的優(yōu)勢(shì),寒武紀(jì)陳天石曾這樣形象的描述道:“如果把深度學(xué)習(xí)看作切肉,傳統(tǒng)的處理器就是瑞士軍刀,我們的專用神經(jīng)網(wǎng)絡(luò)處理器則相當(dāng)于菜刀。瑞士軍刀通用性很好,什么都可以干,但干得不快,菜刀是專門用來(lái)做飯的,在切肉這件事情上,效率當(dāng)然更高。”

按理,效率越高,算力越高,芯片產(chǎn)業(yè)發(fā)展應(yīng)當(dāng)重回到此前活躍增長(zhǎng)的階段,但在近兩年整個(gè)產(chǎn)業(yè)卻出現(xiàn)了一種怪象:芯片產(chǎn)業(yè)進(jìn)入了一種低效的繁榮狀態(tài),現(xiàn)有的AI產(chǎn)品的數(shù)量只有兩位數(shù),而單價(jià)幾乎不變,尤其是AI終端產(chǎn)品,產(chǎn)業(yè)利潤(rùn)幾乎在個(gè)位數(shù)。在產(chǎn)業(yè)鏈端,產(chǎn)品開發(fā)費(fèi)用、產(chǎn)品難度都在持續(xù)上升,在市場(chǎng)空間有限的條件下,產(chǎn)品的盈利空間直線下降。

事實(shí)上,僅僅融合FPGA架構(gòu)設(shè)計(jì)的高效對(duì)整個(gè)產(chǎn)業(yè)的發(fā)展來(lái)說(shuō)是依然不夠的,菜刀終究還是菜刀,AI芯片的應(yīng)用場(chǎng)景和變現(xiàn)能力實(shí)在十分有限。對(duì)此,清華大學(xué)微電子所所長(zhǎng)魏少軍就直接點(diǎn)出:“要想讓AI芯片能夠在使用中變得更‘聰明’,架構(gòu)創(chuàng)新就是它不可回避的課題?!?/p>

產(chǎn)業(yè)端,為了打破這一現(xiàn)狀,地平線、寒武紀(jì)、Arm等眾多新老玩家紛紛給出了各自的平臺(tái)性商用解決方案,但終不是長(zhǎng)久之計(jì)。對(duì)此,業(yè)內(nèi)的共同認(rèn)知是:若想釜底抽薪,設(shè)計(jì)出一款動(dòng)態(tài)可重構(gòu)的并行計(jì)算芯片,以實(shí)現(xiàn)一塊芯片可以跑多種算法,節(jié)省資源,大大提高通用性,極大程度上促進(jìn)整個(gè)產(chǎn)業(yè)的發(fā)展。

所幸,在國(guó)內(nèi),目前尚有兩款芯片代表:一款是清華大學(xué)的Thinker可重構(gòu)AI芯片,它獲得了2017年國(guó)際低功耗電子與設(shè)計(jì)會(huì)議設(shè)計(jì)競(jìng)賽獎(jiǎng),這是一款由65nm工藝制成的芯片,不過(guò)其峰值性能能夠達(dá)到410GOPS,能效達(dá)5TOPS/W。第二款是南京大學(xué)RAPS可重構(gòu)芯片,它由40nm工藝制成,可以實(shí)現(xiàn)25種與信號(hào)處理有關(guān)的算法,峰值性能69GFLOPS,能效達(dá)到32GFOPS/W。與TMS320C6672多核DSP比較,性能能夠提高一個(gè)數(shù)量級(jí)。

值得一提的是,兩款芯片制程一般,工藝泛泛,卻收獲如此高效的性能,架構(gòu)創(chuàng)新的四兩撥千斤功效可見一斑。

最后

縱觀第三波AI浪潮下的半導(dǎo)體產(chǎn)業(yè),有兩個(gè)現(xiàn)象級(jí)事件奠定了當(dāng)下芯片產(chǎn)業(yè)的基調(diào):曾經(jīng)逃離半導(dǎo)體行業(yè)的風(fēng)投又紛紛重新回到了半導(dǎo)體行業(yè);歷來(lái)觀潮的中國(guó),現(xiàn)在成了弄潮兒。

不言而喻,這兩大趨勢(shì)撞在一起發(fā)生的化學(xué)效應(yīng)率先打破了整個(gè)半導(dǎo)體行業(yè)既有的產(chǎn)業(yè)形態(tài)。但不可忽視的是,作為工業(yè)的糧食,芯片架構(gòu)創(chuàng)新帶動(dòng)的產(chǎn)業(yè)活力才將成為推動(dòng)第三波AI浪潮持久發(fā)展的動(dòng)力。

如許衍居院士所言:未來(lái)10年,整個(gè)半導(dǎo)體產(chǎn)業(yè)將會(huì)從cSoC時(shí)代走向rSoC時(shí)代。但是可重構(gòu)芯片發(fā)展還需要突破眾多難關(guān),如基于可重構(gòu)計(jì)算搭建的硬件平臺(tái)是需要搭建一個(gè)統(tǒng)一的標(biāo)準(zhǔn)平臺(tái)還是僅僅只開發(fā)一個(gè)通用的編程模型?采用雙編程如何劃分軟硬件任務(wù)并處理好之間的通信問(wèn)題?這些問(wèn)題依舊是纏繞在可重構(gòu)芯片發(fā)展之路上的藤蔓,披荊斬棘,路且漫長(zhǎng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1624

    文章

    21540

    瀏覽量

    600545
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1845

    瀏覽量

    34793

原文標(biāo)題:站在FPGA的肩膀上 AI可重構(gòu)芯片誕生

文章出處:【微信號(hào):FPGAer_Club,微信公眾號(hào):FPGAer俱樂部】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI芯片的混合精度計(jì)算與靈活擴(kuò)展

    、NPU、DSP等。 ? 而無(wú)論是哪種架構(gòu),如何判斷其性能優(yōu)劣都至關(guān)重要,而這就涉及到AI芯片的各項(xiàng)性能指標(biāo),如算力、能效、時(shí)延等。其中AI芯片的算力精度是衡量其處理數(shù)據(jù)能力的重要指標(biāo)
    的頭像 發(fā)表于 08-23 00:08 ?4448次閱讀

    LM358運(yùn)放內(nèi)部有鉗位二極管嗎?如果有能承受的最大電流是多少?

    LM358: 運(yùn)放內(nèi)部有鉗位二極管嗎?如果有能承受的最大電流是多少?
    發(fā)表于 08-05 07:43

    esp8266有沒有wifi direct功能,如果有API在哪里?

    esp8266有沒有wifi direct功能,如果有API在哪里?
    發(fā)表于 07-19 16:05

    芯品# 高性能計(jì)算芯片

    Arm Neoverse基于CSS的CPU芯片組具有超高速接口和高級(jí)封裝,可為AI,HPC和網(wǎng)絡(luò)基礎(chǔ)設(shè)施提供擴(kuò)展的性能 英國(guó)倫敦和加拿大多倫多-2024年6月6日- Alphawave Semi
    的頭像 發(fā)表于 06-27 10:28 ?6857次閱讀

    AI芯片哪里買?

    AI芯片
    芯廣場(chǎng)
    發(fā)布于 :2024年05月31日 16:58:19

    STM8S103如果有兩個(gè)以上引腳要設(shè)置成中斷引腳該如何設(shè)置呢?

    請(qǐng)教一個(gè)關(guān)于STM8S103的中斷問(wèn)題,STM8的每個(gè)IO端口中斷號(hào)只有一個(gè),那么一個(gè)端口如果有兩個(gè)以上引腳要設(shè)置成中斷引腳該如何設(shè)置呢?比如在PC口如果我要設(shè)置成PC0、PC1都是外部中斷,因?yàn)椋校每谥挥幸粋€(gè)中斷號(hào),那么我該如何設(shè)置呢,如何判別是那個(gè)端口發(fā)生了外部中斷
    發(fā)表于 05-09 07:49

    重構(gòu)柔性裝配產(chǎn)線:AI邊緣控制技術(shù)的嶄新探索

    在信息化和智能化浪潮的推動(dòng)下,制造業(yè)正面臨著前所未有的轉(zhuǎn)型升級(jí)挑戰(zhàn)。其中,重構(gòu)柔性裝配產(chǎn)線以其獨(dú)特的AI邊緣控制技術(shù),為制造業(yè)的智能化轉(zhuǎn)型提供了新的解決方案。
    的頭像 發(fā)表于 04-30 16:11 ?324次閱讀
    <b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>柔性裝配產(chǎn)線:<b class='flag-5'>AI</b>邊緣控制技術(shù)的嶄新探索

    risc-v多核芯片AI方面的應(yīng)用

    RISC-V多核芯片AI方面的應(yīng)用主要體現(xiàn)在其低功耗、低成本、靈活擴(kuò)展以及能夠更好地適應(yīng)AI算法的不同需求等特點(diǎn)上。 首先,RISC-V適合用于高效設(shè)計(jì)實(shí)現(xiàn),其內(nèi)核面積更小,功耗更
    發(fā)表于 04-28 09:20

    一文帶您了解基于富唯智能AI-ICDP打造的重構(gòu)柔性裝配產(chǎn)線

    在當(dāng)今日益復(fù)雜多變的工業(yè)制造環(huán)境中,傳統(tǒng)裝配產(chǎn)線面臨著多層控制器架構(gòu)冗余、柔性化需求增加、控制器語(yǔ)言多樣以及標(biāo)準(zhǔn)化程度低等多重挑戰(zhàn)。為了解決這些行業(yè)痛點(diǎn),富唯智能憑借其創(chuàng)新的AI-ICDP平臺(tái),成功打造了重構(gòu)柔性裝配產(chǎn)線,為工
    的頭像 發(fā)表于 04-25 17:53 ?646次閱讀
    一文帶您了解基于富唯智能<b class='flag-5'>AI</b>-ICDP打造的<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>柔性裝配產(chǎn)線

    如果有六個(gè)獨(dú)立的PWM通道都需要測(cè)量ADC,是不是單片的STM32H7不夠用?

    大家好, STM32H7 系列中 由三個(gè)ADC, 每個(gè)ADC的轉(zhuǎn)換可以由 PWM Timer 觸發(fā)轉(zhuǎn)換。我的問(wèn)題是,如果有六個(gè)獨(dú)立的PWM 通道都需要 測(cè)量ADC,是不是單片的 STM32H7 不夠用 (我的理解是,單個(gè)ADC只能設(shè)置一個(gè) PWM timer 觸發(fā))? 只能用量片? 謝謝!
    發(fā)表于 04-18 07:49

    STM32CubeIDE有沒有軟件仿真?如果有的話,如何設(shè)置?

    STM32CubeIDE有沒有軟件仿真?如果有的話,如何設(shè)置?
    發(fā)表于 04-16 06:00

    【量子計(jì)算機(jī)重構(gòu)未來(lái) | 閱讀體驗(yàn)】+ 了解量子疊加原理

    機(jī)如何生產(chǎn)制造。。。。。。 近來(lái)通過(guò)閱讀《量子計(jì)算機(jī)—重構(gòu)未來(lái)》一書,結(jié)合網(wǎng)絡(luò)資料,了解了一點(diǎn)點(diǎn)量子疊加知識(shí),分享給大家。 先提一下電子計(jì)算機(jī),電子計(jì)算機(jī)使用二進(jìn)制表示信息數(shù)據(jù),二進(jìn)制
    發(fā)表于 03-13 17:19

    【量子計(jì)算機(jī)重構(gòu)未來(lái) | 閱讀體驗(yàn)】+ 初識(shí)量子計(jì)算機(jī)

    欣喜收到《量子計(jì)算機(jī)——重構(gòu)未來(lái)》一書,感謝電子發(fā)燒友論壇提供了一個(gè)讓我了解量子計(jì)算機(jī)的機(jī)會(huì)! 自己對(duì)電子計(jì)算機(jī)有點(diǎn)了解,但對(duì)量子計(jì)算機(jī)真
    發(fā)表于 03-05 17:37

    psoc4分了16個(gè)觸摸sensor,如果有一個(gè)sensor接地,會(huì)導(dǎo)致這個(gè)sensor信號(hào)飽和的原因?

    psoc4芯片 CapSense組件中button1下面分了16個(gè)觸摸sensor,如果有一個(gè)sensor接地,會(huì)導(dǎo)致這個(gè)sensor信號(hào)飽和,也會(huì)導(dǎo)致其他sensor信號(hào)變的很弱, 為什么同一組的sensor受影響,而其他button2,button3組的sensor
    發(fā)表于 02-18 08:52

    #芯片 #AI 世界最強(qiáng)AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月15日 15:54:37