0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

存算一體技術(shù)路線如何選

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2022-06-21 09:27 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)過去幾年,越來越多企業(yè)加入到存算一體技術(shù)的研究中,如今,存算一體芯片已經(jīng)逐漸走向商用。

從目前入局的企業(yè)來看,路線各異,包括采用不同類型的存儲器,從中小算力入手,或是直接進行大算力存算一體芯片的研究,有的是采用模擬的存算技術(shù),有的采用數(shù)字的存算技術(shù)。

那么如何選擇合適的存儲器類型,如何做大算力的存算一體芯片設(shè)計,采用模擬技術(shù)還是數(shù)字的方式?千芯科技董事長陳巍在接受電子發(fā)燒友采訪的時候做了詳細介紹。

如何選擇存儲器類型

千芯科技致力于大算力存算一體芯片技術(shù)的研究,在SRAM、MRAM、RRAM方面都有探索,目前基于SRAM存算一體產(chǎn)品樣卡正在測試,公司也在與中科院、清華大學等機構(gòu)一起優(yōu)化基于RRAM、MRAM存算一體電路的設(shè)計。

該公司技術(shù)團隊早期接觸過各類存儲器,陳巍博士10多年前就作為國家專項課題的技術(shù)負責人主持過當時國內(nèi)最先進的NOR Flash芯片及MemoryCompiler(存儲器編譯器)的設(shè)計研發(fā),作為負責人創(chuàng)建國內(nèi)首個3D NAND 閃存設(shè)計團隊,SRAM、RRAM、MRAM等都接觸了10年以上,有不少這些存儲器的專利。

千芯科技也給這些存儲器做了自己的分類,陳巍強調(diào),在進行存算一體存儲器選擇的時候,重點還是要看客戶和應(yīng)用需求,根據(jù)實際應(yīng)用場景來選擇存儲器比較合適。

圖:存儲器類型,優(yōu)勢、不足和適用場景(來自千芯科技)


因為雖然都是存算一體,但是從應(yīng)用來看,有些存算一體需要更偏向于存(ComputingMemory),有些更偏向于算(MemoryComputing),比如端側(cè)一些語音識別、人像識別的場景,對功耗和成本要求比較高,把AI計算的部分和存的部分合成一個器件,能夠有效降低成本。

比如在云計算領(lǐng)域,這個領(lǐng)域需要計算的模型非常大,同時訓練場景下,需要不斷更新數(shù)據(jù),因此在這樣的應(yīng)用場景下,一些非易失存儲器的讀寫速度,就不如SRAM、DRAM、RRAM好,這些場景更偏向于算,它目前會傾向于偏向計算能力的存儲器。

也就是說,如果是偏向于低成本,同時希望待機功耗更好,可以選擇非易失存儲器,包括Flash、RRAM、MRAM等;如果偏向于大規(guī)模計算,多數(shù)情況下可以選擇RRAM、SRAM和DRAM。另外具體來說選擇哪種存儲器,還和各家的專利布局綁定有關(guān)。

大算力存算一體芯片設(shè)計

自動駕駛、數(shù)據(jù)中心等領(lǐng)域,對大算力的需求比較明顯,因此各家企業(yè)也在大算力存算一體芯片的研發(fā)和推廣上投入精力。在陳巍看來,目前除了NOR閃存有些受容量限制,上述提到的各類存儲器基本可以用來做大算力存算一體。

閃存存算方面,目前主要路線是基于NOR flash(不是目前優(yōu)盤所用的閃存類型),多數(shù)情況下存儲容量較小,這使得NOR flash單片算力達到1TOPS以上器件代價較大,通常業(yè)內(nèi)說大算力一般是20-100TOPS以上,因此不太好直接做大算力的存算一體。而其他的存儲器,包括SRAM、RRAM等,現(xiàn)在已經(jīng)看到,有實際產(chǎn)品證明可以是可以用來做到大算力的存算一體。

在設(shè)計上,大算力存算一體結(jié)構(gòu)和小算力會有所不同,據(jù)陳巍介紹,這跟存算一體架構(gòu)里面的計算架構(gòu)有關(guān),大算力計算架構(gòu)和小算力計算架構(gòu)不一樣,一是大算力的計算核會有特別的外圍電路設(shè)計,來使它的吞吐能力比小算力更強;二是在整體結(jié)構(gòu)上,大算力有更多核心并聯(lián),相當于多個小算力整合成一個大算力,有點類似于GPU的整合方式,因為GPU也相當于是不同的小算力的核心,整合起來的架構(gòu)。


雖然說都可以做大算力,而基于非易失存儲器,目前做大算力存算一體,也會遇到一些工藝挑戰(zhàn),基本上循環(huán)讀寫次數(shù)在十的六到八次方之后,就可能出錯,所以到目前為止,國際上直接用NVM做200Tops以上算力的還較少。

因為在大算力場景下,它有非常高頻度的讀寫,這樣會較早的面臨失效的可能,而這個失效可能會導致計算錯誤,對于產(chǎn)品來說,這是必須要做優(yōu)化的,特別是在自動駕駛領(lǐng)域,如果遇到這種失效將會導致車輛失控。

這個問題如何解決呢,陳巍表示,經(jīng)過與業(yè)內(nèi)專家合作分析,他們認為需要從兩方面去做,一是器件的工藝水平需要優(yōu)化,二是做冗余器件設(shè)計去解決這個問題,目前對于計算為主的場景,做冗余器件設(shè)計,它的性能可能就沒有先進工藝下的SRAM強,做了冗余設(shè)計之后,它的面積也會進一步提升,這樣成本的優(yōu)勢可能就會有一定的降低。

因此總結(jié)來看,選擇何種存儲器去做大算力存算一體,還是要看場景,看客戶的需求,以及還和器件本身的工藝水平有很大關(guān)系。

模擬和數(shù)字存算一體技術(shù)的差別

可以看到,采用模擬還是數(shù)字的技術(shù),也是企業(yè)常提到的一點,陳巍介紹,一般跟傳感器連接密切的部分,推薦用模擬存算一體的方式,如果計算結(jié)構(gòu)復雜,建議用數(shù)字的,因為用模擬結(jié)構(gòu)去做復雜計算,代價比較大,而跟傳感器進行結(jié)合的時候,模擬計算有它的天然優(yōu)勢。

所以其實更多的還是看場景,比如小算力需求,就是做一個聲音識別,或者做一個小規(guī)模的圖像識別,這時候用模擬比較合適,如果說要做云計算的大算力,計算結(jié)構(gòu)又復雜,目前看采用數(shù)字方式的多些。


上圖是一個存算一體的陣列,比如憶阻器,里面存入矩陣系數(shù),或者叫權(quán)重,然后輸入數(shù)據(jù),也就是輸入不同的電壓,根據(jù)歐姆定律,就會產(chǎn)生不同的電流,每個電流匯聚在一起,即相當于是電流加和(基爾霍夫定理),就完成了一個乘積累加運算,這是模擬電路完成深度學習等各種計算的基本思路。

簡單的理解,數(shù)字的方式就是把不同的模擬單元分離開,原來模擬電路,相當于是一個單元存一個模擬數(shù)值,可能是幾位的,比如8位、或4位位寬,如果變成數(shù)字的方式,相當于一個單元存入一個數(shù)值,是一個位寬的。這樣就很明顯,模擬的好處是存儲密度更高,但沒法直接做復雜計算,數(shù)字電路離散性會更好,更靈活,可以直接做復雜運算。

存算一體技術(shù)的挑戰(zhàn)和未來

目前而言,存算一體的發(fā)展還存在一些挑戰(zhàn),陳巍談到兩點:一是生態(tài)建設(shè),盡管存算一體這個概念并不是特別新,但是真正進入實用階段的時間還比較短,特別是通用的編譯生態(tài)環(huán)境還沒有完全成熟,這樣它在落地上就會存在一些適配要求,因為客戶對生態(tài)都是有要求的,因此急需建立存算一體的生態(tài)。

二是如何更好的滿足客戶的需求,這也是整個AI芯片落地需要解決的一個問題,企業(yè)需要更多從客戶的需求角度去設(shè)計產(chǎn)品,對于客戶來說,可能有很多計算場景,它其實不單是需要一個AI技術(shù),還需要其他一些復合的計算類型,比如語音識別場景,它除了AI計算需求之后,還需要語音降噪的算法,這時候就需要根據(jù)客戶的需求進行特定場景的優(yōu)化。

存算一體就技術(shù)的未來會怎樣?從兩個階段來看,陳巍認為,目前基本都處于一個市場開拓期,很多客戶還沒有完全意識到存算一體的優(yōu)勢和價值,不過如果市場能夠出現(xiàn)一個很有影響力的廠商,來證明存算一體芯片,比傳統(tǒng)馮諾伊曼架構(gòu)AI芯片能力更強,那么很快就會有很大的突破,預(yù)計這樣的突破在近期就會發(fā)生。

從遠期來看,存算一體會和GPU、CPU技術(shù)有很好的結(jié)合,成為CPU、GPU、DPU,或者是其他各種AI芯片的計算核心,相當于現(xiàn)有的存算一體技術(shù)會給GPU或者CPU賦能,成為現(xiàn)有技術(shù)的計算核心。

從商用角度來看,目前國內(nèi)存算一體芯片至少有兩家量產(chǎn),估計今年會有很多都可以開始商用,目前已落地的商用還主要是在端側(cè)可穿戴設(shè)備等領(lǐng)域,一些語音識別,小的視覺模型場景集中。

在自動駕駛和云計算領(lǐng)域,云計算領(lǐng)域的商用預(yù)計快一點,估計明后年開始就有產(chǎn)品可以逐步進入中國互聯(lián)網(wǎng)大廠,自動駕駛領(lǐng)域的商用時間會比較長,因為自動駕駛從架構(gòu)設(shè)計到最后大批量裝車,一般需要五年時間,如果前面兩年已經(jīng)完成了設(shè)計、流片,大約還要三年的適配和量產(chǎn)測試時間才能實現(xiàn)大批量落地應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • sram
    +關(guān)注

    關(guān)注

    6

    文章

    760

    瀏覽量

    114555
  • 存算一體
    +關(guān)注

    關(guān)注

    0

    文章

    99

    瀏覽量

    4268
  • 千芯科技
    +關(guān)注

    關(guān)注

    0

    文章

    1

    瀏覽量

    1283
收藏 人收藏

    評論

    相關(guān)推薦

    一體架構(gòu)創(chuàng)新助力國產(chǎn)大力AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《一體架構(gòu)創(chuàng)新助力國產(chǎn)大力AI芯片騰飛》的演講。
    的頭像 發(fā)表于 10-23 14:48 ?78次閱讀

    科技新突破:首款支持多模態(tài)一體AI芯片成功問世

    一體介質(zhì),通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統(tǒng)架構(gòu)下的AI芯片相比,該款芯片在力、能效比,功耗等方面都具有明顯的優(yōu)勢。芯片采用AI
    發(fā)表于 09-26 13:51 ?250次閱讀
    科技新突破:首款支持多模態(tài)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>AI芯片成功問世

    蘋芯科技引領(lǐng)存一體技術(shù)革新 PIMCHIP系列芯片重塑AI計算新格局

    智能芯片國產(chǎn)化再傳利好,8月8日,國際領(lǐng)先的一體芯片開拓者——蘋芯科技在北京召開 “于芯 智啟未來——2024 蘋芯科技產(chǎn)品發(fā)布會”
    發(fā)表于 08-08 17:21 ?187次閱讀
    蘋芯科技引領(lǐng)存<b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>技術(shù)</b>革新   PIMCHIP系列芯片重塑AI計算新格局

    一體成型電感大了有什么影響

    電子發(fā)燒友網(wǎng)站提供《一體成型電感大了有什么影響.docx》資料免費下載
    發(fā)表于 07-04 16:54 ?1次下載

    后摩智能推出邊端大模型AI芯片M30,展現(xiàn)出一體架構(gòu)優(yōu)勢

    了基于M30芯片的智模組(SoM)和力謀??AI加速卡。 ? 后摩智能一體架構(gòu)芯片產(chǎn)品 ? 后摩智能是家專注于
    的頭像 發(fā)表于 07-03 00:58 ?3966次閱讀

    科技助力AI應(yīng)用落地:WTMDK2101-ZT1評估板實地評測與性能揭秘

    一體領(lǐng)域,全球參與者可分為國際巨頭和新興企業(yè)兩大陣營。國際巨頭如英特爾、IBM、特斯拉等早已布局技術(shù),并推出代表未來趨勢的產(chǎn)品。而新興
    發(fā)表于 05-16 16:38

    探索內(nèi)計算—基于 SRAM 的內(nèi)計算與基于 MRAM 的一體的探究

    本文深入探討了基于SRAM和MRAM的一體技術(shù)在計算領(lǐng)域的應(yīng)用和發(fā)展。首先,介紹了基于SRAM的內(nèi)邏輯計算
    的頭像 發(fā)表于 05-16 16:10 ?2202次閱讀
    探索<b class='flag-5'>存</b>內(nèi)計算—基于 SRAM 的<b class='flag-5'>存</b>內(nèi)計算與基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>的探究

    科技攜手北大共建一體技術(shù)實驗室,推動AI創(chuàng)新

    揭牌儀式結(jié)束后,王紹迪在北大集成電路學院舉辦的“未名·芯”論壇上做了主題演講,分享了他對于多模態(tài)大模型時代內(nèi)計算發(fā)展的見解。他強調(diào)了一體在人工智能領(lǐng)域的重要性及其未來發(fā)展趨勢。
    的頭像 發(fā)表于 05-08 17:25 ?816次閱讀

    北京大學-知科技一體聯(lián)合實驗室揭牌,開啟知科技產(chǎn)學研融合戰(zhàn)略新升級

    5月5日,“北京大學-知科技一體技術(shù)聯(lián)合實驗室”在北京大學微納電子大廈正式揭牌,北京大學集成電路學院院長蔡
    的頭像 發(fā)表于 05-07 19:31 ?1312次閱讀
    北京大學-知<b class='flag-5'>存</b>科技<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>聯(lián)合實驗室揭牌,開啟知<b class='flag-5'>存</b>科技產(chǎn)學研融合戰(zhàn)略新升級

    什么是通感一體化?通感一體化的應(yīng)用場景

    通感一體化可廣泛應(yīng)用于智能家居、智慧城市、智慧交通、醫(yī)療健康等方面。文檔君為大家搜集了些典型的應(yīng)用場景。 智能家居 通感一體化利用基站
    發(fā)表于 01-18 16:12 ?1w次閱讀
    什么是通感<b class='flag-5'>算</b><b class='flag-5'>一體</b>化?通感<b class='flag-5'>算</b><b class='flag-5'>一體</b>化的應(yīng)用場景

    一體芯片如何支持Transformer等不同模型?

    后摩智能致力于打造通用人工智能芯片,自主研發(fā)的一體芯片在支持各類模型方面表現(xiàn)突出,包括YOLO系列網(wǎng)絡(luò)、BEV系列網(wǎng)絡(luò)、點云系列網(wǎng)絡(luò)等。
    的頭像 發(fā)表于 01-05 14:14 ?1218次閱讀

    SRAM一體芯片的研究現(xiàn)狀和發(fā)展趨勢

    人工智能時代對計算芯片的力和能效都提出了極高要求。一體芯片技術(shù)被認為是有望解決處理器芯片“存儲墻”瓶頸,大幅提升人工智能
    的頭像 發(fā)表于 01-02 11:02 ?2185次閱讀
    SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片的研究現(xiàn)狀和發(fā)展趨勢

    淺談為AI大力而生的-芯片

    大模型爆火之后,一體獲得了更多的關(guān)注與機會,其原因之是因為
    發(fā)表于 12-06 15:00 ?336次閱讀
    淺談為AI大<b class='flag-5'>算</b>力而生的<b class='flag-5'>存</b><b class='flag-5'>算</b>-<b class='flag-5'>體</b>芯片

    不同的一體有什么區(qū)別?

    SRAM是目前唯一一種跟先進CMOS工藝完全兼容且能大規(guī)模量產(chǎn)的存儲介質(zhì),這也是支持大力的關(guān)鍵所在:從單獨一體宏單元的角度,SRAM跟先進工藝的兼容性使其外圍邏輯接口最能滿足當前
    的頭像 發(fā)表于 11-19 10:33 ?846次閱讀
    不同的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>有什么區(qū)別?

    憶阻器(RRAM)一體路線再次被肯定

    近日,清華大學發(fā)布的顆憶阻器一體芯片,火了。該芯片的火爆源于個月前,清華大學發(fā)的篇論文
    的頭像 發(fā)表于 10-26 09:13 ?1282次閱讀
    憶阻器(RRAM)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>路線</b>再次被肯定