亚洲和欧洲一码二码区别在哪儿啊 ,av在线亚洲无码,理论电影在线观看日韩理论

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）隨著技術(shù)的發(fā)展，現(xiàn)在計(jì)算的任務(wù)越來(lái)越復(fù)雜，需要的數(shù)據(jù)也越來(lái)越多，而在馮諾依曼架構(gòu)中，數(shù)據(jù)需要在存儲(chǔ)、內(nèi)存、緩存、計(jì)算單元中不斷搬運(yùn)，造成大部分時(shí)間、帶寬、緩存、功耗都消耗在數(shù)據(jù)搬運(yùn)上，而不是計(jì)算上，因此內(nèi)存墻都成了一個(gè)越來(lái)越嚴(yán)重的問題。

這種問題在人工智能計(jì)算中尤為明顯，知存科技創(chuàng)始人兼CEO王紹迪近日在某論壇分享到：“這種數(shù)據(jù)搬運(yùn)消耗的功耗超過(guò)95%以上，帶寬也會(huì)達(dá)到80%以上，比如片上緩存，1MB的SRAM和8KB的SRAM在數(shù)據(jù)搬運(yùn)上消耗的功耗相差10倍?！币虼藰I(yè)界都在思考減少內(nèi)存墻問題。

存算一體有效解決內(nèi)存墻問題

存算一體主要有近存計(jì)算和存內(nèi)計(jì)算。近存計(jì)算可以理解為通過(guò)先進(jìn)封裝拉近存儲(chǔ)、內(nèi)存和計(jì)算單元的距離，比如SRAM，在馮諾依曼架構(gòu)中，很多時(shí)候SRAM用作緩存，多核共同使用，這樣緩存到每個(gè)核都有一定距離，數(shù)據(jù)搬運(yùn)、訪問時(shí)間、功耗都會(huì)增加，王紹迪介紹：“近緩存計(jì)算把SRAM與計(jì)算單元合在一起，這個(gè)SRAM只供本地計(jì)算單元使用，數(shù)據(jù)訪問時(shí)間和帶寬都有很大提升。”

存內(nèi)計(jì)算比近存計(jì)算更高效，同時(shí)也更難以實(shí)現(xiàn)，存內(nèi)計(jì)算一般是使用存儲(chǔ)的參數(shù)去完成計(jì)算，比如SRAM存內(nèi)計(jì)算，F(xiàn)lash存內(nèi)計(jì)算、以及RRAM存內(nèi)計(jì)算。存內(nèi)計(jì)算實(shí)際上是一個(gè)計(jì)算的模塊，而不再是存儲(chǔ)的模塊，實(shí)踐的方式是用存儲(chǔ)的參數(shù)去完成運(yùn)算，從存儲(chǔ)器中讀出的數(shù)據(jù)是運(yùn)算的結(jié)果，而不是存儲(chǔ)的數(shù)據(jù)。

在馮諾依曼架構(gòu)中，不管是做加法運(yùn)算還是乘法運(yùn)算，都需要把數(shù)據(jù)從存儲(chǔ)架構(gòu)中讀出來(lái)，包括緩存、內(nèi)存、以及片外的存儲(chǔ)，最終將數(shù)據(jù)讀到計(jì)算單元中完成運(yùn)算。從緩存中讀取數(shù)據(jù)，要消耗運(yùn)算幾倍、幾十倍、甚至幾百倍的功耗，從內(nèi)存讀取數(shù)據(jù)，搬運(yùn)功耗是運(yùn)算的近千倍，從外部的存儲(chǔ)讀取，達(dá)到上萬(wàn)倍。

因此在數(shù)據(jù)量很大的計(jì)算中，馮諾依曼架構(gòu)的效率就會(huì)非常低，而存內(nèi)計(jì)算，存儲(chǔ)器中存儲(chǔ)了參數(shù)，被處理的數(shù)據(jù)作為輸入信號(hào)，被處理的信號(hào)流過(guò)存儲(chǔ)器中所有的參數(shù)，從存儲(chǔ)器中輸出的數(shù)據(jù)就是運(yùn)算的結(jié)果。

王紹迪表示，“存內(nèi)計(jì)算的優(yōu)勢(shì)在于，能夠?qū)⒋鎯?chǔ)器中眾多的存儲(chǔ)單元轉(zhuǎn)化為運(yùn)算單元，這樣能計(jì)算的并行度就會(huì)大幅提高，從原來(lái)幾十、幾百個(gè)并行，到存內(nèi)計(jì)算幾百萬(wàn)、幾千萬(wàn)、甚至幾億個(gè)乘加法的并行度，運(yùn)算效率很高。”

除了可以大規(guī)模并行運(yùn)算，還可以很大程度節(jié)省數(shù)據(jù)帶寬。簡(jiǎn)單來(lái)說(shuō)，一個(gè)傳統(tǒng)的存儲(chǔ)器，多行多列，一次至多激活一行，讀取出一行的數(shù)據(jù)，而要把多行數(shù)據(jù)讀取出來(lái)，需要進(jìn)行多個(gè)存儲(chǔ)器周期，分別激活每一行，讀出每一行的數(shù)據(jù)。而存內(nèi)計(jì)算可以同時(shí)把輸入數(shù)據(jù)給多行，同時(shí)多行的輸入數(shù)據(jù)與每一行的參數(shù)做乘法運(yùn)算，在列的方向直接把運(yùn)算的結(jié)果讀取出來(lái)，它是同時(shí)多行多列并行激活的方法。

現(xiàn)在的存內(nèi)計(jì)算可以做到千行千列同時(shí)開啟，使用效率比傳統(tǒng)存儲(chǔ)器提高近千倍，王紹迪談到：“整體來(lái)看，包括輸入輸出，存內(nèi)計(jì)算運(yùn)算效率一般會(huì)有幾十倍的提升，而且提升倍數(shù)還一直在增加，存內(nèi)計(jì)算的發(fā)展速度很快，最近處于早期的快速發(fā)展階段，每年都有數(shù)倍性能的提升?！?/p>

知存科技WTM2101智能解決方案

知存科技目前在存內(nèi)計(jì)算領(lǐng)域較為領(lǐng)先，公司成立于2017年底，目前已經(jīng)推出兩款存算一體芯片，其中WTM1001已經(jīng)批量量產(chǎn)，WTM2101處于小批量階段，知存科技目前已經(jīng)完成五輪融資。

WTM2101是一款尺寸很小的SOC芯片，包括一個(gè)1.8MB存內(nèi)計(jì)算的Flash，該存儲(chǔ)模塊除了用于存內(nèi)計(jì)算，也可以用于普通的存儲(chǔ)。王紹迪介紹：“這款芯片的封裝很小，可以用在可穿戴設(shè)備中，目前計(jì)算的功耗非常低，比如如果做連續(xù)100個(gè)詞到300個(gè)詞的識(shí)別，功耗可以控制在1mA以內(nèi)，其中100個(gè)詞可以功耗可以到60微安。該芯片在運(yùn)行語(yǔ)音識(shí)別、語(yǔ)音增強(qiáng)、物體識(shí)別、智能健康，以及其他的一些AI 算法上，可以把算力和效率提升20倍到50倍。”

另外WTM2101首次用了獨(dú)有的專利HPU，它是一個(gè)混合計(jì)算單元，實(shí)際上是把數(shù)字計(jì)算和模擬計(jì)算結(jié)合在一起，因?yàn)槟M計(jì)算有精度上限，為了提高精度，加了一個(gè)稀疏的計(jì)算單元，可以把存內(nèi)計(jì)算的精度進(jìn)一步提高，最高提高4比特。

存內(nèi)計(jì)算未來(lái)的發(fā)展趨勢(shì)

隨著存內(nèi)計(jì)算的發(fā)展，未來(lái)的應(yīng)用場(chǎng)景也會(huì)越來(lái)越廣，當(dāng)前存內(nèi)計(jì)算主要應(yīng)用在端側(cè)，一是受精度的限制，8比特，二是受容量限制，在幾兆的級(jí)別，三是算力，基本在0.1T到1T的范圍。

不過(guò)未來(lái)一兩年將會(huì)發(fā)展到邊側(cè)，精度會(huì)提高到12比特，容量會(huì)達(dá)到16兆到64兆，算力也可以提升到最大32T，這樣可以覆蓋很多邊緣側(cè)的應(yīng)用需求。未來(lái)還會(huì)向云端發(fā)展，存內(nèi)計(jì)算精度會(huì)達(dá)到到16比特，容量會(huì)超過(guò)1000M，算力會(huì)達(dá)到256T到1024T。

存內(nèi)計(jì)算在云側(cè)、邊側(cè)、端側(cè)，優(yōu)勢(shì)各不相同，在端側(cè)，存內(nèi)計(jì)算在功耗的限制下可以提供大的算力，在邊緣側(cè)，在功耗、體積限制下也有很強(qiáng)的算力，在云端，可以提供更低成本的解決方案。

存內(nèi)計(jì)算現(xiàn)在處于一個(gè)很快的發(fā)展階段，未來(lái)幾年，每年都會(huì)有很快的迭代速度。早期，產(chǎn)業(yè)界對(duì)存內(nèi)計(jì)算的關(guān)注不多，投入也很少，最近存內(nèi)計(jì)算逐漸得到越來(lái)越多的關(guān)注，王紹迪認(rèn)為，未來(lái)五年存內(nèi)計(jì)算都會(huì)在處在非常快速的發(fā)展階段，在各種各樣的場(chǎng)景中，進(jìn)行規(guī)?；穆涞貞?yīng)用。

聲明：本文由電子發(fā)燒友原創(chuàng)，轉(zhuǎn)載請(qǐng)注明以上來(lái)源。如需入群交流，請(qǐng)?zhí)砑游⑿舉lecfans999，投稿爆料采訪需求，請(qǐng)發(fā)郵箱huangjingjing@elecfans.com。

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

存儲(chǔ)器

存儲(chǔ)器

+關(guān)注

關(guān)注
38

文章
7409

瀏覽量
163436
SoC芯片

SoC芯片

+關(guān)注

關(guān)注
1

文章
592

瀏覽量
34814
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46438

瀏覽量
236681
存算一體

存算一體

+關(guān)注

關(guān)注
0

文章
99

瀏覽量
4270

原文標(biāo)題：有效解決內(nèi)存墻問題存算一體正處在快速發(fā)展階段

文章出處：【微信號(hào)：elecfans，微信公眾號(hào)：電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

存算一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)大算力AI芯片騰飛

在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算（HPC）應(yīng)用論壇》上，億鑄科技高級(jí)副總裁徐芳發(fā)表了題為《存算一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)大算力AI芯片騰飛》的演講。

發(fā)表于 10-23 14:48 ?127次閱讀

科技新突破：首款支持多模態(tài)存算一體AI芯片成功問世

存算一體介質(zhì)，通過(guò)存儲(chǔ)單元和計(jì)算單元的深度融合，采用22nm成熟工藝制程，有效把控制造成本。與傳統(tǒng)架構(gòu)下的AI芯片相比，該款芯片在算力、能效

發(fā)表于 09-26 13:51 ?256次閱讀

科技新突破：首款支持多模態(tài)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>AI芯片成功問世

后摩智能首款存算一體智駕芯片獲評(píng)突出創(chuàng)新產(chǎn)品獎(jiǎng)

近日，2024年6月29日，由深圳市汽車電子行業(yè)協(xié)會(huì)主辦的「第十三屆國(guó)際汽車電子產(chǎn)業(yè)峰會(huì)暨2023年度汽車電子科學(xué)技術(shù)獎(jiǎng)?lì)C獎(jiǎng)典禮」在深圳寶安隆重舉行。后摩智能首款存算一體智駕芯片——后摩鴻途??H30 獲評(píng)「突出創(chuàng)新產(chǎn)品獎(jiǎng)」。

發(fā)表于 09-24 16:51 ?399次閱讀

蘋芯科技引領(lǐng)存算一體技術(shù)革新 PIMCHIP系列芯片重塑AI計(jì)算新格局

智能芯片國(guó)產(chǎn)化再傳利好，8月8日，國(guó)際領(lǐng)先的存算一體芯片開拓者——蘋芯科技在北京召開 “存算于芯智啟未來(lái)——2024 蘋芯科技產(chǎn)品發(fā)布會(huì)”

發(fā)表于 08-08 17:21 ?198次閱讀

蘋芯科技引領(lǐng)存<b class='flag-5'>算</b><b class='flag-5'>一體</b>技術(shù)革新 PIMCHIP系列芯片重塑AI計(jì)算新格局

后摩智能推出邊端大模型AI芯片M30，展現(xiàn)出存算一體架構(gòu)優(yōu)勢(shì)

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）近日，后摩智能推出基于存算一體架構(gòu)的邊端大模型AI芯片——后摩漫界??M30，最高算力100TOPS，典型功耗12W。為了進(jìn)

發(fā)表于 07-03 00:58 ?3976次閱讀

知存科技助力AI應(yīng)用落地：WTMDK2101-ZT1評(píng)估板實(shí)地評(píng)測(cè)與性能揭秘

計(jì)算都是存算一體架構(gòu)的重要組成部分，目的是在硬件層面上優(yōu)化數(shù)據(jù)處理流程，使得計(jì)算機(jī)系統(tǒng)能夠更快速、更有效地處理大規(guī)模數(shù)據(jù)和計(jì)算密集型任務(wù)。這

發(fā)表于 05-16 16:38

探索存內(nèi)計(jì)算—基于 SRAM 的存內(nèi)計(jì)算與基于 MRAM 的存算一體的探究

本文深入探討了基于SRAM和MRAM的存算一體技術(shù)在計(jì)算領(lǐng)域的應(yīng)用和發(fā)展。首先，介紹了基于SRAM的存內(nèi)邏輯計(jì)算技術(shù)，包括其原理、優(yōu)勢(shì)以及在

發(fā)表于 05-16 16:10 ?2233次閱讀

探索<b class='flag-5'>存</b>內(nèi)計(jì)算—基于 SRAM 的<b class='flag-5'>存</b>內(nèi)計(jì)算與基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>的探究

知存科技攜手北大共建存算一體化技術(shù)實(shí)驗(yàn)室，推動(dòng)AI創(chuàng)新

揭牌儀式結(jié)束后，王紹迪在北大集成電路學(xué)院舉辦的“未名·芯”論壇上做了主題演講，分享了他對(duì)于多模態(tài)大模型時(shí)代存內(nèi)計(jì)算發(fā)展的見解。他強(qiáng)調(diào)了存算一體

發(fā)表于 05-08 17:25 ?826次閱讀

北京大學(xué)-知存科技存算一體聯(lián)合實(shí)驗(yàn)室揭牌，開啟知存科技產(chǎn)學(xué)研融合戰(zhàn)略新升級(jí)

、知存科技首席科學(xué)家郭昕婕博士及企業(yè)研發(fā)相關(guān)負(fù)責(zé)人參加了現(xiàn)場(chǎng)揭牌儀式。面向多模態(tài)大模型時(shí)代產(chǎn)業(yè)發(fā)展新需求，雙方將攜手踏上探索存算一體技術(shù)前沿

發(fā)表于 05-07 19:31 ?1316次閱讀

大算力時(shí)代, 如何打破內(nèi)存墻

來(lái)源：Ambarella安霸何小林近年來(lái)，人工智能應(yīng)用正經(jīng)歷一輪快速的發(fā)展與普及，而以ChatGPT等先進(jìn)的大模型技術(shù)在此過(guò)程中起到了關(guān)鍵作用。這些模型對(duì)計(jì)算能力的需求不斷攀升，催生了AI芯片

發(fā)表于 03-06 19:51 ?265次閱讀

什么是通感算一體化？通感算一體化的應(yīng)用場(chǎng)景

通感算一體化可廣泛應(yīng)用于智能家居、智慧城市、智慧交通、醫(yī)療健康等方面。文檔君為大家搜集了一些典型的應(yīng)用場(chǎng)景。智能家居通感算一體化利用基站

發(fā)表于 01-18 16:12 ?1w次閱讀

存算一體芯片如何支持Transformer等不同模型？

后摩智能致力于打造通用人工智能芯片，自主研發(fā)的存算一體芯片在支持各類模型方面表現(xiàn)突出，包括YOLO系列網(wǎng)絡(luò)、BEV系列網(wǎng)絡(luò)、點(diǎn)云系列網(wǎng)絡(luò)等。

發(fā)表于 01-05 14:14 ?1227次閱讀

SRAM存算一體芯片的研究現(xiàn)狀和發(fā)展趨勢(shì)

人工智能時(shí)代對(duì)計(jì)算芯片的算力和能效都提出了極高要求。存算一體芯片技術(shù)被認(rèn)為是有望解決處理器芯片“存儲(chǔ)墻”瓶頸，大幅提升人工智能

發(fā)表于 01-02 11:02 ?2206次閱讀