国色天香最新视频在线观看,国产精品成人∨a在线观看 ,91桃色短视频APP

算力是數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力，并且近年來需求劇增。而我國(guó)當(dāng)前的算力供給上仍面臨巨大的挑戰(zhàn)，一方面，國(guó)外的高端算力芯片被美國(guó)禁售，另一方面，國(guó)內(nèi)的芯片產(chǎn)業(yè)仍處于發(fā)展階段[1]。如何獲取算力提升，成為當(dāng)前時(shí)代芯片研究的重要命題。

一．算力突破

研究如何獲取算力提升，要從算力的來源上考慮。芯片算力可大致總結(jié)為以下計(jì)算公式：

因此，獲取算力提升的主要切入點(diǎn)是晶體管密度、芯片面積、單位晶體管的算力，這三個(gè)方面分別主要涉及制作工藝、光刻口徑、計(jì)算架構(gòu)。

（1）晶體管密度：

晶體管密度的主要影響因素是制造工藝、基板材料，同樣的面積內(nèi)，封裝的可用晶體管越多，就能提供越強(qiáng)的算力。

制造工藝方面，受限于美國(guó)的無理封鎖，當(dāng)前國(guó)內(nèi)量產(chǎn)芯片的最先進(jìn)制造工藝為14nm，國(guó)際上量產(chǎn)芯片最先進(jìn)的制造工藝為3nm。清華大學(xué)尹首一教授認(rèn)為，國(guó)內(nèi)芯片制造工藝將長(zhǎng)期處于在14nm，國(guó)內(nèi)芯片產(chǎn)業(yè)與研究不能指望通過制造工藝獲得性能提升。在國(guó)際領(lǐng)域，雖然芯片制造商仍能享受到制程工藝帶來的升級(jí)，但從蘋果A17Pro芯片的性能表現(xiàn)、高通仍然采用基于4nm的升級(jí)工藝制造今年旗艦芯片的市場(chǎng)行為來看，產(chǎn)業(yè)界最先進(jìn)的工藝制程已經(jīng)不及預(yù)期。

基板材料方面，隨著制造工藝步入埃米級(jí)別，芯片制造工藝受到硅原子性質(zhì)的影響越來越大，產(chǎn)業(yè)界和學(xué)界也在探索新的材料用于制造芯片，通過“彎道超車”的方式提升晶體管密度，比如英特爾等廠商正在研發(fā)的玻璃基芯片[3]、北京大學(xué)彭練矛教授團(tuán)隊(duì)正在研發(fā)的碳基芯片[4]。

（2）芯片面積

芯片面積和晶體管密度考慮的是類似的問題，在一顆芯片內(nèi)提供更多的可用晶體管，就意味著能提供更多的算力。但是在當(dāng)前，GPU的單芯片面積基本已經(jīng)達(dá)到上限，想通過面積獲得進(jìn)一步的算力提升，可以從拓展角度考慮，有兩個(gè)探索的方向：平面拓展和垂直拓展。

平面拓展就是在光刻時(shí)使用光照拼接技術(shù)，實(shí)現(xiàn)兩個(gè)曝光區(qū)域的物理連接，來把芯片做大，通過計(jì)算架構(gòu)的優(yōu)化設(shè)計(jì)，保證晶圓中晶體管的可用性，Cerebras公司和Tesla公司已經(jīng)實(shí)現(xiàn)了晶圓級(jí)芯片。垂直拓展就是把芯片或其中的部分器件三維堆疊起來，如AMD的3D緩存技術(shù)。

（3）單位晶體管提供的算力：

單位晶體管提供的算力和計(jì)算架構(gòu)息息相關(guān)，計(jì)算架構(gòu)的優(yōu)化改進(jìn)或使用新的計(jì)算架構(gòu)，能夠?qū)π酒懔Ξa(chǎn)生更根本的影響。計(jì)算架構(gòu)上面臨的主要問題有：基本器件的設(shè)計(jì)架構(gòu)不同導(dǎo)致的晶體管數(shù)量不同，需要探索更優(yōu)的基本器件結(jié)構(gòu)設(shè)計(jì)；馮諾依曼架構(gòu)的“存儲(chǔ)墻”導(dǎo)致的訪存瓶頸，限制了算力的發(fā)揮，需要降低帶寬對(duì)算力的限制；功耗限制導(dǎo)致的darkselect問題，即為了保證芯片功耗，不能同時(shí)點(diǎn)亮芯片上的所有晶體管，需要優(yōu)化設(shè)計(jì)來避免。

面對(duì)以上的部分問題，產(chǎn)業(yè)界和學(xué)界已經(jīng)給出了相應(yīng)的解決方案。在計(jì)算架構(gòu)的優(yōu)化方面，有數(shù)據(jù)流、可重構(gòu)、存算一體三條路徑。首先，數(shù)據(jù)流芯片嘗試不使用指令而是直接通過數(shù)據(jù)驅(qū)動(dòng)計(jì)算，避免外部存儲(chǔ)訪問，來解決晶體管利用率低的問題。Google的TPU芯片已經(jīng)證明了，這種方式雖然在單芯片性能上遜于GPU，但能在系統(tǒng)級(jí)算力上實(shí)現(xiàn)超越[1]。具體來講，單核TPU v4的性能是低于A100 GPU的，只有它的88%，但1024顆TPU v4的集群性能，超過了A100 GPU的集群性能，最高達(dá)到了1.96倍。4096顆TPUv4芯片示意圖如下圖3所示。

圖 34096顆TPUv4芯片集成[6]

可重構(gòu)芯片嘗試在芯片內(nèi)布設(shè)可編程的計(jì)算資源，根據(jù)計(jì)算任務(wù)的數(shù)據(jù)流特點(diǎn)，動(dòng)態(tài)構(gòu)造出最適合的計(jì)算架構(gòu)，國(guó)內(nèi)團(tuán)隊(duì)設(shè)計(jì)并在12nm工藝下制造的CGRA芯片，已經(jīng)在標(biāo)準(zhǔn)測(cè)試集上實(shí)現(xiàn)了和7nm的GPU基本相當(dāng)?shù)男阅?。存算一體嘗試通過集成存儲(chǔ)和計(jì)算在一個(gè)芯片甚至一個(gè)容器內(nèi)，來突破訪存限制，發(fā)揮芯片的最大算力。下面我們將重點(diǎn)介紹存算一體技術(shù)。

二．存算一體

存算一體是一種新型計(jì)算架構(gòu)，直接利用存儲(chǔ)器本身進(jìn)行數(shù)據(jù)處理，從根本上消除數(shù)據(jù)搬運(yùn)，實(shí)現(xiàn)存儲(chǔ)與計(jì)算融合一體化，成為后摩爾時(shí)代集成電路領(lǐng)域的重點(diǎn)研究方向之一。

（1）存算一體技術(shù)優(yōu)勢(shì)：

存算一體技術(shù)具有很大的優(yōu)勢(shì)，存算融合的特點(diǎn)使其天然具備較大算力、低延遲、高帶寬等優(yōu)勢(shì)。相比傳統(tǒng)架構(gòu)，存算一體大算力芯片不僅僅是能效比有數(shù)量級(jí)的提升，更重要的是將大大緩解存儲(chǔ)墻問題，簡(jiǎn)化AI服務(wù)器集群的互聯(lián)網(wǎng)絡(luò)及其管理和各類成本，包括高速互聯(lián)、DPU和能耗等。因此，存算一體技術(shù)是實(shí)現(xiàn)芯片算力突破的重要途徑，可助力實(shí)現(xiàn)28nm等效7nm功效。

（2）傳統(tǒng)工藝芯片算力提升實(shí)例：

目前已有一些企業(yè)和高校，通過存算一體技術(shù)，實(shí)現(xiàn)28nm制程芯片的能效算力提升。

憶鑄科技于2021年10月于上海成立，是一家基于ReRAM設(shè)計(jì)和落地?cái)?shù)字存算一體芯片的企業(yè)。在公司的技術(shù)暢想中，他們嘗試將新型憶阻器、存算一體架構(gòu)、Chiplet技術(shù)、3D封裝等技術(shù)結(jié)合，實(shí)現(xiàn)大算力、高能效比的芯片。據(jù)其官網(wǎng)信息，億鑄第一代算力芯片采用的工藝為28nm，其能效比可以實(shí)現(xiàn)目前主流算力板卡的10倍以上[7]。

2023年8月29日，華為的麒麟9000s芯片隨著Mate 60 Pro成功發(fā)布，該款芯片一經(jīng)發(fā)出，就引發(fā)業(yè)界討論：“麒麟9000s的工藝制程究竟是多少？”在2023年中國(guó)集成電路設(shè)計(jì)業(yè)（ICCAD）年會(huì)上，清華大學(xué)魏少軍教授在演講中提出：“能夠用14nm，甚至28nm做成7nm的產(chǎn)品性能才是真正的高手”。據(jù)悉，華為并未公布麒麟9000s真正的工藝制程，知名科技解析機(jī)構(gòu)TechInsights對(duì)麒麟9000s深入解析結(jié)果顯示，該芯片確實(shí)擁有7nm工藝制程的特性。

圖 4 華為麒麟9000s芯片

知存科技的WTM2101量產(chǎn)芯片采用40nm制程，將神經(jīng)網(wǎng)絡(luò)部署在芯片中，已經(jīng)實(shí)現(xiàn)了滿足端側(cè)算力需求的語音識(shí)別等功能。即將量產(chǎn)的WTM8芯片，采用28nm制程，作為新一代存內(nèi)AI計(jì)算視覺芯片，能夠?qū)崿F(xiàn)圖像的AI超分、插幀、HDR識(shí)別和檢測(cè)這樣復(fù)雜的功能[8]，現(xiàn)有的一些研究也已經(jīng)證明存算一體可以實(shí)現(xiàn)16bit、32bit的浮點(diǎn)計(jì)算，具備進(jìn)入高算力芯片的能力。

圖 5知存科技WTM-8系列芯片示意圖

三．未來展望

隨著工藝的進(jìn)步，先進(jìn)工藝制程已從28nm發(fā)展至3nm，蘋果新發(fā)布的A17Pro已采用了tsmc 3nm工藝。據(jù)悉，tsmc也將投資近萬億新臺(tái)幣建造1nm晶圓廠。在未來，有沒有一種全新的方案解決算力不足、工藝制程發(fā)展空間受限的局面？存算一體便是答案之一。

綜上所述，存算一體技術(shù)因?yàn)槠涮厥鈨?yōu)勢(shì)，可以大大提升芯片算力，從而使得成熟28nm制程芯片能夠?qū)崿F(xiàn)等效于7nm制程芯片的性能。當(dāng)然這其中還有很多難點(diǎn)需要突破，需要科研工作著的不斷努力，期待未來基于存算一體技術(shù)的芯片可以更好地突破芯片制程的限制。

參考資料

[1] 尹首一教授報(bào)告：以“架構(gòu)”創(chuàng)新，突破算力卡脖子問題.

[2] 極客灣 space.bilibili.com/25876945.

[3] 第八屆未來芯片論壇中英特爾中國(guó)研究院的報(bào)告.

[4] 北京大學(xué)新聞網(wǎng)：專訪北大碳基芯片團(tuán)隊(duì)：我們換道走了20年，覺得能走下去（news.pku.edu.cn）.

[5] AMD官網(wǎng) amd.com.

[6] Jouppi N, Kurian G, Li S, et al. Tpu v4: An optically reconfigurable supercomputer for machine learning with hardware support for embeddings[C]//Proceedings of the 50th Annual International Symposium on Computer Architecture. 2023: 1-14.

[7] 憶鑄科技官網(wǎng) （yizhu-tech.com）.

[8] 知存科技官網(wǎng)（witintech.com）.

[9] 從7nm到5nm，半導(dǎo)體制程 - 吳建明wujianming - 知乎（zhuanlan.zhihu.com/）.

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

芯片

芯片

+關(guān)注

關(guān)注
452

文章
49938

瀏覽量
419595
AI

AI

+關(guān)注

關(guān)注
87

文章
29359

瀏覽量
267635
芯片制程

芯片制程

+關(guān)注

關(guān)注
0

文章
51

瀏覽量
4647
算力

算力

+關(guān)注

關(guān)注
1

文章
867

瀏覽量
14649
存內(nèi)計(jì)算

存內(nèi)計(jì)算

+關(guān)注

關(guān)注
0

文章
28

瀏覽量
1355

評(píng)論

相關(guān)推薦

Altera 28nm FPGA助力NEC提升LTE基站性能

Altera的28nm FPGA所具有的靈活性和性能指標(biāo)滿足了下一代基站各種LTE系統(tǒng)級(jí)特性的需求，而且沒有犧牲功效。近日Altera宣布NEC將使用其28nm FPGA，助力提高其L

發(fā)表于 11-19 09:09 ?815次閱讀

什么是Altera最新28nm FPGA技術(shù)？

1月22日，Altera 在北京展示了號(hào)稱業(yè)界最全面的28nm 最新技術(shù)及強(qiáng)大解決方案。Altera公司的多位工程師為在京的媒體人士進(jìn)行了講解。

發(fā)表于 08-21 07:37

如何利用28nm高端FPGA實(shí)現(xiàn)功耗和性能的平衡？

　從工藝選擇到設(shè)計(jì)直至投產(chǎn)，設(shè)計(jì)人員關(guān)注的重點(diǎn)是以盡可能低的功耗獲得最佳性能。Altera在功耗和性能上的不斷創(chuàng)新，那其28nm高端FPGA如何實(shí)現(xiàn)功耗和性能的平衡？具體有何優(yōu)勢(shì)？　

發(fā)表于 09-17 08:18

10nm、7nm等制程到底是指什么？宏旺半導(dǎo)體和你聊聊

隨著半導(dǎo)體產(chǎn)業(yè)技術(shù)的不斷發(fā)展，芯片制程工藝已從90nm、65nm、45nm、32nm、22nm、14nm

發(fā)表于 12-10 14:38

請(qǐng)問C2000系列產(chǎn)品的制程是45nm還是28nm？

請(qǐng)問工程師，C2000系列產(chǎn)品的制程是45nm還是28nm？同一款新片可能采用不同的制程生產(chǎn)嗎？

發(fā)表于 06-17 14:41

Fusion Design Platform?已實(shí)現(xiàn)重大7nm工藝?yán)锍瘫?/a>

? 在設(shè)計(jì)人員的推動(dòng)下，加快部署7nm Fusion Design Platform，在具有挑戰(zhàn)性的設(shè)計(jì)方面，不僅設(shè)計(jì)實(shí)現(xiàn)質(zhì)量提升了20%，設(shè)計(jì)收斂速度也提高了兩倍多。? Fusion Design

發(fā)表于 10-22 09:40

請(qǐng)大神解釋一下28nm下是沒有MIM電容了嗎？

之前只用過tsmc 65nm的，在設(shè)置電感時(shí)候是有indcutor finder的工具的，28nm下沒有了嗎？只能自己掃描參數(shù)一個(gè)一個(gè)試？28nm下是沒有MIM電容了嗎？相關(guān)的模擬射頻器件（比如

發(fā)表于 06-24 06:18

求一份tsmc 7nm standard cell library

求一份tsmc 7nm standard cell library求一份28nm或者40nm 的數(shù)字庫

發(fā)表于 06-25 06:39

從7nm到5nm，半導(dǎo)體制程精選資料分享

從7nm到5nm，半導(dǎo)體制程芯片的制造工藝常常用XXnm來表示，比如Intel最新的六代酷睿系列CPU就采用Intel自家的14nm++制造工藝。所謂的XXnm指的是集成電路的MOSFET晶體管柵極

發(fā)表于 07-29 07:19

28nm Stratix V FPGA突破帶寬瓶頸

28nm Stratix V FPGA突破帶寬瓶頸 Altera公司的最新28nm Stratix V FPGA正是為滿足高帶寬應(yīng)用設(shè)計(jì)要求而推出。移動(dòng)互聯(lián)網(wǎng)、高清視頻、軍事、醫(yī)療以及計(jì)算

發(fā)表于 05-10 17:52 ?772次閱讀

降低賽靈思28nm 7系列FPGA的功耗

本白皮書介紹了有關(guān)賽靈思 28 nm 7 系列 FPGA 功耗的幾個(gè)方面，其中包括臺(tái)積電 28nm高介電層金屬閘 (HKMG) 高性能低功耗（28n

發(fā)表于 03-07 14:43 ?41次下載

半導(dǎo)體制程發(fā)展：28nm向3nm的“大躍進(jìn)”

雖然高端市場(chǎng)會(huì)被 7nm、10nm以及14nm/16nm工藝占據(jù)，但40nm、28nm等并不會(huì)退

發(fā)表于 10-15 11:18 ?5047次閱讀

22nm和28nm芯片性能差異

據(jù)芯片行業(yè)來看，目前22nm和28nm的芯片工藝技術(shù)已經(jīng)相當(dāng)成熟了，很多廠商也使用22nm、28nm的芯片居多，主要原因就是價(jià)格便宜，那么這兩個(gè)芯片之間有什么性能差異呢？

發(fā)表于 06-29 09:47 ?9530次閱讀

7nm芯片和5nm芯片哪個(gè)好

7nm芯片和5nm芯片的區(qū)別在哪？7nm芯片和5nm芯片哪個(gè)好？在其他變量恒定的情況下，5nm芯片肯定要強(qiáng)于

發(fā)表于 07-05 09:26 ?2.3w次閱讀

所謂的7nm芯片上沒有一個(gè)圖形是7nm的

最近網(wǎng)上因?yàn)楣饪虣C(jī)的事情，網(wǎng)上又是一陣熱鬧。好多人又開始討論起28nm/7nm的事情了有意無意之間，我也看了不少網(wǎng)上關(guān)于國(guó)產(chǎn)自主7nm工藝的文章。不過這些文章里更多是抒情和遐想，卻很少有人針對(duì)技術(shù)

發(fā)表于 10-08 17:12 ?115次閱讀

搜索歷史

存內(nèi)計(jì)算——助力實(shí)現(xiàn)28nm等效7nm功效

評(píng)論

Altera 28nm FPGA助力NEC提升LTE基站性能

什么是Altera最新28nm FPGA技術(shù)？

如何利用28nm高端FPGA實(shí)現(xiàn)功耗和性能的平衡？

10nm、7nm等制程到底是指什么？宏旺半導(dǎo)體和你聊聊

請(qǐng)問C2000系列產(chǎn)品的制程是45nm還是28nm？

Fusion Design Platform?已實(shí)現(xiàn)重大7nm工藝?yán)锍瘫?/a>

請(qǐng)大神解釋一下28nm下是沒有MIM電容了嗎？

求一份tsmc 7nm standard cell library

從7nm到5nm，半導(dǎo)體制程精選資料分享

28nm Stratix V FPGA突破帶寬瓶頸

降低賽靈思28nm 7系列FPGA的功耗

半導(dǎo)體制程發(fā)展：28nm向3nm的“大躍進(jìn)”

22nm和28nm芯片性能差異

7nm芯片和5nm芯片哪個(gè)好

所謂的7nm芯片上沒有一個(gè)圖形是7nm的