0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過并行處理和異構(gòu)SoC超越摩爾定律

星星科技指導員 ? 來源:嵌入式計算設(shè)計 ? 作者:Brandon Lewis ? 2022-07-10 10:24 ? 次閱讀

2021 年嵌入式處理器報告:隨著晶體管擴展的可靠每瓦性能增益接近尾聲,未來幾代處理器將如何訪問有效執(zhí)行要求苛刻的工作負載所需的計算?我的答案來自異構(gòu) SoC 上的并行處理。

“我們已經(jīng)在 7 nm 上工作了很長時間,在那段時間里,我們不僅看到了摩爾定律的終結(jié),而且還看到了阿姆達爾定律和丹納德縮放的終結(jié),”硅營銷總監(jiān) Manuel Uhm 說在賽靈思?!斑@意味著,如果我們所做的只是采用 FPGA 并將這些晶體管從我們之前的節(jié)點(即 16 納米)縮小到 7 納米,然后收工,許多試圖遷移完全相同的設(shè)計的客戶可能很可能最終得到的設(shè)計坦率地說沒有任何性能提升,實際上可能會增加功耗。

“很明顯,這是完全錯誤的方式?!?/p>

需要明確的是,將硅晶體管縮小到 7 nm 以下并非不可能;5nm 器件已經(jīng)投入生產(chǎn)。這是因為底層金屬沒有更快地運行,并且電流泄漏正在上升。

同時,在另一個方向上,傳統(tǒng)的多核設(shè)備自身也遇到了擴展限制。當然,這些并行處理器在歷史上一直是同質(zhì)的,“而現(xiàn)實情況是,沒有一個處理器架構(gòu)可以優(yōu)化地完成每項任務(wù),”Uhm 爭辯道?!安皇?FPGA,不是 CPU,不是 GPU?!?/p>

這并不是說并行性在處理現(xiàn)代應(yīng)用程序呈現(xiàn)的復雜處理任務(wù)方面沒有優(yōu)勢。事實上,除了摩爾定律和丹納德定標之外,并行計算可能是我們在高性能計算 (HPC) 和其他要求苛刻的用例中的最佳選擇。

是的,我們?nèi)匀恍枰⑿刑幚怼5珜儆诋愵悺?/p>

異構(gòu)處理:不僅適用于數(shù)據(jù)中心

如前所述,異構(gòu)并行處理技術(shù)的前沿是對高端應(yīng)用中性能壁壘的回應(yīng)。但這些架構(gòu)在嵌入式計算環(huán)境中也變得越來越普遍。

VDC Research 高級分析師 Dan Mandell 指出,雖然“許多異構(gòu)處理架構(gòu)確實專注于高端應(yīng)用,特別是數(shù)據(jù)中心和 HPC……FPGA SoC 和其他異構(gòu)加速芯片的小型化是最重要的。讓 Microsemi 和 Xilinx 等公司將更多此類設(shè)備帶入智能邊緣基礎(chǔ)設(shè)施,如邊緣/工業(yè)服務(wù)器和物聯(lián)網(wǎng)網(wǎng)關(guān)?!?/p>

根據(jù) Mandell 的說法,嵌入式市場中通用異構(gòu)計算平臺的一個關(guān)鍵驅(qū)動因素“是當今 OEM 和其他廠商硬件架構(gòu)的承諾猶豫不決?!?他說,這種猶豫是專用加速芯片快速發(fā)展的產(chǎn)物,以及未來幾年邊緣軟件和人工智能生態(tài)系統(tǒng)將產(chǎn)生的框架和工作負載的不確定性。

他預計所有這些情況都會“對未來的半導體采購產(chǎn)生重大影響”,以及芯片供應(yīng)商如何處理他們的處理器路線圖。

“當今大多數(shù) FPGA SoC 的價格和功率范圍將迫使供應(yīng)商最初專注于相對高端、資源豐富的嵌入式和邊緣應(yīng)用,”Mandell 假設(shè)?!叭欢诜e極努力使 FPGA SoC ‘尺寸不可知’,最終甚至支持電池供電的連接設(shè)備?!?/p>

因此,隨著異構(gòu)并行處理變得越來越多常見的問題是,嵌入式工程師是否應(yīng)該為系統(tǒng)設(shè)計的范式轉(zhuǎn)變做好準備?英偉達副總裁兼嵌入式與邊緣計算總經(jīng)理 Deepu Talla 不這么認為。

“如果你仔細想想,嵌入式處理器總是使用加速器,”Talla 說?!凹词乖?20 年前,也有 Arm CPU,有 DSP,然后在特定硬件中完成視頻編碼/解碼,對吧?它們在某種意義上是固定功能的,但它們都在并行處理事物。

“你需要這樣做的原因是成本、功率、尺寸,”他繼續(xù)說道。“并行處理器的效率比 CPU 高出幾個數(shù)量級?!?/p>

Nvidia 的 Xavier SoC 是其 Jetson Xavier 嵌入式平臺的核心設(shè)備,以及公司將于 2021 年底或 2022 年推出的下一代 Orin 架構(gòu),均配備 GPU、Arm CPU、深度學習加速器、視覺加速器、編碼器/解碼器和其他專門的處理模塊(圖 3)。

【圖3 | Nvidia Xavier SoC 配備了基于 Arm 的 Carmel CPU、Volta GPU、深度學習和視覺加速器以及其他可以并行處理工作負載的固定功能計算模塊。]

然而,隨著高級異構(gòu) SoC 變得越來越普遍,嵌入式開發(fā)人員可以期待的一個變化是使用片上網(wǎng)絡(luò) (NoC) 互連,在過去十年中,這種互連從傳統(tǒng)的片上總線(如 AMBA 接口)發(fā)展而來。這提供了“控制如何連接 CPU、GPU、視頻編碼器、深度學習加速器、顯示處理器、相機處理器、安全處理器,所有這些東西,”Talla 說。

NoC 有助于加速和優(yōu)化跨 SoC 的塊到塊的數(shù)據(jù)流,這有助于盡可能高效地執(zhí)行工作負載。例如,NXP 在其多功能 i.MX SoC 系列中利用了 NoC 和傳統(tǒng)總線架構(gòu)。

“異構(gòu)計算是我們多年來一直在實施的東西。NXP Semiconductors, Inc. 邊緣處理業(yè)務(wù)和技術(shù)戰(zhàn)略主管 Gowrishankar Chindalore 博士說,我相信現(xiàn)在是我們真正開始達到最佳使用點的地方。機器學習,因為我們今天使用的是 CPU、GPU、DSP 和神經(jīng)處理單元 (NPU)。

“但優(yōu)化的一部分,不僅僅是計算元素。系統(tǒng)周圍的一切都需要發(fā)生,”他繼續(xù)說道?!耙虼?,除了異構(gòu)計算之外,我們專注于提高效率的地方,正在關(guān)注芯片分割流水線、視頻流水線、圖形流水線中整個流程的浪費。

“因為我們做得越多,我們在性能方面獲得的效率就越高,顯然,用于執(zhí)行相同功能的能量就越少,”他補充道。

(編者按:閱讀《異構(gòu)多核實現(xiàn)十倍嵌入式內(nèi)存性能的三種方法》)

走向異質(zhì)世界

Mandell引用 VDC Research 的 2020 年物聯(lián)網(wǎng)、嵌入式和移動處理器技術(shù)報告,預計嵌入式 SoC 的全球市場將“在未來幾年繼續(xù)超過 MPU、MCU、GPU 等分立半導體的商業(yè)市場”,因為 OEM 看起來整合計算資源和多芯片實現(xiàn)。他說,從長遠來看,對工作負載加速和處理器優(yōu)化的需求只會“推動進一步增長”。

與此同時,我們衡量性能和功耗的方式將不得不改變。正如 The Linley Group 的高級分析師 Mike Demler 在其公司的《深度學習處理器指南》中所說,即使是像 TOPS/W 這樣的以 AI 為中心的新基準測試也“具有誤導性,因為真正的 AI 工作負載從未達到接近 100% 的利用率?!?/p>

他說,我們將不得不用“一個真實的工作負載,比如 Bert NLP 模型,而不是一個基于理論的、基于架構(gòu)的規(guī)范”來衡量諸如電源效率之類的東西。

但是,孤立地測量處理器復合體是否有意義?它真的很重要嗎?一如既往,重點將放在它在您的系統(tǒng)環(huán)境中提供的內(nèi)容上。

“在使用每個流程節(jié)點之前,就像‘哦,太好了。我得到兩倍的性能,一半的功耗!‘”Uhm 說?!澳切┤兆右呀?jīng)一去不復返了。那些日子對每個人來說都已經(jīng)一去不復返了。在 7 nm 時,這些晶體管現(xiàn)在開始泄漏。你只會遇到其他類型的問題在許多情況下,我們認為這是無法克服的。

“因此,在意識到這一點后,我們現(xiàn)在正在研究系統(tǒng)級問題,”他繼續(xù)說道,“我們將所有這些東西放在一起,了解所有這些權(quán)衡,并確保我們能夠涵蓋以允許滿足性能和功率預算的方式進行盡可能多的處理。再說一次,這些不再是容易的事情了。我們意識到我們將能夠提供更高的性能或降低功耗,在某些情況下它是非此即彼的。你會得到兩者并不總是給定的。

“再說一次,沒有任何處理器是最適合所有事情的。您不能總是提高性能并降低功耗,”Uhm 繼續(xù)說道?!暗珜W⒂谶@種新架構(gòu),一種異構(gòu)處理器,基本上可以讓他們做到這一點?!?/p>

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19038

    瀏覽量

    228478
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9582

    瀏覽量

    137471
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29383

    瀏覽量

    267679
收藏 人收藏

    評論

    相關(guān)推薦

    擊碎摩爾定律!英偉達和AMD將一年一款新品,均提及HBM和先進封裝

    增加一倍,性能也將提升一倍。過去很長一段時間,摩爾定律被認為是全球半導體產(chǎn)業(yè)進步的基石。如今,這一定律已經(jīng)逐漸失效,延續(xù)摩爾超越摩爾路線紛
    的頭像 發(fā)表于 06-04 00:06 ?3913次閱讀
    擊碎<b class='flag-5'>摩爾定律</b>!英偉達和AMD將一年一款新品,均提及HBM和先進封裝

    高算力AI芯片主張“超越摩爾”,Chiplet與先進封裝技術(shù)迎百家爭鳴時代

    越來越差。在這種情況下,超越摩爾逐漸成為打造高算力芯片的主流技術(shù)。 ? 超越摩爾是后摩爾定律時代三大技術(shù)路線之一,強調(diào)利用層堆疊和高速接口技
    的頭像 發(fā)表于 09-04 01:16 ?2831次閱讀
    高算力AI芯片主張“<b class='flag-5'>超越</b><b class='flag-5'>摩爾</b>”,Chiplet與先進封裝技術(shù)迎百家爭鳴時代

    “自我實現(xiàn)的預言”摩爾定律,如何繼續(xù)引領(lǐng)創(chuàng)新

    59年前,1965年4月19日,英特爾公司聯(lián)合創(chuàng)始人戈登·摩爾(Gordon Moore)應(yīng)邀在《電子》雜志上發(fā)表了一篇四頁短文,提出了我們今天熟知的摩爾定律(Moore’s Law)。 就像你為
    的頭像 發(fā)表于 07-05 15:02 ?219次閱讀

    封裝技術(shù)會成為摩爾定律的未來嗎?

    你可聽說過摩爾定律?在半導體這一領(lǐng)域,摩爾定律幾乎成了預測未來的神話。這條定律,最早是由英特爾聯(lián)合創(chuàng)始人戈登·摩爾于1965年提出,簡單地說就是這樣的:集成電路上可容納的晶體管數(shù)量大約
    的頭像 發(fā)表于 04-19 13:55 ?262次閱讀
    封裝技術(shù)會成為<b class='flag-5'>摩爾定律</b>的未來嗎?

    功能密度定律是否能替代摩爾定律?摩爾定律和功能密度定律比較

    眾所周知,隨著IC工藝的特征尺寸向5nm、3nm邁進,摩爾定律已經(jīng)要走到盡頭了,那么,有什么定律能接替摩爾定律呢?
    的頭像 發(fā)表于 02-21 09:46 ?557次閱讀
    功能密度<b class='flag-5'>定律</b>是否能替代<b class='flag-5'>摩爾定律</b>?<b class='flag-5'>摩爾定律</b>和功能密度<b class='flag-5'>定律</b>比較

    摩爾定律的終結(jié):芯片產(chǎn)業(yè)的下一個勝者法則是什么?

    在動態(tài)的半導體技術(shù)領(lǐng)域,圍繞摩爾定律的持續(xù)討論經(jīng)歷了顯著的演變,其中最突出的是 MonolithIC 3D 首席執(zhí)行官Zvi Or-Bach于2014 年的主張。
    的頭像 發(fā)表于 01-25 14:45 ?958次閱讀
    <b class='flag-5'>摩爾定律</b>的終結(jié):芯片產(chǎn)業(yè)的下一個勝者法則是什么?

    中國團隊公開“Big Chip”架構(gòu)能終結(jié)摩爾定律?

    摩爾定律的終結(jié)——真正的摩爾定律,即晶體管隨著工藝的每次縮小而變得更便宜、更快——正在讓芯片制造商瘋狂。
    的頭像 發(fā)表于 01-09 10:16 ?723次閱讀
    中國團隊公開“Big Chip”架構(gòu)能終結(jié)<b class='flag-5'>摩爾定律</b>?

    英特爾CEO基辛格:摩爾定律放緩,仍能制造萬億晶體

    帕特·基辛格進一步預測,盡管摩爾定律顯著放緩,到2030年英特爾依然可以生產(chǎn)出包含1萬億個晶體管的芯片。這將主要依靠新 RibbonFET晶體管、PowerVIA電源傳輸、下一代工藝節(jié)點以及3D芯片堆疊等技術(shù)實現(xiàn)。目前單個封裝的最大芯片含有約1000億個晶體管。
    的頭像 發(fā)表于 12-26 15:07 ?588次閱讀

    英特爾CEO基辛格:摩爾定律仍具生命力,且仍在推動創(chuàng)新

    摩爾定律概念最早由英特爾聯(lián)合創(chuàng)始人戈登·摩爾在1970年提出,明確指出芯片晶體管數(shù)量每兩年翻一番。得益于新節(jié)點密度提升及大規(guī)模生產(chǎn)芯片的能力。
    的頭像 發(fā)表于 12-25 14:54 ?536次閱讀

    摩爾定律時代,Chiplet落地進展和重點企業(yè)布局

    如何超越摩爾定律,時代的定義也從摩爾定律時代過渡到了后摩爾定律時代。 后摩爾定律時代,先進封裝和Chiplet技術(shù)被寄予厚望。近日,由博聞創(chuàng)
    的頭像 發(fā)表于 12-21 00:30 ?1398次閱讀

    超越摩爾”新進展,2023 SITRI DAY發(fā)布“MEMS標準工藝模塊”和“90nm硅光集成工藝”

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)隨著摩爾定律的進一步發(fā)展,近些年半導體產(chǎn)業(yè)界一直都在探尋新路徑,以求在芯片設(shè)計上繼續(xù)保持高效、高速的發(fā)展。在后摩爾定律時代,“超越摩爾”(More tha
    的頭像 發(fā)表于 12-06 01:04 ?1874次閱讀
    “<b class='flag-5'>超越</b><b class='flag-5'>摩爾</b>”新進展,2023 SITRI DAY發(fā)布“MEMS標準工藝模塊”和“90nm硅光集成工藝”

    應(yīng)對傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線和集成的新方法

    應(yīng)對傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線和集成的新方法
    的頭像 發(fā)表于 12-05 15:32 ?494次閱讀
    應(yīng)對傳統(tǒng)<b class='flag-5'>摩爾定律</b>微縮挑戰(zhàn)需要芯片布線和集成的新方法

    奇異摩爾與潤欣科技加深戰(zhàn)略合作開創(chuàng)Chiplet及互聯(lián)芯粒未來

    模式的創(chuàng)新,就多種 Chiplet 互聯(lián)產(chǎn)品和互聯(lián)芯粒的應(yīng)用領(lǐng)域拓展合作空間。 在摩爾定律持續(xù)放緩與最大化計算資源需求的矛盾下,Chiplet 已成為當今克服摩爾定律與硅物理極限挑戰(zhàn)的核心戰(zhàn)術(shù)。Chiplet 作為一種互連技術(shù),其核心是對?
    的頭像 發(fā)表于 11-30 11:06 ?3063次閱讀

    摩爾定律不會死去!這項技術(shù)將成為摩爾定律的拐點

    因此,可以看出,為了延續(xù)摩爾定律,專家絞盡腦汁想盡各種辦法,包括改變半導體材料、改變整體結(jié)構(gòu)、引入新的工藝。但不可否認的是,摩爾定律在近幾年逐漸放緩。10nm、7nm、5nm……芯片制程節(jié)點越來越先進,芯片物理瓶頸也越來越難克服。
    的頭像 發(fā)表于 11-03 16:09 ?621次閱讀
    <b class='flag-5'>摩爾定律</b>不會死去!這項技術(shù)將成為<b class='flag-5'>摩爾定律</b>的拐點

    超越摩爾定律,下一代芯片如何創(chuàng)新?

    摩爾定律是指集成電路上可容納的晶體管數(shù)目,約每隔18-24個月便會增加一倍,而成本卻減半。這個定律描述了信息產(chǎn)業(yè)的發(fā)展速度和方向,但是隨著芯片的制造工藝接近物理極限,摩爾定律也面臨著瓶頸。為了
    的頭像 發(fā)表于 11-03 08:28 ?823次閱讀
    <b class='flag-5'>超越</b><b class='flag-5'>摩爾定律</b>,下一代芯片如何創(chuàng)新?