0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳細地剖析HPU和SOC的各種差異

sakobpqhz ? 來源:軟硬件融合 ? 2023-04-07 11:20 ? 次閱讀

我們介紹了一種新的處理器類型:超異構(gòu)處理器HPU,HPU可以理解成多種異構(gòu)融合而成的一種新型的計算架構(gòu)。

有很多朋友追問,HPU和SOC的區(qū)別在哪里? 今天這篇文章,我們詳細地剖析HPU和SOC的各種差異。希望通過這篇文章,讓更多的朋友認識HPU,也認識到HPU的重要價值。

01SOC和HPU綜合介紹

什么是SOC?SoC稱為系統(tǒng)級芯片,也稱為片上系統(tǒng)。狹義上講,SOC是將系統(tǒng)關(guān)鍵部件集成在一塊芯片上;從廣義上講, SOC是一個系統(tǒng),如果說中央處理器(CPU)是大腦,那么SOC就是包括大腦、心臟、眼睛和手的系統(tǒng)。

高通手機SOC處理器驍龍810芯片,可以看到此芯片主要包括:

通用CPU:ARM Cortex-A57和Cortex-A53,CPU主要用于運行Android智能手機操作系統(tǒng)以及APP程序;

特定場景處理器:Adreno 430 GPU、Hexagon DSP、ISP、多媒體處理器等,GPU主要用于3D游戲等場景,DSP主要用于傳感器算法處理;

特定功能子系統(tǒng):支持4G LTE通信基帶處理、GPS/北斗等的定位模塊等;

WiFi、USB、藍牙等連接模塊;

安全處理模塊;

其他一些外圍模塊。

8cac3d9c-d4f1-11ed-bfe3-dac502259ad0.png

超異構(gòu)計算,是把CPU同構(gòu)、GPU異構(gòu)、各種DSA異構(gòu)等多種異構(gòu)計算整合起來的計算架構(gòu)。超異構(gòu)處理器,則是在芯片層次實現(xiàn)超異構(gòu)計算架構(gòu)(言下之意是:超異構(gòu)也可以在板級的多芯片層次、多計算節(jié)點的集群層次,甚至數(shù)據(jù)中心等更高層次實現(xiàn))。

8cbd3192-d4f1-11ed-bfe3-dac502259ad0.png

目前,數(shù)據(jù)中心有三大芯片:CPU適合應(yīng)用層的工作,GPU適合業(yè)務(wù)的彈性加速,DPU適合基礎(chǔ)設(shè)施層工作任務(wù)的加速處理。從功能視角看,HPU可以當做CPU、GPU和DPU三大功能芯片的融合體。

從馮諾依曼架構(gòu)我們可以得知,計算機的五個組件是輸入設(shè)備、輸出設(shè)備、控制器、運算器和內(nèi)存。

在現(xiàn)代計算機里,通常劃歸為三個組件:

處理器,包含控制器和運算器;

內(nèi)存,跟馮諾依曼架構(gòu)一致;

輸入輸出I/O設(shè)備,輸入輸出都是和外部的通信,把輸入輸出合并為一類設(shè)備。

不同的芯片類型,都是由上述這三類組件組成。其內(nèi)存和I/O設(shè)備沒有本質(zhì)的區(qū)別,核心的區(qū)別則在于處理器部分:

CPU芯片,其內(nèi)部處理器核都是CPU核。

GPU芯片,其內(nèi)部處理器核則是數(shù)億千計的高效能的小CPU核。也因此,GPU本質(zhì)上是眾核并行計算平臺。

各類DSA芯片,內(nèi)部主要是DSA加速處理器核。

SOC包含CPU、GPU、ISP等各種偏ASIC級別的加速處理器核。

HPU有CPU、GPU、各類DSA等加速處理器核。

從SOC的定義來說,超異構(gòu)處理器也可以歸屬到SOC的范疇。但如果只是稱之為SOC,那無法體現(xiàn)超異構(gòu)處理器和傳統(tǒng)SOC的本質(zhì)區(qū)別。

這樣,不利于我們深刻認識超異構(gòu)處理器的創(chuàng)新價值和重要性所在,以及在支撐超異構(gòu)處理器需要的創(chuàng)新技術(shù)和架構(gòu)方面積極地投入更多的資源。

02區(qū)別1:單系統(tǒng) vs 分布式混合多系統(tǒng)

8ccb3ae4-d4f1-11ed-bfe3-dac502259ad0.png

SOC,顧名思義,系統(tǒng)在芯片上。也即針對一個場景的系統(tǒng),設(shè)計一款芯片。系統(tǒng)和芯片是完全匹配的一對一的關(guān)系。因為系統(tǒng)多種多樣,這也意味著SOC的類型會非常地多。

而HPU則定位基礎(chǔ)的通用處理器,針對的是宏觀的綜合的計算系統(tǒng)和任務(wù),不針對任何具體的特定的系統(tǒng)和任務(wù)。也因此,HPU計算的特征表現(xiàn)在:

HPU通常通過集群協(xié)作來完成任務(wù);

單個HPU硬件上會運行多個不同的軟件系統(tǒng)和任務(wù);

多個宏觀的分布式大系統(tǒng),混合交叉地運行在多個HPU上。

03區(qū)別2:弱虛擬化 vs 硬件原生虛擬化

虛擬化是HPU和SOC最核心的能力區(qū)別。

SOC因為面向單個系統(tǒng),通常不需要支持虛擬化。有的SOC中的CPU核支持虛擬化,但虛擬化的性能損耗較高;并且僅只有CPU支持虛擬化。其他內(nèi)存、加速器和I/O則不支持虛擬化。

而HPU則不僅僅需要CPU、內(nèi)存的完全硬件虛擬化,其他I/O和加速卡也需要實現(xiàn)完全的硬件虛擬化。

需要強調(diào)的是,I/O虛擬化不僅僅指的是如PCIE SR-IOV或S-IOV的I/O接口的虛擬化,更要實現(xiàn)I/O內(nèi)部處理引擎的虛擬化。

8cddcc90-d4f1-11ed-bfe3-dac502259ad0.png

以汽車芯片為例,汽車EE架構(gòu)目前在經(jīng)歷顛覆性的變化,即從傳統(tǒng)ECU、DCU的架構(gòu)向CCU(Central Control Unit,中央控制器)的架構(gòu)轉(zhuǎn)變。

多域融合的自動駕駛CCU芯片,跟DCU最鮮明的區(qū)別就在于,是否支持虛擬化。在CCU里,每一個VM相當于傳統(tǒng)的一個DCU SOC系統(tǒng)。

04區(qū)別3:軟硬件一體 vs 軟硬件分離

8cfc1538-d4f1-11ed-bfe3-dac502259ad0.png

SOC中的軟件通常附著于硬件之上,兩者是匹配的關(guān)系。我們可以根據(jù)硬件的架構(gòu)/接口,定制開發(fā)特定的軟件;也可以通過HAL層,適配標準的軟件和不同的硬件接口。

HPU的要求就要更高很多。HPU上的軟件和硬件沒有直接的關(guān)系。軟件可以運行在硬件A,也可以運行在硬件B,也可以運行在任何其他硬件之上。

反過來,硬件也可以運行任意可能的軟件。軟件在不同硬件資源上的運行和遷移是完全動態(tài)的,并且從宏觀角度看,是非常頻繁的。

通常,可以通過虛擬化實現(xiàn)硬件接口的屏蔽,給軟件提供標準化的硬件,這樣可以方便實現(xiàn)軟件VM/容器的遷移。

但隨著性能的要求越來越高,虛擬化逐漸卸載到了硬件。

VM/容器需要通過直通的方式直面硬件接口。虛擬化完全卸載到硬件加速的情況下,需要硬件提供完全一致性的接口/架構(gòu)。

05區(qū)別4:控制驅(qū)動 vs 數(shù)據(jù)驅(qū)動

8d0e3d4e-d4f1-11ed-bfe3-dac502259ad0.png

在以前,更多的計算量,更少的數(shù)據(jù)量,因此以CPU單位代表的數(shù)據(jù)流驅(qū)動計算的架構(gòu)是主要的模式。如今,大數(shù)據(jù)計算時代,計算的特征變成“大數(shù)據(jù)量小計算量”(小計算量是相對的說法)的模式,因此,數(shù)據(jù)流驅(qū)動計算的架構(gòu)變成算力的主力擔當。

SOC里,是以CPU為中心的架構(gòu)。主要是依靠嵌入式CPU核中的軟件來驅(qū)動整個SOC的工作運轉(zhuǎn)。而在HPU里,則以數(shù)據(jù)為中心,主要依靠數(shù)據(jù)的流動來驅(qū)動計算的運轉(zhuǎn)。

需要強調(diào)的是,在一些觀點里,大家認為:以DPU為中心的計算架構(gòu),就“天然”是以數(shù)據(jù)為中心的計算。

這個論斷不完全正確的。以DPU為中心的架構(gòu),依然是以CPU控制驅(qū)動整個板級系統(tǒng)運轉(zhuǎn)的系統(tǒng)架構(gòu),也即是以CPU控制為中心的架構(gòu)。

要真正實現(xiàn)以數(shù)據(jù)驅(qū)動為中心的計算架構(gòu),需要在底層軟硬件上做非常大的調(diào)整。難度很高,工作量很大。

06區(qū)別5:軟件的多異構(gòu)協(xié)同

vs 硬件的多異構(gòu)融合

8d224366-d4f1-11ed-bfe3-dac502259ad0.png

SOC和HPU都是多異構(gòu)組成的混合計算,區(qū)別在于,SOC僅僅是異構(gòu)的集成,而HPU則需要實現(xiàn)異構(gòu)的融合。

在SOC系統(tǒng)里,每個加速單元可以看作是CPU+加速單元組成一個異構(gòu)子系統(tǒng);不同的異構(gòu)子系統(tǒng)之間在硬件上是沒有關(guān)聯(lián)的,需要通過軟件構(gòu)建異構(gòu)子系統(tǒng)之間的交互和協(xié)同。

在CPU性能逐漸瓶頸的當下,這通常也意味著性能的約束。

而在HPU里,需要實現(xiàn)硬件層次的不同加速單元之間的直接的、高效的數(shù)據(jù)交互,不需要嵌入式CPU的參與。這樣,在硬件層次,就實現(xiàn)了CPU、GPU以及各種其他加速單元之間的對等的深度交互、協(xié)同和融合。

07區(qū)別6:軟件可編程

vs 多層次可編程

8d3499a8-d4f1-11ed-bfe3-dac502259ad0.png

SOC里,其他加速器通常是ASIC層次的,只能施加一些簡單的控制,整個數(shù)據(jù)面的業(yè)務(wù)邏輯功能是完全確定的,無法軟件編程。

在SOC里,能支持軟件編程的通常只有嵌入式CPU。

而在HPU里,可編程能力要更加豐富一些:

DSA可編程:在每個計算節(jié)點都存在,性能敏感,并且功能邏輯不經(jīng)常變化的工作任務(wù),可以劃歸到基礎(chǔ)設(shè)施層。適合DSA加速處理。

GPU可編程:這里的GPU特指支持并行計算編程,甚至AI編程,的GPGPU;不是只有圖形加速功能的經(jīng)典GPU。

CPU可編程:跟SOC中的CPU一樣,支持CPU的完全軟件可編程。

08區(qū)別7:資源確定 vs 資源彈性可擴展

CPU是支持資源(動態(tài)的)可擴展能力的:通過時間片把單個CPU核劃分成千份萬份;

再通過同構(gòu)并行把幾十個CPU核連成一個大的CPU計算資源組;

還可以通過UPI甚至一致性網(wǎng)絡(luò)的方式實現(xiàn)多個CPU芯片的資源擴展。

在SOC內(nèi)部,除了CPU可以支持可擴展外,其他模塊基本上都是性能確定的設(shè)計,無法支持資源的擴展能力。

在HPU里,每個計算資源,甚至I/O資源,都需要像CPU一樣,支持多個層次的資源可擴展能力。甚至可以實現(xiàn)數(shù)以萬計芯片集群的“幾乎無限”的資源擴展能力。

09區(qū)別8:定制Chiplet

vs 原生支持Chiplet

8d5f9ef0-d4f1-11ed-bfe3-dac502259ad0.png

當我們做SOC設(shè)計的時候,如果需要通過Chiplet優(yōu)化設(shè)計,通常需要針對性地設(shè)計若干個小芯粒。這些芯粒的功能不一樣,然后再把芯粒通過Chiplet連接并封裝成系統(tǒng)芯片。這種方式存在一些問題:

優(yōu)化的價值有限。一個是部分芯??梢允褂梅窍冗M工藝,降低成本;另一個是降低單DIE面積,優(yōu)化良品率。這樣提升的價值僅僅是百分比的提升。

復(fù)用性低。不同型號的芯粒DIE,非標準器件,本質(zhì)上增加了芯片集成的難度。

HPU采用資源彈性擴展的設(shè)計,可以實現(xiàn):單DIE HPU芯片,以及不同數(shù)量DIE通過Chiplet封裝的不同規(guī)格的HPU芯片。

10區(qū)別9:設(shè)計規(guī)模小

vs 設(shè)計規(guī)模數(shù)量級提升

8d70c75c-d4f1-11ed-bfe3-dac502259ad0.png

目前,隨著系統(tǒng)規(guī)模越來越大,單芯片設(shè)計規(guī)模也越來越大,但是傳統(tǒng)SOC架構(gòu)所能支撐的系統(tǒng)規(guī)模逐漸逼近上限。規(guī)模上限的意思指的是:

雖然工藝和封裝支持更大規(guī)模的芯片設(shè)計,但在傳統(tǒng)架構(gòu)下,突破了規(guī)模上限以后,整個系統(tǒng)的復(fù)雜度會急劇上升,很難駕馭;

并且,各種資源和性能的利用率會急劇下降,浪費嚴重,投入產(chǎn)出比不高,不夠經(jīng)濟。

隨著工藝持續(xù)優(yōu)化,以及Chiplet封裝的進步,單芯片的設(shè)計規(guī)模數(shù)量級提升。亟需一種創(chuàng)新的架構(gòu)來快速提升“可駕馭條件下”的系統(tǒng)規(guī)模。

SOC支持單系統(tǒng),HPU支持多系統(tǒng)。并且,HPU采用可擴展的分布式系統(tǒng)架構(gòu)設(shè)計,每個子系統(tǒng)相當于一個SOC系統(tǒng)。

HPU可駕馭的系統(tǒng)規(guī)??梢宰龅絊OC的10倍甚至100倍。

11區(qū)別10:專用 vs 通用

SOC是針對特定的場景,定制開發(fā)的芯片。

8d88552a-d4f1-11ed-bfe3-dac502259ad0.png

HPU面向的是通用的、綜合的復(fù)雜計算場景,定位在以不變應(yīng)萬變。目前,通用的計算架構(gòu)主要有三個:

CPU。CPU又稱GP-CPU,是通用的中央處理單元。CPU可以用在幾乎所有場景。

CPU+GPU。CPU性能不夠,GPU是眾核并行加速平臺,性能相比CPU數(shù)量級提升。因此可以把一些性能敏感的并且適合GPU并行計算的任務(wù)由GPU來完成,其他任務(wù)繼續(xù)放在CPU。

HPU(CPU+GPU+DSA的融合)。DSA性能效率比GPU要高,同等晶體管資源下,DSA相比GPU可以做到性能數(shù)量級提升。但DSA僅適合相對確定性的任務(wù)。

依據(jù)二八定律,80%計算通過DSA完成。然后再使用GPU進行剩余性能敏感并且適合并行計算的任務(wù)加速。剩余不適合加速的部分任務(wù),繼續(xù)放在CPU處理。

12總結(jié)

把上面十個方面的區(qū)別總結(jié)如下面表格所示。

8dac92a0-d4f1-11ed-bfe3-dac502259ad0.png

當然,這些是目前我們想到的并且重要的方面。還有很多其他方面的區(qū)別,無法一一列舉。功能上,HPU和SOC都是把很多功能集成在一起,有很多的相似性。但本質(zhì)上,兩者是完全不同的兩個產(chǎn)品定位和發(fā)展方向。

隨著對算力的需求持續(xù)不斷的提升,隨著算力網(wǎng)絡(luò)的不斷延伸。未來,幾乎所有的處理器都會成為類超異構(gòu)架構(gòu)的計算芯片,超異構(gòu)處理器會成為支撐宏觀算力的核心底座。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2542

    文章

    50300

    瀏覽量

    750275
  • dsp
    dsp
    +關(guān)注

    關(guān)注

    552

    文章

    7921

    瀏覽量

    347665
  • SoC芯片
    +關(guān)注

    關(guān)注

    1

    文章

    592

    瀏覽量

    34809
  • Cortex-A57
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    9215
  • 異構(gòu)處理器
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    6440

原文標題:超異構(gòu)處理器HPU和系統(tǒng)級芯片SOC的區(qū)別在哪里?

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    新產(chǎn)品深究,智能手表系統(tǒng)設(shè)計剖析

    穿戴式電子,尤其是智慧型手表正逐漸受到重視,已經(jīng)有諸多國際大廠、新興業(yè)者投入發(fā)展,但目前仍在前期階段,因而百家爭鳴,各種設(shè)計方式、實現(xiàn)手法都有,且差異極大。對此,本文以處理器、儲存資源、電池、充電等設(shè)計方式來做一剖析。
    發(fā)表于 09-30 09:21 ?1669次閱讀

    C語言深度剖析

    C語言深度剖析——一本關(guān)于C語言學習的教程,里面包含C語言編寫規(guī)范,各種變量指針用法等。以含金量勇敢挑戰(zhàn)國內(nèi)外同類書籍
    發(fā)表于 08-14 11:36

    TMS320F28335 與TMS320F2812上電順序詳細剖析

    TMS320F28335 與TMS320F2812上電順序詳細剖析
    發(fā)表于 07-01 16:56

    深度剖析LED高壓燈帶跟LED低壓燈帶的差異

    `LED高壓燈帶又稱交流燈帶,低壓LED燈帶又稱直流燈帶,那么這兩種LED柔性燈帶有什么差異,兩者之間的優(yōu)劣勢究竟怎么樣該怎么挑選呢?下面鉦銘科剖析一下二者之間的差別。裝置:高壓LED燈條裝置
    發(fā)表于 03-30 11:25

    SoC FPGA有哪些作用?

     Altera公司意欲通過更先進的制程工藝和更緊密的產(chǎn)業(yè)合作,正逐步強化FPGA協(xié)同處理器,大幅提升SoC FPGA的整體性能,為搶攻嵌入式系統(tǒng)市場版圖創(chuàng)造更大的差異化優(yōu)勢。隨著SoC FPGA在
    發(fā)表于 08-26 07:15

    求大神詳細剖析GM的VOLT車

    求大神詳細剖析GM的VOLT車
    發(fā)表于 05-18 06:14

    萌新求助,求ARM內(nèi)核架構(gòu)和SOC架構(gòu)的詳細資料

    萌新求助,求ARM內(nèi)核架構(gòu)和SOC架構(gòu)的詳細資料
    發(fā)表于 10-25 06:12

    STM32的三種Boot模式有何差異

    STM32的三種Boot模式有何差異呢?如何去驗證這種差異呢?
    發(fā)表于 11-26 07:15

    各種差動放大電路圖

    各種差動放大電路圖
    發(fā)表于 08-04 10:45 ?1176次閱讀
    <b class='flag-5'>各種差</b>動放大電路圖

    深入剖析火花塞

    本文將深入剖析火花塞,詳細介紹火花塞作用與結(jié)構(gòu),熱值與間隙,電極類型與材料,沿面點火及故障現(xiàn)象分析。
    發(fā)表于 01-17 16:27 ?2261次閱讀

    各種光纜的詳細型號資料說明免費下載

    本文檔的主要內(nèi)容詳細介紹的是各種光纜的詳細型號資料說明免費下載
    發(fā)表于 01-07 08:00 ?7次下載
    <b class='flag-5'>各種</b>光纜的<b class='flag-5'>詳細</b>型號資料說明免費下載

    SoC功耗是一個關(guān)鍵的差異化功能

    SoC功耗是一個關(guān)鍵的差異化功能。設(shè)計的初始估計功率通常小于硅上的功耗。這是因為沒有可用的功率估計流可以準確地將功率估計結(jié)果與硅結(jié)果相關(guān)聯(lián)。此外,對于涉及許多新設(shè)計功能的部件和IP塊,確切的門數(shù)詳細信息很難在流程的早期預(yù)測。
    的頭像 發(fā)表于 08-12 10:20 ?3242次閱讀
    <b class='flag-5'>SoC</b>功耗是一個關(guān)鍵的<b class='flag-5'>差異</b>化功能

    CNC和PLC之間的各種硬件差異

    本文討論了CNC和PLC之間的各種硬件差異。目的不是斷言不可能在控制器之間進行轉(zhuǎn)換,而是解釋為了使機器正常運行必須解決的各種元素。
    的頭像 發(fā)表于 04-29 15:54 ?3956次閱讀

    詳細剖析HPUSOC各種差異

    什么是SOC?SoC稱為系統(tǒng)級芯片,也稱為片上系統(tǒng)。
    的頭像 發(fā)表于 06-28 15:44 ?1803次閱讀
    <b class='flag-5'>詳細</b>地<b class='flag-5'>剖析</b><b class='flag-5'>HPU</b>和<b class='flag-5'>SOC</b>的<b class='flag-5'>各種差異</b>

    SoC布局中各種IC簡介

    。SoC各種IP簡介IP核(IntellectualPropertyCore),即知識產(chǎn)權(quán)核,在集成電路設(shè)計行業(yè)中指已驗證、可重復(fù)利用、具有某種確定功能的芯片設(shè)
    的頭像 發(fā)表于 07-17 08:28 ?262次閱讀
    <b class='flag-5'>SoC</b>布局中<b class='flag-5'>各種</b>IC簡介