0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DPU特征結(jié)構(gòu)系列(一)DPU是以數(shù)據(jù)為中心IO密集的專用處理器

中科馭數(shù)(北京)科技有限公司 ? 2022-04-27 14:41 ? 次閱讀

從應用特征來看,可以把應用分為“IO密集型”和“計算密集型”兩類,如下圖所示。IO密集型應用,通常體現(xiàn)為較高的輸入和輸出帶寬,數(shù)據(jù)直接來自于IO,數(shù)據(jù)通常具備流式特征,數(shù)據(jù)局部性不顯著,如果處理性能與帶寬匹配,片上緩存的作用就可以弱化。例如處理路由轉(zhuǎn)發(fā)、數(shù)據(jù)加密、壓縮等。計算密集型應用,體現(xiàn)為較高的計算密度,通常浮點性能突出,數(shù)據(jù)來自主存,數(shù)據(jù)局部性顯著,復用性高,主存的大小對于問題求解的性能有直接影響。例如求解線性代數(shù)方程組,大規(guī)模神經(jīng)網(wǎng)絡訓練、推理等。

pYYBAGJo3EOAddbKAAhA9nkSZ-c278.png

圖不同類型的處理器的特征結(jié)構(gòu)

一個處理器芯片是“IO密集”還是“計算密集”只部分決定了芯片的結(jié)構(gòu)特征,并不能完全定義芯片的主體架構(gòu)。無論是IO密集,還是計算密集,即可以以通用CPU為核心構(gòu)造主體計算架構(gòu),也可以以專用加速器為核心構(gòu)造主體計算架構(gòu)。前者可稱之為以控制為中心(control-centric)的模式,后者稱之為以數(shù)據(jù)為中心(data-centric)的模式??刂茷橹行牡暮诵氖菍崿F(xiàn)“通用”,數(shù)據(jù)為中心的核心是通過定制化實現(xiàn)“高性能”。以應用特征和架構(gòu)特征這兩個維度粗略劃分處理器芯片類型分布,如圖2-1所示。

通用CPU是偏向于控制為中心結(jié)構(gòu),理論上看就是要“圖靈完備”,要支持完備的指令集,通過編程指令序列來定義計算任務,通過執(zhí)行指令序列來完成計算任務,因此具備極其靈活的編程支持,可以任意定義計算的邏輯實現(xiàn)“通用”——這也是CPU最大的優(yōu)勢。同時,為了提高編程的開發(fā)效率,降低編譯器復雜度,緩存管理和細粒度并行度的開發(fā)通常都是由硬件來完成。類似的,還有大量的用于各種嵌入式、移動設(shè)備的微控制器MCU,并不強調(diào)高帶寬,也是以控制為中心的結(jié)構(gòu)。NP,DSP也是便向于基于通用處理器來做專用化擴展,但是非常注重高通量的性能屬性。例如,NP要支持數(shù)Tbps的轉(zhuǎn)發(fā)帶寬,所以大體可以視為控制為中心、但是IO密集的處理器類型。

GPU是以數(shù)據(jù)為中心的結(jié)構(gòu),形式上更傾向于專用加速器。GPU的結(jié)構(gòu)稱之為數(shù)據(jù)并行(data-parallel)結(jié)構(gòu),優(yōu)化指令并行度并不是提升性能的重點,通過大規(guī)模同構(gòu)核進行細粒度并行來消化大的數(shù)據(jù)帶寬才是重點。例如,最新的NVIDIA TITAN RTX GPU有4608個CUDA核、576個Tensor核,而且單片GPU通常配置數(shù)十GB的超大顯存。同時緩存管理多采用軟件顯示管理,降低硬件復雜度。這類超眾核結(jié)構(gòu)是以數(shù)據(jù)為中心、執(zhí)行計算密集型任務的代表性架構(gòu)。

DPU也偏向于數(shù)據(jù)為中心的結(jié)構(gòu),形式上集成了更多類別的專用加速器,犧牲一定的指令靈活性以獲得更極致的性能。但是與GPU不同,DPU要應對更多的網(wǎng)絡IO,既包括外部以太網(wǎng),也包括內(nèi)部虛擬IO,所以DPU所面臨的數(shù)據(jù)并行更多可能是數(shù)據(jù)包并行,而不是圖像中的像素、像塊級并行。而且DPU也會配置少數(shù)通用核(如ARM,MIPS)來處理一定的控制面的任務,運行輕量級操作系統(tǒng)來管理DPU上的眾多的異構(gòu)核資源,所以體現(xiàn)了一定“通用”性,但性能優(yōu)勢主要不源于這些通用核,而是大量專用計算核。早期的一些網(wǎng)絡處理器采用過類似Tile64的通用眾核結(jié)構(gòu),以增加核的數(shù)量來應對多路處理的數(shù)據(jù),實現(xiàn)并發(fā)處理,但單路延遲性能通常都比較差。因此,DPU更偏向于以數(shù)據(jù)為中心,執(zhí)行IO密集任務。

DPU是軟件定義的技術(shù)路線下的重要產(chǎn)物。在軟件定義網(wǎng)絡中,將數(shù)據(jù)面與控制面分離是最核心的思想。DPU被定義為強化了數(shù)據(jù)面性能的專用處理器,配合控制面的CPU,可以實現(xiàn)性能與通用性的更佳的平衡。

來源:專用數(shù)據(jù)處理器(DPU)技術(shù)白皮書,中國科學院計算技術(shù)研究所,鄢貴海等

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    353

    瀏覽量

    24072
收藏 人收藏

    評論

    相關(guān)推薦

    安謀科技發(fā)布“玲瓏”DPU和新代VPU

    安謀科技(中國)有限公司在自研技術(shù)道路上再邁堅實步伐,近日震撼發(fā)布首款“玲瓏”系列DPU數(shù)據(jù)處理單元)及新代VPU(視頻處理單元)。此次
    的頭像 發(fā)表于 09-24 14:33 ?199次閱讀

    OMAP5912應用處理器數(shù)據(jù)

    電子發(fā)燒友網(wǎng)站提供《OMAP5912應用處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 09:16 ?0次下載
    OMAP5912應<b class='flag-5'>用處理器</b><b class='flag-5'>數(shù)據(jù)</b>表

    IaaS+on+DPU(IoD)+下代高性能算力底座技術(shù)白皮書

    數(shù)據(jù)中心的第三顆“主力芯片”,主要通過其專用處理器優(yōu)化數(shù)據(jù)中心的網(wǎng)絡、存儲、安全等處理性能,助力服務運行效率顯著提升,有效降低成本。因此,
    發(fā)表于 07-24 15:32

    芯啟源DPU賦能綠色數(shù)據(jù)中心,助力實現(xiàn)雙碳戰(zhàn)略

    近日,深圳市計算機行業(yè)協(xié)會在南山區(qū)前海自貿(mào)區(qū)的博大數(shù)據(jù)深圳前海智算中心成功舉辦了“新質(zhì)生產(chǎn)力產(chǎn)品與AIPC應用與挑戰(zhàn)技術(shù)交流會”。芯啟源助理副總裁顧宏波受邀分享《DPU賦能綠色數(shù)據(jù)中心
    的頭像 發(fā)表于 06-13 09:53 ?497次閱讀

    DPU技術(shù)賦能下代AI算力基礎(chǔ)設(shè)施

    4月19日,在以“重構(gòu)世界 奔赴未來”為主題的2024中國生成式AI大會上,中科馭數(shù)作為DPU新型算力基礎(chǔ)設(shè)施代表,受邀出席了中國智算中心創(chuàng)新論壇,發(fā)表了題為《以網(wǎng)絡中心的AI算力底
    的頭像 發(fā)表于 04-20 11:31 ?751次閱讀

    明天線上見!DPU構(gòu)建高性能云算力底座——DPU技術(shù)開放日最新議程公布!

    算力,是數(shù)字經(jīng)濟時代的新質(zhì)生產(chǎn)力。隨著人工智能、智算中心建設(shè)等需求不斷拓展,DPU在各行各業(yè)數(shù)據(jù)中心的應用逐步深入。異構(gòu)算力代表DPU在新質(zhì)生產(chǎn)力建設(shè)中,能否給出別開生面的答案,應戰(zhàn)算
    的頭像 發(fā)表于 04-03 18:12 ?943次閱讀

    芯來科技正式發(fā)布首款專用處理器產(chǎn)品線Nuclei Intelligence系列

    本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來科技正式發(fā)布首款針對人工智能應用的專用處理器產(chǎn)品線Nuclei Intelligence(NI)系列,以及NI系列的第款AI
    的頭像 發(fā)表于 02-26 10:15 ?1075次閱讀
    芯來科技正式發(fā)布首款<b class='flag-5'>專用處理器</b>產(chǎn)品線Nuclei Intelligence<b class='flag-5'>系列</b>

    數(shù)據(jù)處理器DPU編程入門》DPU計算入門書籍測評

    ,國內(nèi)國外兩股部隊都在朝著超大規(guī)模計算部署。而專用處理器在大規(guī)模處理上帶來的經(jīng)濟和效率優(yōu)勢是通用計算不可比擬的。DPU在云計算中高性能,高功耗的特點將會完美符合機房設(shè)備的特征。也稱為需
    發(fā)表于 12-24 10:54

    數(shù)據(jù)處理器DPU編程入門》讀書筆記

    目前業(yè)界所公認的以數(shù)據(jù)中心的體系結(jié)構(gòu)下的創(chuàng)新。綜上,DPU數(shù)據(jù)中心來說,是通過更明細的分工來
    發(fā)表于 12-21 10:47

    數(shù)據(jù)處理器DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    。隨著人們對云計算和大數(shù)據(jù)處理需求的增加,數(shù)據(jù)中心的計算負載也不斷增加。傳統(tǒng)的中央處理器(CPU)在處理這些工作負載時可能會遇到瓶頸,難
    發(fā)表于 12-08 18:03

    國際大學生日:探索 DPU 編程,創(chuàng)造 AI 的未來(互動有禮)

    今天是國際大學生日,NVIDIA 懷揣 AI 夢想的學子們打開了扇通往開發(fā)世界的大門。 不久前 NVIDIA 推出了備受業(yè)界好評的首部 DPU 處理器編程入門書籍 ——《
    的頭像 發(fā)表于 11-17 21:30 ?593次閱讀
    國際大學生日:探索 <b class='flag-5'>DPU</b> 編程,創(chuàng)造 AI 的未來(互動有禮)

    什么是DPU?

    和服務內(nèi),CPU和GPU已經(jīng)被廣泛地用于各個新型超大規(guī)模數(shù)據(jù)中心。 這些數(shù)據(jù)中心通過功能強大的新型處理器連接在起,
    發(fā)表于 11-03 10:55

    基于openEuler構(gòu)建的DPU-OS解決 DPU 廠商及客戶之間的適配問題

    數(shù)據(jù)中心及云場景下,摩爾定律失效,通用處理單元 CPU 算力增長速率放緩,而網(wǎng)絡 IO 類速率及性能不斷攀升,二者增長速率差異形成剪刀差,即當前通用處理器
    的頭像 發(fā)表于 11-02 10:03 ?808次閱讀
    基于openEuler構(gòu)建的<b class='flag-5'>DPU</b>-OS解決 <b class='flag-5'>DPU</b> 廠商及客戶之間的適配問題

    解碼 DPU 編程,投稿贏取好禮!

    表示對閱讀本書的期待。 《數(shù)據(jù)處理器DPU 編程入門》閱讀分享征集活動邀您起參與!歡迎分享您在閱讀或?qū)W習本書的過程中的體驗、收獲以及感想。 關(guān)于《數(shù)據(jù)處理器
    的頭像 發(fā)表于 11-01 20:25 ?380次閱讀
    解碼 <b class='flag-5'>DPU</b> 編程,投稿贏取好禮!

    很好的書籍,學以致用

    人工智能正在呈爆發(fā)式發(fā)展,成為數(shù)據(jù)中心算力需求的主要驅(qū)動力之。為了卸載、加速和隔離數(shù)據(jù)中心基礎(chǔ)設(shè)施工作負載,DPU應運而生。在社會數(shù)字化轉(zhuǎn)型浪潮下,潛在海量
    發(fā)表于 10-31 08:45