0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DPU特征結(jié)構(gòu)系列(二)一種DPU參考設(shè)計(jì)

中科馭數(shù)(北京)科技有限公司 ? 2022-05-05 14:23 ? 次閱讀

為了滿足“數(shù)據(jù)為中心”的設(shè)計(jì)理念,本節(jié)給出一個(gè)通用的DPU參考設(shè)計(jì)。目前DPU架構(gòu)的演化比較快,DPU既可以呈現(xiàn)為一個(gè)被動設(shè)備作為CPU的協(xié)處理器,也可以作為一個(gè)主動設(shè)備,承接Hypervisor的一些功能。尤其是容器技術(shù)、虛擬化技術(shù)的廣泛采用,DPU的角色已經(jīng)不僅僅是一個(gè)協(xié)處理器,而是呈現(xiàn)出更多的HOST的特征,比如運(yùn)行Hypervisor,做跨節(jié)點(diǎn)的資源整合,為裸金屬和虛擬機(jī)提供虛擬網(wǎng)絡(luò),數(shù)據(jù)安全,熱遷移等支撐。宏觀來看,DPU架構(gòu)至少可以分為以下幾個(gè)核心組成部分:

poYBAGJzbASAIgqXAAq6Mgd8PGs685.png

圖DPU架構(gòu)參考設(shè)計(jì)

一、控制平面

負(fù)責(zé)管理、配置,通常由通用處理器核來實(shí)現(xiàn)??刂破脚_負(fù)責(zé)DPU設(shè)備運(yùn)行管理,以及計(jì)算任務(wù)和計(jì)算資源的配置。運(yùn)行管理通常包含設(shè)備的安全管理和實(shí)時(shí)監(jiān)控兩個(gè)主要功能。在安全管理方面支持支持如信任根、安全啟動、安全固件升級以及基于身份驗(yàn)證的容器和應(yīng)用的生命周期管理等。在設(shè)備實(shí)時(shí)監(jiān)控方面,對DPU各子系統(tǒng)、數(shù)據(jù)平面中各處理核動態(tài)監(jiān)測,實(shí)時(shí)觀察設(shè)備是否可用、設(shè)備中流量是否正常,周期性生成報(bào)表,記錄設(shè)備訪問日志核配置修改日志。

計(jì)算任務(wù)和計(jì)算資源配置方面,根據(jù)計(jì)算任務(wù)實(shí)施配置數(shù)據(jù)平面中處理單元間的通路,以及各處理單元參數(shù)。根據(jù)資源利用情況實(shí)時(shí)進(jìn)行任務(wù)調(diào)度以及在計(jì)算單元的映射和部署。同時(shí)DPU上層同時(shí)會支持多個(gè)虛擬機(jī),控制平面在任務(wù)部署時(shí)還要進(jìn)行虛擬設(shè)備的管理,考慮虛擬機(jī)間數(shù)據(jù)和資源隔離,記錄運(yùn)行狀態(tài)協(xié)助虛擬機(jī)熱遷移。最后,當(dāng)DPU集成第三方計(jì)算平臺,如GPUFPGA等,還需要參與部分卸載任務(wù)調(diào)度。

由于控制平面任務(wù)多樣,靈活性要求較高,算力要求較低,通常由通用處理器核來實(shí)現(xiàn),比如ARM、MIPS等核心。為便于用戶統(tǒng)一管理和配置DPU設(shè)備,提供較好的可編程性,通常會運(yùn)行標(biāo)準(zhǔn)Linux應(yīng)用程序。并且控制平面與數(shù)據(jù)平面數(shù)據(jù)交互驅(qū)動程序需要進(jìn)行深度優(yōu)化,來提升控制平面與數(shù)據(jù)平面有效地交互,任務(wù)調(diào)度效率。

二、IO子系統(tǒng)

主要分為三個(gè)大類:

(1)系統(tǒng)IO,負(fù)責(zé)DPU和其他處理平臺(如X86、ARM處理器、GPU、FPGA等)或高速外部設(shè)備(如SSD)的集成。系統(tǒng)IO通常傳輸數(shù)據(jù)量較大對帶寬有著極高的要求,因此多基于PCIe來實(shí)現(xiàn)。系統(tǒng)IO接口分為兩大類:EP(Endpoint)類和RC(Root Complex)類。

EP類接口負(fù)責(zé)將DPU作為從設(shè)備與X86、ARM等處理平臺相連接。為了充分利用DPU上的內(nèi)部資源,此類接口要支持強(qiáng)大的硬件設(shè)備虛擬化功能,比如SR-IOV和VirtIO。并且可以靈活地支持多種類型的設(shè)備,如NIC、Storage、Compute設(shè)備等。

RC類接口負(fù)責(zé)將DPU作為主設(shè)備與加速平臺(如GPU、FPGA)或外設(shè)(SSD)相連接。通過此種方式將部分?jǐn)?shù)據(jù)處理卸載到第三方加速平臺GPU、FPGA中處理,通常數(shù)據(jù)量較大,需要支持較強(qiáng)的DMA方案。

(2)網(wǎng)絡(luò)IO,負(fù)責(zé)DPU與高速網(wǎng)絡(luò)相連接,主要是以太網(wǎng)或者FC為主。為了能應(yīng)對急劇增加的網(wǎng)絡(luò)帶寬,DPU中通常輔以專門的網(wǎng)絡(luò)協(xié)議處理核來加速網(wǎng)絡(luò)包的處理。包括L2/L3/L4層的ARP/IP/TCP/UDP網(wǎng)絡(luò)協(xié)議處理、RDMA、數(shù)據(jù)包交換協(xié)議、基本網(wǎng)絡(luò)虛擬化協(xié)議等,可以實(shí)現(xiàn)100G以上的網(wǎng)絡(luò)包線速處理。

(3)主存IO,負(fù)責(zé)緩存網(wǎng)絡(luò)IO和系統(tǒng)IO輸入輸出數(shù)據(jù),以及數(shù)據(jù)平面中間數(shù)據(jù)結(jié)果。也可作為共享內(nèi)存,實(shí)現(xiàn)不同處理核之間的數(shù)據(jù)通信。目前主存IO主要包含DDR和HBM接口類型,兩類接口,DDR可以提供比較大的存儲容量,可以提供512GB以上的存儲容量;HBM可以提供比較大的存儲帶寬,可以提供500GB/s以上的帶寬。兩種存儲接口相結(jié)合可以滿足不同存儲容量和帶寬的需求,但是需要精細(xì)的數(shù)據(jù)管理,這塊也是DPU設(shè)計(jì)中比較有挑戰(zhàn)的。

三、數(shù)據(jù)平面

主要負(fù)責(zé)高速數(shù)據(jù)通路的功能單元的集成,通常集成多個(gè)處理核。數(shù)據(jù)平面的功能主要分為五類:

1)高速數(shù)據(jù)包處理,主要對接收到的網(wǎng)絡(luò)數(shù)據(jù)包進(jìn)行如OvS(開放式虛擬交換機(jī))解析、匹配和處理,以及RDMA遠(yuǎn)程數(shù)據(jù)傳輸加速等操作,和之前的網(wǎng)絡(luò)處理器NP功能類似,但是在性能上有更高的要求,處理帶寬線速要達(dá)到100G、200G甚至400G。同時(shí),在進(jìn)行有狀態(tài)數(shù)據(jù)處理時(shí)也有著更高的要求,如TCP協(xié)議,要求硬件記錄各連接信息,并能實(shí)現(xiàn)多連接間無縫切換。

2)虛擬化協(xié)議加速,支持SR-IOV、VirtIO和PV(Para-Virtualization)等虛擬化。支持網(wǎng)絡(luò)虛擬化VxLAN、Geneve Overlay卸載和VTEP等協(xié)議卸載。

3)安全加密,在線IPSec和TLS加密加速,以及多種標(biāo)準(zhǔn)加解密算法和國密算法。并且對于安全算法的處理性能有較高的要求,要達(dá)到網(wǎng)絡(luò)線速,從而不影響其它正在運(yùn)行的加速操作。

4)流量壓縮,對網(wǎng)絡(luò)數(shù)據(jù)包,或者要存儲的數(shù)據(jù),進(jìn)行實(shí)時(shí)地?cái)?shù)據(jù)壓縮/解壓縮處理,壓縮過程中還要完成地址的轉(zhuǎn)換和重映射等操作?;蛘咴诰€完成數(shù)據(jù)流變換處理,如面向多媒體流、CDN(內(nèi)容分發(fā)網(wǎng)絡(luò))和4K/8K IP視頻的“Packet Pacing”流量整形加速等。

5)其他算法加速。除了上述網(wǎng)絡(luò)、安全協(xié)議外還要支持NVMe等存儲協(xié)議,業(yè)務(wù)相關(guān)的處理卸載也呈增長趨勢,如大數(shù)據(jù)分析SQL加速。

四、DPU設(shè)計(jì)的關(guān)鍵

數(shù)據(jù)平面是整個(gè)DPU設(shè)計(jì)的關(guān)鍵,也是DPU設(shè)計(jì)中最有挑戰(zhàn)的模塊。主要面臨四個(gè)挑戰(zhàn):

1)數(shù)據(jù)中心的工作負(fù)載復(fù)雜多樣,數(shù)據(jù)平面支持的處理核種類要足夠多,不僅包括網(wǎng)絡(luò)、存儲、安全和虛擬化等基礎(chǔ)設(shè)施服務(wù),另外業(yè)務(wù)相關(guān)的處理也在加速向DPU平臺卸載。

2)高并發(fā)性數(shù)據(jù)處理,數(shù)據(jù)中心承載的業(yè)務(wù)多且復(fù)雜,多虛擬機(jī)多種類業(yè)務(wù)并發(fā)要求數(shù)據(jù)平面集成足夠數(shù)量的核心,規(guī)模要達(dá)到幾百個(gè)核心規(guī)模。隨著數(shù)據(jù)中心數(shù)據(jù)量的不斷增加,對處理性能提出越來越多的挑戰(zhàn),DPU數(shù)據(jù)平面在處理核規(guī)模上要具有非常強(qiáng)的可擴(kuò)展性。

3)復(fù)雜的片上互聯(lián)系統(tǒng),隨著DPU數(shù)據(jù)平面處理核數(shù)量的增加,再加之高并發(fā)處理線程運(yùn)行,同時(shí)還要兼顧好數(shù)據(jù)平面數(shù)據(jù)處理的靈活,這就要求處理核之間的數(shù)據(jù)交互既要靈活又要兼顧高帶寬。處理核之間的數(shù)據(jù)互聯(lián),以及核間的數(shù)據(jù)一致性成為另一設(shè)計(jì)難題。

4)高效簡易的編程方式,數(shù)據(jù)中心業(yè)務(wù)的復(fù)雜多變決定了DPU數(shù)據(jù)平臺可編程性的硬性需求。一方面要兼顧計(jì)算效率,必須直觀表達(dá)出并發(fā)處理任務(wù),充分利用計(jì)算資源。另一方面要兼顧DPU的易用性,盡量采用高級語言進(jìn)行編程,易于設(shè)計(jì)、開發(fā)和維護(hù)。

總之,DPU數(shù)據(jù)平面需要一種大規(guī)模敏捷異構(gòu)的計(jì)算架構(gòu)。這一部分的實(shí)現(xiàn)也處在“百家爭鳴”的階段,各家的實(shí)現(xiàn)方式差別較大,有基于通用處理器核的方式,有基于可編程門陣列FPGA的方式,也有基于異構(gòu)眾核的方式,還有待探索。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    352

    瀏覽量

    24072
收藏 人收藏

    評論

    相關(guān)推薦

    中科馭數(shù)分析DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實(shí)際應(yīng)用

    CCF Chip 2024,精彩不能停!7月21日下午,中科馭數(shù)在第屆中國計(jì)算機(jī)學(xué)會(CCF)芯片大會的“馭數(shù)專屬時(shí)刻”仍在繼續(xù),馭數(shù)組織承辦“DPU技術(shù)趨勢和應(yīng)用——DPU在云原生與智算網(wǎng)絡(luò)中
    的頭像 發(fā)表于 08-02 11:21 ?585次閱讀

    IaaS+on+DPU(IoD)+下代高性能算力底座技術(shù)白皮書

    的技術(shù)標(biāo)準(zhǔn)也在不斷完善。從此 DPU 不再是行業(yè)巨頭的“專享”技術(shù),基礎(chǔ)設(shè)施與云計(jì)算相關(guān)產(chǎn)業(yè)參與者都在尋求一種簡單高效的方法,將 DPU 的優(yōu)勢運(yùn)用到自身業(yè)務(wù)系統(tǒng)之中,例如 Red Hat
    發(fā)表于 07-24 15:32

    中科馭數(shù)CEO鄢貴海:從計(jì)算系統(tǒng)的三個(gè)視角重新審視DPU的核心價(jià)值

    在信息技術(shù)日新月異的浪潮中,DPU正逐漸嶄露頭角。當(dāng)前,DPU發(fā)展的核心驅(qū)動力來自于什么?DPU技術(shù)是否已經(jīng)足夠成熟到廣泛應(yīng)用?市場上頭部玩家參與到這創(chuàng)新技術(shù)的市場角逐之中?在算力時(shí)
    的頭像 發(fā)表于 06-28 14:27 ?390次閱讀
    中科馭數(shù)CEO鄢貴海:從計(jì)算系統(tǒng)的三個(gè)視角重新審視<b class='flag-5'>DPU</b>的核心價(jià)值

    中科馭數(shù)發(fā)布高性能DPU芯片K2-Pro

    在信息技術(shù)領(lǐng)域,每次芯片技術(shù)的突破都代表著行業(yè)的次飛躍。近日,DPU領(lǐng)域的領(lǐng)軍企業(yè)中科馭數(shù)宣布,成功研發(fā)并發(fā)布了其第三代DPU芯片——“K2-Pro”。這款芯片的發(fā)布,標(biāo)志著中科馭
    的頭像 發(fā)表于 06-21 11:41 ?659次閱讀

    明天線上見!DPU構(gòu)建高性能云算力底座——DPU技術(shù)開放日最新議程公布!

    技術(shù)在不同行業(yè)中的應(yīng)用解決方案有哪些?能帶來怎樣的業(yè)務(wù)效果? 3月29日本周五,中科馭數(shù)集結(jié)產(chǎn)品大咖及解決方案專家團(tuán),誠邀您參加以“DPU構(gòu)建高性能云算力底座”為主題的線上DPU技術(shù)開放日! 他們將逐與您分享中科馭數(shù)
    的頭像 發(fā)表于 04-03 18:12 ?938次閱讀

    中科馭數(shù)DPU技術(shù)開放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時(shí)網(wǎng)絡(luò)等方案組團(tuán)亮相

    DPU技術(shù)開放日既是對DPU技術(shù)應(yīng)用的典型方案展示,也是DPU技術(shù)在重要細(xì)分場景走向成熟的標(biāo)志。
    的頭像 發(fā)表于 04-01 11:48 ?673次閱讀
    中科馭數(shù)<b class='flag-5'>DPU</b>技術(shù)開放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時(shí)網(wǎng)絡(luò)等方案組團(tuán)亮相

    FPGA-Based DPU網(wǎng)卡的發(fā)展和應(yīng)用

    采用單芯片的SoC形態(tài),兼顧性能和功耗。FPGA-Based DPU在硬件設(shè)計(jì)上的挑戰(zhàn)主要來自芯片面積和功耗。
    發(fā)表于 02-23 14:40 ?1772次閱讀
    FPGA-Based <b class='flag-5'>DPU</b>網(wǎng)卡的發(fā)展和應(yīng)用

    中科馭數(shù)自研第DPU芯片K2獲得行業(yè)認(rèn)可

    近日,中科馭數(shù)自研第DPU芯片K2在眾多云生態(tài)創(chuàng)新應(yīng)用技術(shù)產(chǎn)品中脫穎而出,成功入選由中國云產(chǎn)業(yè)聯(lián)盟暨中關(guān)村云計(jì)算產(chǎn)業(yè)聯(lián)盟發(fā)布的“2023年中國云生態(tài)創(chuàng)新應(yīng)用技術(shù)產(chǎn)品”。這殊榮既是對中科馭數(shù)第
    的頭像 發(fā)表于 01-18 09:20 ?937次閱讀

    《數(shù)據(jù)處理器:DPU編程入門》DPU計(jì)算入門書籍測評

    DPU計(jì)算框架 通過周多的時(shí)間翻閱這本書,基本上這本書是本比較全面的,面向架構(gòu)的新手指導(dǎo)數(shù)據(jù)。它在書中詳盡介紹了關(guān)于DPU在計(jì)算機(jī)架
    發(fā)表于 12-24 10:54

    《數(shù)據(jù)處理器:DPU編程入門》讀書筆記

    首先感謝電子發(fā)燒友論壇提供的試讀機(jī)會。 第周先閱讀了DPU的技術(shù)發(fā)展背景,了解到DPU是結(jié)合了高性能及軟件可編程的多核CPU、高性能網(wǎng)絡(luò)接口,以及各種靈活和可編程的加速引擎。DPU
    發(fā)表于 12-21 10:47

    淺談DPU和CPU、GPU的關(guān)系

    把CPU的大部分算力卸載給GPU之后,人們發(fā)現(xiàn)可以把很多其他功能也外包出去,于是又有了智能網(wǎng)卡,或者叫做DPU
    發(fā)表于 12-14 11:44 ?761次閱讀
    淺談<b class='flag-5'>DPU</b>和CPU、GPU的關(guān)系

    《數(shù)據(jù)處理器:DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    。隨著人們對云計(jì)算和大數(shù)據(jù)處理需求的增加,數(shù)據(jù)中心的計(jì)算負(fù)載也不斷增加。傳統(tǒng)的中央處理器(CPU)在處理這些工作負(fù)載時(shí)可能會遇到瓶頸,難以提供足夠的性能和效率。DPU通過提供專門的硬件加速,可以
    發(fā)表于 12-08 18:03

    DPU國產(chǎn)生態(tài)版圖又雙叒擴(kuò)大了!

    關(guān)鍵廠商完成兼容性互認(rèn)證。測試報(bào)告顯示,中科馭數(shù)DPU系列產(chǎn)品在產(chǎn)品兼容性測試過程中,運(yùn)行穩(wěn)定,性能卓越。 ▲? 中科馭數(shù)近期新增超30+產(chǎn)品兼容性認(rèn)證 DPU的產(chǎn)品兼容性認(rèn)證是確保其能夠與各種主流硬件和軟件產(chǎn)品協(xié)同工作的關(guān)鍵
    的頭像 發(fā)表于 11-03 11:20 ?423次閱讀
    <b class='flag-5'>DPU</b>國產(chǎn)生態(tài)版圖又雙叒擴(kuò)大了!

    什么是DPU?

    DPU則進(jìn)行數(shù)據(jù)處理?!?什么是DPU? 數(shù)據(jù)處理器 基于行業(yè)標(biāo)準(zhǔn),高性能及軟件可編程的多核CPU 高性能網(wǎng)絡(luò)接口 靈活、可編程的加速引擎 DPU有什么與眾不同之處? DPU
    發(fā)表于 11-03 10:55

    解碼 DPU 編程,投稿贏取好禮!

    表示對閱讀本書的期待。 《數(shù)據(jù)處理器:DPU 編程入門》閱讀分享征集活動邀您起參與!歡迎分享您在閱讀或?qū)W習(xí)本書的過程中的體驗(yàn)、收獲以及感想。 關(guān)于《數(shù)據(jù)處理器:DPU 編程入門》 本書由 NVIDIA
    的頭像 發(fā)表于 11-01 20:25 ?376次閱讀
    解碼 <b class='flag-5'>DPU</b> 編程,投稿贏取好禮!