0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于openEuler構(gòu)建的DPU-OS解決 DPU 廠商及客戶之間的適配問題

openEuler ? 來源:openEuler ? 2023-11-02 10:03 ? 次閱讀

在數(shù)據(jù)中心及云場景下,摩爾定律失效,通用處理單元 CPU 算力增長速率放緩,而網(wǎng)絡(luò) IO 類速率及性能不斷攀升,二者增長速率差異形成剪刀差,即當(dāng)前通用處理器的處理能力無法跟上網(wǎng)絡(luò)、磁盤等 IO 處理的需求。傳統(tǒng)數(shù)據(jù)中心下越來越多的通用 CPU 算力被 IO 及管理面等處理占用,這部分資源損耗稱之為數(shù)據(jù)中心稅(Datacenter Tax)。據(jù) AWS 和 Google Cloud 統(tǒng)計,數(shù)據(jù)中心稅可能占據(jù)數(shù)據(jù)中心算力的 30% 以上,部分場景下甚至可能更多[1][2]。

DPU (Data Processing Unit) 的出現(xiàn)就是為了將這部分算力資源從主機 CPU上解放出來,通過將管理面、網(wǎng)絡(luò)、存儲、安全等能力卸載到專有的處理器芯片上進行處理加速,達成降本增效的結(jié)果。目前主流云廠商如 AWS 、阿里云、華為云都通過自研芯片完成管理面及相關(guān)數(shù)據(jù)面的卸載,實現(xiàn)數(shù)據(jù)中心計算資源 100% 售賣給客戶。

DPU 發(fā)展非常火熱。云廠商及大數(shù)據(jù)在相關(guān)場景下對 DPU 存在較強烈的需求,國內(nèi)也有很多 DPU 初創(chuàng)公司推出不同的 DPU 產(chǎn)品。在這一背景下,云和大數(shù)據(jù)等廠商需要考慮如何整合使用不同 DPU 產(chǎn)品,而 DPU 廠商也面臨對不同客戶交付時設(shè)備驅(qū)動適配客戶指定操作系統(tǒng)的問題。

openEuler 作為國內(nèi)領(lǐng)先的開源開放操作系統(tǒng),通過基于 openEuler 構(gòu)建的 DPU-OS ,解決 DPU 廠商及客戶之間的適配問題。除此之外, DPU 上 OS 用于承載部分業(yè)務(wù)加速的需求,需要對 DPU-OS 進行性能優(yōu)化加速,可以基于 openEuler 構(gòu)建 DPU 相關(guān)加速能力,內(nèi)置在 DPU-OS 中,構(gòu)建 DPU 相關(guān)軟件生態(tài)。

DPU現(xiàn)狀
DPU 普遍具有以下特點及問題:

1. DPU 通用處理能力資源受限

當(dāng)前 DPU 仍處在發(fā)展早期階段,硬件上仍在不斷演進,而且由于 DPU 供電限制,當(dāng)前硬件規(guī)格普遍較低。主流 DPU 中通用處理器 CPU 核數(shù)較少,約 8-24 CPU ,且單核處理能力弱。內(nèi)存大小受限,普遍在 16-32GB 。DPU 本地存儲空間為幾十到幾百 GB 不等。運行于 DPU 之上的操作系統(tǒng)也需要考慮這些限制。

2.DPU-OS 安裝方式多樣

當(dāng)前 DPU 廠商及產(chǎn)品多種多樣,對應(yīng)操作系統(tǒng)的安裝部署方式也不盡相同,包括 PXE 網(wǎng)絡(luò)安裝、U盤安裝或其他自定義安裝方式(由 HOST 下發(fā)安裝鏡像)。

3.DPU 性能需求

DPU 的應(yīng)用場景決定其對性能有強烈需求。相比于通用服務(wù)器操作系統(tǒng),DPU-OS 可能對內(nèi)核特性或功能組件有特殊要求,比如用于設(shè)備直通熱遷移的 vDPA 特性、廠商特定驅(qū)動適配支持、DPU 進程的無感卸載特性、定制優(yōu)化的用戶態(tài)數(shù)據(jù)面加速工具如 DPDK/SPDK/OVS、DPU 管理監(jiān)控相關(guān)的工具類組件。

DPU-OS 需求
針對以上 DPU 現(xiàn)狀,提出對 DPU-OS 的需求如下:

1.極致輕量的 DPU-OS 安裝包

通過裁剪 openEuler 系統(tǒng)鏡像,減少非必要安裝包的空間占用;通過優(yōu)化系統(tǒng)服務(wù),減少資源底噪開銷。

2.裁剪配置及工具支持

提供裁剪配置及裁剪工具支持,客戶或 DPU 廠商可根據(jù)各自需求進行定制;openEuler 提供 ISO 參考實現(xiàn)。

3.定制化內(nèi)核及系統(tǒng),提供極致性能

通過定制內(nèi)核及相關(guān)驅(qū)動,提供 DPU 競爭力內(nèi)核特性;定制化加速類組件,使能 DPU 硬件加速能力;優(yōu)化系統(tǒng)配置提供更優(yōu)性能;通過 DPU 相關(guān)管理控制工具,方便用戶統(tǒng)一管理。

DPU-OS設(shè)計

62ca15e6-78a0-11ee-939d-92fbcf53809c.png

圖1 DPU-OS 整體設(shè)計

如圖所示,DPU-OS 分為五層設(shè)計:

內(nèi)核層:通過定制內(nèi)核 config ,裁剪非必需內(nèi)核特性及模塊,達成內(nèi)核輕量級效果;使能特定內(nèi)核特性提供高性能 DPU 內(nèi)核能力。

驅(qū)動層:對 openEuler 原生驅(qū)動進行裁剪定制,選擇最小集合;DPU 廠商相關(guān)底層驅(qū)動集成,原生支持部分 DPU 硬件產(chǎn)品。

系統(tǒng)配置層:通過對系統(tǒng) sysctl 、proc 進行配置,為 DPU 相關(guān)業(yè)務(wù)提供最優(yōu)性能。

外圍包層:對 openEuler 外圍包進行裁剪定制,選擇最小集合;提供 DPU 相關(guān)的定制工具集合。

系統(tǒng)服務(wù)層:通過優(yōu)化系統(tǒng)原生服務(wù)啟動項,減少非必要系統(tǒng)服務(wù)運行,保證系統(tǒng)運行時底噪最小化。

通過上述五層設(shè)計達成輕量化、極致性能 DPU-OS 的目標(biāo)。該方案為相對長期設(shè)計,且對 DPU 相關(guān)軟硬件生態(tài)有較強的依賴。

當(dāng)前對 DPU-OS 的實現(xiàn)還處于第一階段,專注于通過 openEuler imageTailor 工具進行進項裁剪,提供最小化的 DPU-OS 實現(xiàn)。后續(xù)規(guī)劃通過對內(nèi)核及 DPU 相關(guān)組件的定制化修改、配置提供專用 DPU-OS 能力,提供高性能 DPU-OS 。

說明:

1. 當(dāng)前階段的 DPU-OS 先基于 openEuler 現(xiàn)有內(nèi)核及外圍包,使用鏡像裁剪工具 imageTailor 進行裁剪,提供輕量化 OS 安裝鏡像。后續(xù)可根據(jù)實際訴求,進行相關(guān)內(nèi)核及外圍包特性的開發(fā)及集成。

2. DPU-OS 的裁剪步驟可參考社區(qū)文檔 DPU-OS 裁剪指導(dǎo)[3],驗證與部署可參考 DPU-OS 部署驗證[4]。

客戶案例

天翼云

作為 openEuler 的重要合作伙伴,天翼云自身的 CTyunOS 系統(tǒng)脫胎于 openEuler,CTyunOS 目前在 DPU-OS 方面也進行了一些前期的構(gòu)建與試驗工作。包括:

1. 基于 CTyunOS3 系統(tǒng)和 sig-DPU 發(fā)布的 DPU-OS 組件,構(gòu)建 x86_64 和 aarch64 架構(gòu)的 DPU-OS 鏡像。

2. 針對 kernel 包根據(jù) DPU 實際要求進行定制(剔除 builtin 的 virtio-pci、virtio-ring 模塊等)。

3. 鏡像中增加定制外圍包,如 bash 命令補全、自定義工具、DPU 驅(qū)動包等。

4. DPU-OS 配置相關(guān)組件及服務(wù),聯(lián)網(wǎng)情況下支持 yum 方式進行包更新升級。

天翼云 DPU 團隊在后續(xù)的 DPU 2.0 規(guī)劃里,將全面采用自身的 CTyunOS 系統(tǒng),主推使用基于 CTyunOS3 構(gòu)建的 DPU-OS 。相關(guān)需求與特性反饋給社區(qū),與 openEuler 協(xié)作共建 DPU 軟件生態(tài)。

中科馭數(shù)

openEuler 為 DPU 應(yīng)用發(fā)展落地提供良好的土壤,DPU 作為新生事物快速發(fā)展。DPU 往往會包含通用 CPU 架構(gòu)的芯片來處理復(fù)雜的控制面邏輯。例如在虛擬化網(wǎng)絡(luò)體系中,需要 CPU 來運行復(fù)雜的網(wǎng)絡(luò)控制面程序;在網(wǎng)絡(luò)安全領(lǐng)域,眾多不同的安全框架也依賴 CPU 提供基礎(chǔ)算力。

而在 CPU 的具體選型上,DPU 產(chǎn)品面臨在不同應(yīng)用場景、不同算力需求下的選擇問題。如 x86 可以提供強勁的性能,但是無法和 DPU 芯片做到較好融合;ARM 可以解決上述難題,但是在重應(yīng)用卸載的場景存在性能問題;RISC-V 在成本與靈活性上能提供最優(yōu)方案,但是代價是應(yīng)用場景的適配性不高??傊?CPU 的選型上目前還沒有最優(yōu)解。在這種背景下,操作系統(tǒng)的選型至關(guān)重要。DPU 廠商在自己的操作系統(tǒng)選型中,往往會優(yōu)先考慮下面幾個問題:

* 穩(wěn)定與安全性

* 對底層不同架構(gòu)的適配性

* 可裁剪與靈活性

經(jīng)過充分的調(diào)研論證與測試,中科馭數(shù)為自己的 DPU 產(chǎn)品選擇 openEuler 作為底層基礎(chǔ)操作系統(tǒng)。首先 openEuler 操作系統(tǒng)已經(jīng)過充分的落地實踐考驗,在系統(tǒng)穩(wěn)定性上具有明顯優(yōu)勢。其次 openEuler 可以提供完善的工具鏈支撐,不管是進行業(yè)務(wù)開發(fā)還是系統(tǒng)裁剪,都可以快速高效地完成。最后 openEuler 系統(tǒng)設(shè)計之初便考慮到對多樣性設(shè)備的支持,能夠與現(xiàn)有硬件生態(tài)緊密融合,極大降低了 DPU 廠家的研發(fā)成本。

得益于 openEuler 系統(tǒng)的出色的工具鏈支持,中科馭數(shù)已經(jīng)完成第一代 DPU-OS 的裁剪定制開發(fā)并在眾多客戶業(yè)務(wù)中落地應(yīng)用。后面中科馭數(shù)也將繼續(xù)深入探索 openEuler 系統(tǒng),一方面繼續(xù)深化定制,打造最符合 DPU 應(yīng)用場景的操作系統(tǒng)。另一方面也將持續(xù)為 openEuler 社區(qū)貢獻自身的力量,助力整個 openEuler 社區(qū)繁榮發(fā)展。

加入我們

sig-DPU 致力于以 openEuler 生態(tài)作為底座,打造輕量化、極致性能的 DPU-OS,助力客戶及 DPU廠商解決不同板卡與服務(wù)之間的兼容性問題。sig-DPU 依托 openEuler 生態(tài),統(tǒng)一 DPU 與 HOST 操作系統(tǒng)底座,提供 DPU 場景定制化特性及組件,打造 DPU 軟件生態(tài),更好地發(fā)揮其硬件卸載加速能力,進一步釋放 DPU 的商業(yè)價值。openEuler DPU-OS 已經(jīng)聯(lián)合包括天翼云及中科馭數(shù)在內(nèi)多家企業(yè)進行驗證。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8872

    瀏覽量

    84968
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    6620

    瀏覽量

    123043
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    353

    瀏覽量

    24072
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8838

    瀏覽量

    137141
  • openEuler
    +關(guān)注

    關(guān)注

    2

    文章

    300

    瀏覽量

    5802

原文標(biāo)題:基于 openEuler 構(gòu)建輕量、極致性能的 DPU-OS ,打造 DPU 軟件生態(tài)底座

文章出處:【微信號:openEulercommunity,微信公眾號:openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    中科馭數(shù)分析DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實際應(yīng)用

    CCF Chip 2024,精彩不能停!7月21日下午,中科馭數(shù)在第二屆中國計算機學(xué)會(CCF)芯片大會的“馭數(shù)專屬時刻”仍在繼續(xù),馭數(shù)組織承辦“DPU技術(shù)趨勢和應(yīng)用——DPU在云原生與智算網(wǎng)絡(luò)中
    的頭像 發(fā)表于 08-02 11:21 ?589次閱讀

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    力,特別是在智算領(lǐng)域,對系統(tǒng)算力大小有決定性作用;DPU負責(zé)數(shù)據(jù)在各種 CPU 之間、CPU 與 GPU、以及 GPU 與 GPU 之間高效流通,很大程度上決定了系統(tǒng)是否能協(xié)同工作。 DPU
    發(fā)表于 07-24 15:32

    中科馭數(shù):DPU構(gòu)建高效智算中心基礎(chǔ)設(shè)施的必選項

    先生在《基于DPU的高效智算中心算力底座》主題分享中提出,大模型等智算業(yè)務(wù)推動算力需求規(guī)??焖僭鲩L,CPU+GPU+DPU的新型計算節(jié)點架構(gòu)已成為高效智算中心的標(biāo)準(zhǔn)配置,為構(gòu)建高性能、高靈活性、高安全性的算力基礎(chǔ)設(shè)施提供了強大支
    的頭像 發(fā)表于 07-08 10:51 ?608次閱讀

    中科馭數(shù)發(fā)布高性能DPU芯片K2-Pro

    在信息技術(shù)領(lǐng)域,每一次芯片技術(shù)的突破都代表著行業(yè)的一次飛躍。近日,DPU領(lǐng)域的領(lǐng)軍企業(yè)中科馭數(shù)宣布,成功研發(fā)并發(fā)布了其第三代DPU芯片——“K2-Pro”。這款芯片的發(fā)布,標(biāo)志著中科馭數(shù)在DPU領(lǐng)域的技術(shù)實力達到了新的高度。
    的頭像 發(fā)表于 06-21 11:41 ?672次閱讀

    DPU技術(shù)賦能下一代AI算力基礎(chǔ)設(shè)施

    4月19日,在以“重構(gòu)世界 奔赴未來”為主題的2024中國生成式AI大會上,中科馭數(shù)作為DPU新型算力基礎(chǔ)設(shè)施代表,受邀出席了中國智算中心創(chuàng)新論壇,發(fā)表了題為《以網(wǎng)絡(luò)為中心的AI算力底座構(gòu)建之路》主題演講,勾勒出在通往AGI之路上,DP
    的頭像 發(fā)表于 04-20 11:31 ?751次閱讀

    明天線上見!DPU構(gòu)建高性能云算力底座——DPU技術(shù)開放日最新議程公布!

    技術(shù)在不同行業(yè)中的應(yīng)用解決方案有哪些?能帶來怎樣的業(yè)務(wù)效果? 3月29日本周五,中科馭數(shù)集結(jié)產(chǎn)品大咖及解決方案專家團,誠邀您參加以“DPU構(gòu)建高性能云算力底座”為主題的線上DPU技術(shù)開放日! 他們將逐一與您分享中科馭數(shù)系列
    的頭像 發(fā)表于 04-03 18:12 ?942次閱讀

    中科馭數(shù)DPU技術(shù)開放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時網(wǎng)絡(luò)等方案組團亮相

    DPU技術(shù)開放日既是對DPU技術(shù)應(yīng)用的典型方案展示,也是DPU技術(shù)在重要細分場景走向成熟的標(biāo)志。
    的頭像 發(fā)表于 04-01 11:48 ?675次閱讀
    中科馭數(shù)<b class='flag-5'>DPU</b>技術(shù)開放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時網(wǎng)絡(luò)等方案組團亮相

    FPGA-Based DPU網(wǎng)卡的發(fā)展和應(yīng)用

    采用單芯片的SoC形態(tài),兼顧性能和功耗。FPGA-Based DPU在硬件設(shè)計上的挑戰(zhàn)主要來自芯片面積和功耗。
    發(fā)表于 02-23 14:40 ?1784次閱讀
    FPGA-Based <b class='flag-5'>DPU</b>網(wǎng)卡的發(fā)展和應(yīng)用

    DPU技術(shù)發(fā)展及落地實戰(zhàn)

    Nitro DPU系統(tǒng)提供了密鑰、網(wǎng)絡(luò)、安全、服務(wù)器和監(jiān)控等功能支持,釋放了底層服務(wù)資源供客戶的虛擬機使用,并且NitroDPU使AWS可以提供更多的裸金屬實例類型,甚至將特定實例的網(wǎng)絡(luò)性能提升到100Gbps。
    發(fā)表于 12-26 09:36 ?1025次閱讀
    <b class='flag-5'>DPU</b>技術(shù)發(fā)展及落地實戰(zhàn)

    《數(shù)據(jù)處理器:DPU編程入門》DPU計算入門書籍測評

    一、DPU計算框架 通過一周多的時間翻閱這本書,基本上這本書是一本比較全面的,面向架構(gòu)的新手指導(dǎo)數(shù)據(jù)。它在書中詳盡介紹了關(guān)于DPU在計算機架構(gòu)中的應(yīng)用。 對于DPU來說,是一種平行于CPU和GPU
    發(fā)表于 12-24 10:54

    《數(shù)據(jù)處理器:DPU編程入門》讀書筆記

    首先感謝電子發(fā)燒友論壇提供的試讀機會。 第一周先閱讀了DPU的技術(shù)發(fā)展背景,了解到DPU是結(jié)合了高性能及軟件可編程的多核CPU、高性能網(wǎng)絡(luò)接口,以及各種靈活和可編程的加速引擎。DPU的主要作用是卸載
    發(fā)表于 12-21 10:47

    淺談DPU和CPU、GPU的關(guān)系

    把CPU的一大部分算力卸載給GPU之后,人們發(fā)現(xiàn)可以把很多其他功能也外包出去,于是又有了智能網(wǎng)卡,或者叫做DPU
    發(fā)表于 12-14 11:44 ?764次閱讀
    淺談<b class='flag-5'>DPU</b>和CPU、GPU的關(guān)系

    《數(shù)據(jù)處理器:DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    dpu:推出的主要意義是為了減輕CPU的數(shù)據(jù)處理負擔(dān),使得cpu可以更具專注自己的通用計算處理運算。 1、DPU數(shù)據(jù)處理器,演進的核心驅(qū)動力是什么? 計算工作負載的不斷增長是DPU演進的核心驅(qū)動力
    發(fā)表于 12-08 18:03

    什么是DPU?

    的網(wǎng)卡)中。 例如某些供應(yīng)商所使用的專用處理器無法用到廣泛的Arm CPU生態(tài)系統(tǒng)所提供的豐富的開發(fā)和應(yīng)用環(huán)境。 還有些其他聲稱擁有DPU廠商錯誤地將注意力只集中在使用嵌入式CPU來執(zhí)行數(shù)據(jù)路徑處理
    發(fā)表于 11-03 10:55

    解碼 DPU 編程,投稿贏取好禮!

    NVIDIA 發(fā)布首部 DPU 和 DOCA 編程入門書籍 前不久 NVIDIA 推出了備受業(yè)界好評的首部 DPU 處理器編程入門書籍 —— 《數(shù)據(jù)處理器:DPU 編程入門》 ,許多讀者紛紛留言
    的頭像 發(fā)表于 11-01 20:25 ?379次閱讀
    解碼 <b class='flag-5'>DPU</b> 編程,投稿贏取好禮!