0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用多個DPU實現(xiàn)云級架構(gòu)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Kevin Deierling ? 2022-04-19 15:58 ? 次閱讀

區(qū)別SmartNIC 與數(shù)據(jù)處理器(DPU) 的依據(jù)是它的功能,而不是形態(tài)。對稱為 SmartNICs 的一類數(shù)據(jù)中心智能網(wǎng)卡來說,它需要支持硬件傳輸和用于虛擬交換機加速的可編程數(shù)據(jù)路徑。這些功能是必要的,但不足以使 其 成為 DPU 。一個真正的 DPU 還必須包括一個易于擴展的、 C語言編程的 Linux 環(huán)境,使數(shù)據(jù)中心架構(gòu)師能夠虛擬化云中的所有資源,并使它們看起來像本地資源。為了更好地理解為什么需要這樣,讓我們討論一下-創(chuàng)建 DPU 的原因。

為什么世界需要 DPU

世界需要 DPU 的一個最重要原因是,目前的應(yīng)用程序和數(shù)據(jù)中心的設(shè)計讓 CPU 內(nèi)核花費了太多的開銷來支持網(wǎng)絡(luò)功能。隨著網(wǎng)絡(luò)速度的提高(現(xiàn)在每條鏈路的速度高達 200gb / s ), CPU 使用了太多寶貴的內(nèi)核來進行網(wǎng)絡(luò)流量的分類、跟蹤和控制。這些昂貴的 CPU 內(nèi)核是為通用應(yīng)用程序處理而設(shè)計的,最不值得的就是將它們用于網(wǎng)絡(luò)數(shù)據(jù)包的查找和管理。畢竟,用CPU內(nèi)核來分析數(shù)據(jù)并得到結(jié)果才是它們真正的價值所在。

計算虛擬化的引入使這種情況變得更糟,因為無論是在同一臺服務(wù)器上運行的VM 或容器之間, 還是和其他的計算服務(wù)器或存儲服務(wù)器之間,都需要更多的流量。軟件定義存儲( SDS )、超聚合基礎(chǔ)設(shè)施( HCI )和大數(shù)據(jù)等的應(yīng)用程序會增加服務(wù)器之間的東西向的通信流量,另外, RDMA 也通常被用來加速服務(wù)器之間的數(shù)據(jù)傳輸,這使得服務(wù)器對網(wǎng)絡(luò)基礎(chǔ)功能的處理要求更高。

隨著通信量的增加和 VXLAN 、 NVGRE 或 GENEVE 等覆蓋網(wǎng)絡(luò)的使用,公共云和私有云越來越流行。但其需求的多層封裝也進一步增加了網(wǎng)絡(luò)的復(fù)雜性。軟件定義的網(wǎng)絡(luò)( SDN )帶來了額外的數(shù)據(jù)包控制和處理的需求,這讓 CPU 花費珍貴的內(nèi)核來處理openvswitch ( OVS )等更多工作。

DPU 可以比標準 CPU 更快、更高效、更低的成本處理所有這些虛擬化的功能( SR-IOV 、 RDMA 、覆蓋網(wǎng)絡(luò)流量封裝、 OVS 卸載)。

不可忽視的安全隔離

有時,出于安全原因,您需要將網(wǎng)絡(luò)與 CPU 隔離開來。網(wǎng)絡(luò)是黑客攻擊或惡意軟件入侵最有可能的載體,但也是你第一個發(fā)現(xiàn)或阻止黑客攻擊的地方。它同時也是最有可能實現(xiàn)在線加密的地方。

DPU 作為特殊的 網(wǎng)卡 ,是檢查網(wǎng)絡(luò)流量、阻止攻擊和加密傳輸?shù)氖走x,最簡單有效,既有性能優(yōu)勢,又有安全優(yōu)勢,因為它消除了將所有傳入和傳出的數(shù)據(jù)讓CPU處理 并通過 PCIe 總線的頻繁需要。它通過與主機CPU 分開運行來提供安全隔離。如果主機CPU 受損, DPU 仍然可以檢測或阻止惡意活動。 DPU 可以在不立即涉及 CPU 的情況下檢測或阻止攻擊。

虛擬化存儲和云

DPU 的一個較新用例是虛擬化軟件定義的存儲、超聚合基礎(chǔ)設(shè)施和其他云資源。在虛擬化需求爆發(fā)之前,大多數(shù)服務(wù)器只運行本地存儲,這并不總是高效的,但卻很簡單易行。每個操作系統(tǒng)、應(yīng)用程序和 hypervisor 都知道如何使用本地存儲。

然后是網(wǎng)絡(luò)存儲的興起: SAN 、 NAS ,以及最近出現(xiàn)的 NVMe of Fabrics(NVMe-oF)。但是,并不是每個應(yīng)用程序都是原生的并可感知 SAN。另外,一些操作系統(tǒng)和 hypervisor ,比如 Windows 和 VMware ,都還沒有考慮到 NVMe-oF 。 DPU 可以支持虛擬化網(wǎng)絡(luò)存儲,即可以更高效也更易于管理,讓虛擬化網(wǎng)絡(luò)存儲看起來就像本地存儲,非常易于應(yīng)用程序使用。一個 DPU 甚至可以虛擬化 GPU或其他神經(jīng)網(wǎng)絡(luò)處理器,這樣任何服務(wù)器在需要時都可以通過網(wǎng)絡(luò)訪問任意數(shù)量的 GPU。

類似的DPU優(yōu)勢也適用于軟件定義的存儲和超聚合基礎(chǔ)架構(gòu)。兩種架構(gòu)傳統(tǒng)上都使用管理層軟件(通常作為 VM 或 hypervisor的一部分來運行)來虛擬化和抽象本地存儲和網(wǎng)絡(luò),以使其可供集群中的其他服務(wù)器或客戶端使用。這對于服務(wù)器的快速部署,及共享存儲資源帶來了極大的便利。然而,管理層和虛擬化占用了許多本應(yīng)運行應(yīng)用程序的 CPU 資源。更糟糕的是,網(wǎng)絡(luò)帶寬越大,存儲速度越快,需要損耗的CPU 的資源就越多。

這也是智能 DPU 創(chuàng)造效率的地方。首先,它卸載并幫助虛擬化網(wǎng)絡(luò)。它們加速了私有云和公共云,這就是為什么它們有時被稱為 CloudNICs 。它們可以卸載網(wǎng)絡(luò)和大部分甚至全部的存儲虛擬化。 DPU 還可以減輕 SDS 和 HCI 的各種功能,如壓縮、加密、重復(fù)數(shù)據(jù)消除、 RAID 、報告等。這一切都是為了把更昂貴的 CPU 內(nèi)核送回它們最擅長的領(lǐng)域:運行應(yīng)用程序。

圖 1 。 DPU 是一種可編程的、專用的電子電路板,具有數(shù)據(jù)中心計算數(shù)據(jù)處理的硬件加速功能

必須有硬件加速

在介紹了主要的 DPU 用例之后,您應(yīng)該已經(jīng)清楚何時何地使用DPU會帶來最大的好處:加速和卸載網(wǎng)絡(luò)流量,虛擬化存儲資源,通過網(wǎng)絡(luò)共享 GPU, 以及支持 RDMA 和執(zhí)行加解密。

那么 最優(yōu)的DPU 需要具備什么?必須有硬件加速。 硬件加速提供了最好的性能和效率,這也意味著用更少的開銷進行更多的卸載。為某些功能提供專用硬件的能力讓采用DPU 的機會大大增加。

必須可編程

為了獲得最佳性能,大多數(shù)加速功能必須在硬件上運行。為了獲得最大的靈活性,這些功能的控制和編程必須在軟件中運行。

在 DPU 上有許多功能可以編程,通常,特定的卸載方法、加密算法和傳輸機制不會有太大變化,但是路由規(guī)則、流表、加密的密鑰和網(wǎng)絡(luò)地址會一直會變化。前者是數(shù)據(jù)平面,后者是控制平面。數(shù)據(jù)平面規(guī)則和算法經(jīng)過標準化后,可以被固化到芯片中。但控制平面規(guī)則和要求變化太快,無法固化,但可以在 FPGA 上運行(偶爾修改,但很困難),也可以在 支持C語言編程的 Linux 環(huán)境中運行(容易且可以經(jīng)常修改)。

表 1 。 DPU 功能指南

在 DPU 上需要多少編程?

您可以選擇在DPU 上有多少功能要由運行程序完成,也就是說,處理數(shù)據(jù)包的數(shù)據(jù)平面由DPU處理 (硬件加速或/和 開發(fā)的程序),同時, 用于設(shè)置和管理規(guī)則的控制平面,可以由用戶決定是由DPU來全權(quán)處理,還是由位于其他地方的處理器,如 CPU來處理 。

例如,使用 Open vSwitch ,包交換可以在軟件或硬件中完成,而控制平面則可以在 CPU 或 DPU 上運行。如果是常規(guī)的基礎(chǔ)網(wǎng)卡,所有的交換和控制都必須由 CPU 上的軟件完成。 使用 SmartNIC 時,交換在網(wǎng)卡的 ASIC 上運行,但控制仍必須在 CPU 上完成。 只有在真正的 DPU 中,交換是由DPU卡上的 ASIC完成,而控制平面也是在DPU包含的 Arm 內(nèi)核上運行。

圖 2 。 ConnectX-5 SmartNIC 卸載 OVS 切換到 NIC 硬件

DPU 和 SmartNIC 哪一個最好?

為了在數(shù)據(jù)中心充分實現(xiàn)應(yīng)用程序的效率,傳輸卸載、可編程的數(shù)據(jù)平面以及用于虛擬交換的硬件卸載都是至關(guān)重要的功能。根據(jù)定義,支持這些功能是 SmartNIC 的重要部分,。但只是 DPU 的最基本要求之一, 并不能將 SmartNIC 提升到 DPU 的級別。

客戶經(jīng)常告訴我們,他們必須有 DPU,因為他們需要可編程的虛擬交換硬件加速支持。這主要是某些供應(yīng)商的誤導(dǎo)。如果某個供應(yīng)商只能提供昂貴的、幾乎無法編程的產(chǎn)品,他會告訴客戶,“ DPU ”是實現(xiàn)這一目標的唯一方法。對我們來說,這種情況只需要我們的 ConnectX 系列的 SmartNIC 。

我覺得要將 SmartNIC 提升到 DPU 的高度,還需要支持更多的功能,比如能夠運行控制平面,以及在 Linux 環(huán)境下提供 C 語言編程。我們很自豪地提供 BlueField DPU 來支持所有這些,它包括 ConnectX 的所有智能 網(wǎng)卡 功能,以及 4 到 16 個 64 位的 Arm 內(nèi)核,當(dāng)然,所有這些內(nèi)核都運行 Linux ,并且易于編程。

在計劃下一個基礎(chǔ)架構(gòu)的構(gòu)建或更新時,請記住以下要點:

DPU 在卸載網(wǎng)絡(luò)功能和虛擬化存儲、網(wǎng)絡(luò)和 GPU 等資源方面越來越有用

SmartNIC 可以在硬件中加速數(shù)據(jù)平面任務(wù),但必須依靠host CPU來運行控制平面

控制平面軟件和其他管理軟件可以在常規(guī) CPU 或 DPU 上運行。

NVIDIA 提供業(yè)界最佳的SmartNICs ( ConnectX )、 FPGA NIC ( Innova )和完全可編程并支持數(shù)據(jù)平面及控制平面 DPU s ( BlueField 可編程 DPU )。

關(guān)于作者

Kevin Deierling 從 2013 年 3 月開始擔(dān)任 Mellanox 的營銷副總裁。此前,他曾擔(dān)任 Genia Technologies 的技術(shù)副總裁、 Silver Spring Networks 的首席架構(gòu)師,并在 Spans Logic 負責(zé)營銷和業(yè)務(wù)開發(fā)

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10781

    瀏覽量

    210531
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11182

    瀏覽量

    208533
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4588

    瀏覽量

    71824
收藏 人收藏

    評論

    相關(guān)推薦

    微服務(wù)架構(gòu)與容器的關(guān)系與區(qū)別

    微服務(wù)架構(gòu)與容器密切相關(guān)又有所區(qū)別。微服務(wù)將大型應(yīng)用拆分為小型、獨立的服務(wù),而容器基于容器技術(shù),為微服務(wù)提供構(gòu)建、發(fā)布和運行的平臺。區(qū)別在于,微服務(wù)是架構(gòu)風(fēng)格,注重服務(wù)拆分與部署;
    的頭像 發(fā)表于 10-21 17:28 ?89次閱讀

    【「大模型時代的基礎(chǔ)架構(gòu)」閱讀體驗】+ 未知領(lǐng)域的感受

    算法的引擎GPU、GPU硬件架構(gòu)剖析、GPU服務(wù)器的設(shè)計與實現(xiàn)、GPU集群的網(wǎng)絡(luò)設(shè)計與實現(xiàn)、GPU板卡算力調(diào)度技術(shù)、基于平臺的GPU集群
    發(fā)表于 10-08 10:40

    中科馭數(shù)分析DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實際應(yīng)用

    的探索與實踐”專題論壇,業(yè)內(nèi)DPU專家們將討論焦點鎖定在了DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實際應(yīng)用,深入探討了如何利用DPU技術(shù)解決計算系統(tǒng)問題,進一步推動了
    的頭像 發(fā)表于 08-02 11:21 ?593次閱讀

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    ,在其上掛載了各種計算、存儲資源的節(jié)點,對于系統(tǒng)的資源彈性、運行效率、性能都大有益處。但是這種使用方式的變化,需要對現(xiàn)有計算架構(gòu)進行一定程度的變革,才能充分發(fā)揮出 DPU的優(yōu)勢。
    發(fā)表于 07-24 15:32

    明天線上見!DPU構(gòu)建高性能算力底座——DPU技術(shù)開放日最新議程公布!

    技術(shù)在不同行業(yè)中的應(yīng)用解決方案有哪些?能帶來怎樣的業(yè)務(wù)效果? 3月29日本周五,中科馭數(shù)集結(jié)產(chǎn)品大咖及解決方案專家團,誠邀您參加以“DPU構(gòu)建高性能算力底座”為主題的線上DPU技術(shù)開放日! 他們將逐一與您分享中科馭數(shù)系列
    的頭像 發(fā)表于 04-03 18:12 ?945次閱讀

    星云智聯(lián)為金山打造裸金屬服務(wù)器DPU解決方案,助力高端用戶實現(xiàn)更強大更高效的上體驗

    國內(nèi)領(lǐng)先的DPU和智能網(wǎng)卡芯片與解決方案提供商星云智聯(lián)近日宣布,與中國知名服務(wù)商金山共同開發(fā)了基于星云智聯(lián)NebulaMatrix DPU解決方案的金山
    的頭像 發(fā)表于 02-20 09:06 ?550次閱讀

    星云智聯(lián)首款自研DPU ASIC芯片一版流片成功

    近日,星云智聯(lián)自主研發(fā)的DPU芯片M18120回片后,十分鐘內(nèi)成功點亮,十八小時完成通流驗證,成功實現(xiàn)了芯片設(shè)計目標!這一優(yōu)異的成績得益于星云智聯(lián)規(guī)范的IPD產(chǎn)品流程、嚴格的質(zhì)量控制、高效的項目管理
    的頭像 發(fā)表于 01-26 14:34 ?633次閱讀

    中科馭數(shù)自研第二代DPU芯片K2獲得行業(yè)認可

    近日,中科馭數(shù)自研第二代DPU芯片K2在眾多云生態(tài)創(chuàng)新應(yīng)用技術(shù)產(chǎn)品中脫穎而出,成功入選由中國產(chǎn)業(yè)聯(lián)盟暨中關(guān)村計算產(chǎn)業(yè)聯(lián)盟發(fā)布的“2023年中國生態(tài)創(chuàng)新應(yīng)用技術(shù)產(chǎn)品”。這一殊榮既是
    的頭像 發(fā)表于 01-18 09:20 ?950次閱讀

    《數(shù)據(jù)處理器:DPU編程入門》DPU計算入門書籍測評

    , 數(shù)據(jù)加速應(yīng)用實踐 。 分別介紹了DPU技術(shù)和英偉達DPU技術(shù): DPU的誕生 現(xiàn)代計算架構(gòu)及問題 數(shù)據(jù)解耦及大帶寬數(shù)據(jù)應(yīng)用 英偉達DPU
    發(fā)表于 12-24 10:54

    《數(shù)據(jù)處理器:DPU編程入門》讀書筆記

    ,讓用戶可以不用關(guān)注DPU的底層硬件接口而直接對硬件進行編程。 此外,DPU是數(shù)據(jù)中心基礎(chǔ)架構(gòu)的處理芯片,預(yù)測至少30%的CPU資源用于執(zhí)行數(shù)據(jù)中心基礎(chǔ)設(shè)施架構(gòu),而這些任務(wù)都可以卸載到
    發(fā)表于 12-21 10:47

    《數(shù)據(jù)處理器:DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    之一。隨著人們對計算和大數(shù)據(jù)處理需求的增加,數(shù)據(jù)中心的計算負載也不斷增加。傳統(tǒng)的中央處理器(CPU)在處理這些工作負載時可能會遇到瓶頸,難以提供足夠的性能和效率。DPU通過提供專門的硬件加速,可以
    發(fā)表于 12-08 18:03

    上多活高可用架構(gòu),助力企業(yè)實現(xiàn)業(yè)務(wù)無縫切換與持續(xù)穩(wěn)定運行

    多活高可用架構(gòu),以實現(xiàn)業(yè)務(wù)的無縫切換和持續(xù)穩(wěn)定運行。2023年云棲大會現(xiàn)場阿里高級專家丁杰現(xiàn)場分享了《上多活高可用架構(gòu)的趨勢和實踐》的主
    的頭像 發(fā)表于 11-08 14:12 ?569次閱讀
    <b class='flag-5'>云</b>上多活高可用<b class='flag-5'>架構(gòu)</b>,助力企業(yè)<b class='flag-5'>實現(xiàn)</b>業(yè)務(wù)無縫切換與持續(xù)穩(wěn)定運行

    什么是DPU

    三個關(guān)鍵要素于一身。DPU是一種SOC(System On Chip),它結(jié)合了: 行業(yè)標準的、高性能及軟件可編程的多核CPU,通?;谝褢?yīng)用廣泛的Arm架構(gòu),與其的SOC組件密切配合。 高性能網(wǎng)絡(luò)接口
    發(fā)表于 11-03 10:55

    保姆操作示例!騰訊MQTT功能的連接與實現(xiàn)

    本文將探討如何通過串口服務(wù)器實現(xiàn)與騰訊MQTT功能的連接,進一步實現(xiàn)物聯(lián)網(wǎng)設(shè)備與云端的高效數(shù)據(jù)交互。騰訊的MQTT功能是一種基于發(fā)布/訂閱模式的消息傳輸協(xié)議,具有低帶寬占用、低耗電
    的頭像 發(fā)表于 11-03 08:21 ?1544次閱讀
    保姆<b class='flag-5'>級</b>操作示例!騰訊<b class='flag-5'>云</b>MQTT功能的連接與<b class='flag-5'>實現(xiàn)</b>

    解碼 DPU 編程,投稿贏取好禮!

    十余位資深系統(tǒng)架構(gòu)師歷經(jīng)數(shù)月編寫而成,定位為 NVIDIA BlueField 系列 DPU 和 NVIDIA DOCA 開發(fā)環(huán)境
    的頭像 發(fā)表于 11-01 20:25 ?381次閱讀
    解碼 <b class='flag-5'>DPU</b> 編程,投稿贏取好禮!