0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Spark基于DPU的Native引擎算子卸載方案

中科馭數(shù) ? 來源:中科馭數(shù) ? 作者:中科馭數(shù) ? 2024-06-28 17:12 ? 次閱讀

1.背景介紹

Apache Spark(以下簡(jiǎn)稱Spark)是一個(gè)開源的分布式計(jì)算框架,由UC Berkeley AMP Lab開發(fā),可用于批處理、交互式查詢(Spark SQL)、實(shí)時(shí)流處理(Spark Streaming)、機(jī)器學(xué)習(xí)(Spark MLlib)和圖計(jì)算(GraphX)。Spark使用內(nèi)存加載保存數(shù)據(jù)并進(jìn)行迭代計(jì)算,減少磁盤溢寫,同時(shí)支持 Java、Scala、Python和 R等多種高級(jí)編程語言,這使得Spark可以應(yīng)對(duì)各種復(fù)雜的大數(shù)據(jù)應(yīng)用場(chǎng)景,例如金融、電商、社交媒體等。

Spark 經(jīng)過多年發(fā)展,作為基礎(chǔ)的計(jì)算框架,不管是在穩(wěn)定性還是可擴(kuò)展性方面,以及生態(tài)建設(shè)都得到了業(yè)界廣泛認(rèn)可。盡管Apache社區(qū)對(duì)Spark逐步引入了諸如鎢絲計(jì)劃、向量化 Parquet Reader等一系列優(yōu)化,整體的計(jì)算性能也有兩倍左右的提升,但在 3.0版本以后,整體計(jì)算性能的提升有所減緩,并且隨著存儲(chǔ)、網(wǎng)絡(luò)以及IO技術(shù)的提升,CPU也逐漸成為Spark計(jì)算性能的瓶頸。如何在Spark現(xiàn)有框架上,增強(qiáng)大數(shù)據(jù)計(jì)算能力,提高CPU利用率,成為近年來業(yè)界的研究方向。

2.開源優(yōu)化方案

Spark本身使用scala語言編寫,整體架構(gòu)基于 JVM開發(fā),只能利用到一些比較基礎(chǔ)的 CPU指令集。雖然有JIT的加持,但相比目前市面上的Native向量化計(jì)算引擎而言,性能還是有較大差距。因此考慮如何將具有高性能計(jì)算能力的Native向量引擎引用到 Spark里來,提升 Spark的計(jì)算性能,突破 CPU瓶頸,成為一種可行性較高的解決方案。

隨著Meta在2022年超大型數(shù)據(jù)庫國際會(huì)議(VLDB)上發(fā)表論文《Velox:Meta's Unified Execution Engine》,并且Intel創(chuàng)建的Gluten項(xiàng)目基于Apache Arrow數(shù)據(jù)格式和Substrait查詢計(jì)劃的JNI API將Spark JVM和執(zhí)行引擎解耦,從而將Velox集成到Spark中,這使得使用Spark框架+Native向量引擎的大數(shù)據(jù)加速方案成為現(xiàn)實(shí)。

3.DPU計(jì)算卡與軟件開發(fā)平臺(tái)

AI大模型的發(fā)展,金融、電商等領(lǐng)域數(shù)據(jù)處理需求的增加,生活應(yīng)用虛擬化程度的加深,都對(duì)現(xiàn)代化數(shù)據(jù)中心提出嚴(yán)峻的考驗(yàn)。未來數(shù)據(jù)中心的發(fā)展趨勢(shì),逐步演變成CPU + DPU + GPU三足鼎立的情況,CPU用于通用計(jì)算,GPU用于加速計(jì)算,DPU則進(jìn)行數(shù)據(jù)處理。將大數(shù)據(jù)計(jì)算卸載到具有高度定制化和數(shù)據(jù)處理優(yōu)化架構(gòu)的大規(guī)模數(shù)據(jù)計(jì)算DPU卡上,可以有效提高計(jì)算密集型應(yīng)用場(chǎng)景下數(shù)據(jù)中心的性能和效率,降低其成本和能耗。

中科馭數(shù)CONFLUX?-2200D大數(shù)據(jù)計(jì)算DPU卡主要應(yīng)用于大數(shù)據(jù)計(jì)算場(chǎng)景。CONFLUX?-2200D通過計(jì)算DPU卸載加速,存儲(chǔ)DPU卸載加速和網(wǎng)絡(luò)DPU卸載加速實(shí)現(xiàn)大數(shù)據(jù)計(jì)算性能3-6倍提升。CONFLUX?-2200D是基于中科馭數(shù)自主知識(shí)產(chǎn)權(quán)的KPU(Kernel Processing Unit)架構(gòu)、DOE(Data Offloading Engine)硬件數(shù)據(jù)庫運(yùn)算卸載引擎和LightningDMA中科馭數(shù)自主知識(shí)產(chǎn)權(quán)的基于DMA的直接內(nèi)存寫入技術(shù)提出的領(lǐng)域?qū)S肈PU卡。能夠滿足無侵入適配、自主可控、安全可靠,支持存算一體、存算分離等不同場(chǎng)景。

中科馭數(shù)HADOS是中科馭數(shù)推出的專用計(jì)算敏捷異構(gòu)軟件開發(fā)平臺(tái)。HADOS?數(shù)據(jù)查詢加速庫通過提供基于列式數(shù)據(jù)的查詢接口,供數(shù)據(jù)查詢應(yīng)用,目前Spark、PostgreSQL已通過插件的形式適配。支持Java、Scala、C和C++語言的函數(shù)調(diào)用,主要包括列數(shù)據(jù)管理、數(shù)據(jù)查詢運(yùn)行時(shí)函數(shù)、任務(wù)調(diào)度引擎、函數(shù)運(yùn)算代價(jià)評(píng)估、內(nèi)存管理、存儲(chǔ)管理、硬件管理、DMA引擎、日志引擎等模塊,目前對(duì)外提供數(shù)據(jù)管理、查詢函數(shù)、硬件管理、文件存儲(chǔ)相關(guān)功能API。

4.Spark框架+Gluten-Velox向量化執(zhí)行引擎+DPU加速卡

4.1方案簡(jiǎn)介

隨著SSD和萬兆網(wǎng)卡普及以及I/O技術(shù)的提升,Spark用戶的數(shù)據(jù)負(fù)載計(jì)算能力逐漸受到CPU性能瓶頸的約束。由于Spark本身基于JVM的Task計(jì)算模型的CPU指令優(yōu)化,要遠(yuǎn)遠(yuǎn)遜色于其他的Native語言(C++等),再加上開源社區(qū)的Native引擎已經(jīng)發(fā)展得比較成熟,具備優(yōu)秀的量化執(zhí)行能力,這就使得那些現(xiàn)有的Spark用戶,如果想要獲得這些高性能計(jì)算能力就需要付出大量的遷移和運(yùn)維成本。

Gluten解決了這一關(guān)鍵性問題,讓Spark用戶無需遷移,就能享受這些成熟的Native引擎帶來的性能優(yōu)勢(shì)。Gluten最核心的能力就是通過Spark Plugin的機(jī)制,把Spark查詢計(jì)劃攔截并下發(fā)給Native引擎來執(zhí)行,跳過原生Spark不高效的執(zhí)行路徑。整體的執(zhí)行框架仍沿用Spark既有實(shí)現(xiàn),并且對(duì)于Native引擎無法承接的算子,Gluten安排Fallback回正常的Spark執(zhí)行路徑進(jìn)行計(jì)算,從而保證Spark任務(wù)執(zhí)行的穩(wěn)定性。同時(shí)Gluten還實(shí)現(xiàn)了Fallback、本地內(nèi)存管理等功能,使得Spark可以更好利用Native引擎帶來的高性能計(jì)算能力。

Velox是一個(gè)集合了現(xiàn)有各種計(jì)算引擎優(yōu)化的新穎的C++數(shù)據(jù)加速庫,其重新設(shè)計(jì)了數(shù)據(jù)模型以支持復(fù)雜數(shù)據(jù)類型的高效計(jì)算,并且提供可重用、可擴(kuò)展、高性能且與上層軟件無關(guān)的數(shù)據(jù)處理組件,用于構(gòu)建執(zhí)行引擎和增強(qiáng)數(shù)據(jù)管理系統(tǒng)。

由于Velox只接收完全優(yōu)化的查詢計(jì)劃作為輸入,不提供 SQL解析器、dataframe層、其他 DSL或全局查詢優(yōu)化器,專注于成為大數(shù)據(jù)計(jì)算的執(zhí)行引擎。這就使得Gluten+Velox架構(gòu)可以各司其職,從而實(shí)現(xiàn)數(shù)據(jù)庫組件模塊化。

wKgZomZ-fKiAAsUcAAFEwmESLqQ755.png

要將Gluten+Velox優(yōu)化過的Spark計(jì)算任務(wù)卸載到DPU卡,還缺少一個(gè)異構(gòu)中間層,為此中科馭數(shù)研發(fā)了HADOS異構(gòu)執(zhí)行庫,該庫提供列數(shù)據(jù)管理、數(shù)據(jù)查詢運(yùn)行時(shí)函數(shù)、任務(wù)調(diào)度引擎、函數(shù)運(yùn)算代價(jià)評(píng)估、內(nèi)存管理等多種DPU能力的API接口,并且支持Java,C++等多種大數(shù)據(jù)框架語言的調(diào)用,擁有極強(qiáng)的拓展性,以及與現(xiàn)有生態(tài)的適配性。HADOS敏捷異構(gòu)軟件平臺(tái)可以適應(yīng)復(fù)雜的大數(shù)據(jù)軟件生態(tài),在付出較小成本的情況下為多種計(jì)算場(chǎng)景提供DPU算力加速。Spark框架集成Gluten+Velox向量化執(zhí)行引擎,然后使用HADOS平臺(tái),就可以將經(jīng)過向量化優(yōu)化的計(jì)算任務(wù),利用DPU執(zhí)行,從而徹底釋放CPU,實(shí)現(xiàn)DPU高性能計(jì)算。

4.2 DPU算力卸載

velox是由C++實(shí)現(xiàn)的向量化計(jì)算引擎,其核心執(zhí)行框架涵蓋了任務(wù)(Task)、驅(qū)動(dòng)(Driver)和操作器(Operator)等組件。velox將Plan轉(zhuǎn)換為由PlanNode組成的一棵樹,然后將PlanNode轉(zhuǎn)換為Operator。Operator作為基礎(chǔ)的算子,是實(shí)際算法執(zhí)行的邏輯框架,也是實(shí)現(xiàn)DPU計(jì)算卸載的關(guān)鍵。

4.2.1邏輯框架

Operator作為實(shí)際算法的邏輯框架,承載著各種表達(dá)式的抽象,每一個(gè)Operator中包含一個(gè)或多個(gè)表達(dá)式來實(shí)現(xiàn)一個(gè)復(fù)雜完整的計(jì)算邏輯塊,表達(dá)式的底層是由function來具體實(shí)現(xiàn)。Velox向開發(fā)人員提供了API可以實(shí)現(xiàn)自定義scalar function,通過實(shí)現(xiàn)一個(gè)異構(gòu)計(jì)算版本的function,然后將這個(gè)function注冊(cè)到Velox的函數(shù)系統(tǒng)中,就可以將計(jì)算任務(wù)卸載到DPU卡上。任務(wù)執(zhí)行過程如下圖:

wKgZomZ-fJSAcULaAACu8X5ZUvM185.png

中科馭數(shù)的CONFLUX?-2200DS大數(shù)據(jù)計(jì)算加速DPU卡可以實(shí)現(xiàn)列式計(jì)算,并且HADOS平臺(tái)支持C++語言,所以可以直接解析Velox的向量化參數(shù)。對(duì)于列式存儲(chǔ)的數(shù)據(jù),經(jīng)過對(duì)數(shù)據(jù)類型的簡(jiǎn)單處理之后,可以直接交給DPU執(zhí)行計(jì)算任務(wù),免去了數(shù)據(jù)行列轉(zhuǎn)換的性能損失,同時(shí)也降低了DPU計(jì)算資源集成的運(yùn)維難度,大大提高了Velox異構(gòu)開發(fā)的效率。

4.2.2算子卸載

以我們實(shí)現(xiàn)卸載的Filter算子為例,對(duì)于cast(A as bigint)>1這一具體的表達(dá)式,來探究如何實(shí)現(xiàn)”>”這一二元運(yùn)算符的卸載。

Filter算子的Operator中會(huì)使用有一個(gè) std::unique_ptr exprs_的變量,用來執(zhí)行過濾和投影的計(jì)算。ExprSet是Filter算子計(jì)算的核心,其本質(zhì)是一顆表達(dá)式樹。cast(A as bigint)>1的表達(dá)式樹以及表達(dá)式樹的靜態(tài)節(jié)點(diǎn)類型如下:

wKgaomZ-fIeABX1EAABKIi2tCto087.png

節(jié)點(diǎn)類型 作用
FieldAccessTypedExpr 表示RowVector中的某一列,作為表達(dá)式的葉子節(jié)點(diǎn)
ConstantTypedExpr 表示常量值,作為表達(dá)式的葉子節(jié)點(diǎn)
CallTypedExpr 表示函數(shù)調(diào)用表達(dá)式,子節(jié)點(diǎn)表示輸入?yún)?shù)
表示特殊類型表達(dá)式,包括
if/and/or/switch/cast/try/coalesce等
CastTypedExpr 類型轉(zhuǎn)換
LambdaTypedExpr Lambda表達(dá)式,作為葉子節(jié)點(diǎn)

在表達(dá)式的所有子節(jié)點(diǎn)執(zhí)行完后,會(huì)執(zhí)行applyFunction,說明當(dāng)前表達(dá)式節(jié)點(diǎn)是一個(gè)函數(shù)調(diào)用,然后調(diào)用vectorFunction_的apply來對(duì)結(jié)果進(jìn)行處理,輸入是inputValues_數(shù)組,該數(shù)組長(zhǎng)度與函數(shù)的表達(dá)式葉子節(jié)點(diǎn)數(shù)相等(文中示例表達(dá)式的葉子節(jié)點(diǎn)為2),作為函數(shù)的參數(shù),result為輸出,結(jié)果為VectorPtr,程序流程圖如下:

wKgaomZ-fH-AHggnAABj-GQ8lJE207.png

4.2.3 Fallback

現(xiàn)階段我們只實(shí)現(xiàn)了Filter算子的部分表達(dá)式,后續(xù)還會(huì)繼續(xù)支持更多的算子和表達(dá)式。對(duì)于一些無法執(zhí)行的算子和表達(dá)式,還是需要退回給Velox,交由CPU執(zhí)行,從而保證SQL的正常執(zhí)行。由于處理的是列式數(shù)據(jù),所以回退的執(zhí)行計(jì)劃可以不需要任何處理,就可以直接從HADOS退還給Velox,幾乎無性能損失。

4.2.4 DPU資源管理

HADOS平臺(tái)會(huì)對(duì)服務(wù)器的DPU資源進(jìn)行統(tǒng)一管理。對(duì)于卸載的計(jì)算任務(wù)根據(jù)現(xiàn)有的DPU資源進(jìn)行動(dòng)態(tài)分配,從而實(shí)現(xiàn)計(jì)算資源的高效利用。同時(shí)HADOS平臺(tái)還會(huì)對(duì)計(jì)算任務(wù)中所需的內(nèi)存進(jìn)行合理的分配,動(dòng)態(tài)申請(qǐng)和釋放系統(tǒng)內(nèi)存,從而減少額外的內(nèi)存開銷。

4.3加速效果

單機(jī)單線程local模式,使用1G數(shù)據(jù)集,僅卸載Filter算子的部分表達(dá)式的場(chǎng)景下,TPC-DS語句中有5條SQL語句,可以將使用開源方案的加速效果提升15-20%左右。q70語句,在開源方案提升100%的基礎(chǔ)上,提升了15%;q89語句,在開源方案提升50%的基礎(chǔ)上,提升了27%;q06在開源方案提升170%的基礎(chǔ)上,提升了13%。

wKgaomZ-fHmAe35qAAC7txK8IwA017.png

單一運(yùn)算符場(chǎng)景下(SELECT a FROM t WHERE a = 100),使用DPU運(yùn)算符相比 Spark原生的運(yùn)算符的加速比最高達(dá)到12.7。

wKgZomZ-fHWAK8o8AACJ7iopfBE806.png

5.不足和展望

中科馭數(shù)HADOS敏捷異構(gòu)軟件平臺(tái)可以十分輕松地與現(xiàn)有開源大數(shù)據(jù)加速框架相結(jié)合,并且為開源框架提供豐富的算力卸載功能。HADOS平臺(tái)在完美發(fā)揮開源加速框架優(yōu)勢(shì)的前提下,為大數(shù)據(jù)任務(wù)提供硬件加速能力。由于現(xiàn)在我們只實(shí)現(xiàn)了較小部分算子卸載的驗(yàn)證,在執(zhí)行具有復(fù)雜算子操作的SQL時(shí)無法發(fā)揮出DPU的全部實(shí)力,并且因?yàn)殚_源方案在設(shè)計(jì)之處并沒有考慮到使用DPU硬件,所以在磁盤IO,算子優(yōu)化等方面的性能還有待優(yōu)化。后續(xù)我們也會(huì)從一下幾個(gè)方面來進(jìn)一步做特定優(yōu)化:

開發(fā)更多較復(fù)雜的算子,例如重量級(jí)的聚合算子會(huì)消耗CPU大量的計(jì)算能力從而影響Spark作業(yè),通過將聚合算子卸載到DPU硬件來解放CPU能力,從而使得加速效果更加明顯;

優(yōu)化DPU的磁盤讀寫,讓DPU可以直接讀取硬盤數(shù)據(jù),省去數(shù)據(jù)在服務(wù)器內(nèi)部的傳輸時(shí)間,可以減少數(shù)據(jù)準(zhǔn)備階段的性能損耗;

RDMA技術(shù),可以直讀取遠(yuǎn)端內(nèi)存數(shù)據(jù),數(shù)據(jù)傳輸內(nèi)容直接卸載到網(wǎng)卡,減少數(shù)據(jù)在系統(tǒng)內(nèi)核中額外的數(shù)據(jù)復(fù)制與移動(dòng),可以減少大數(shù)據(jù)任務(wù)計(jì)算過程中的性能損耗。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10769

    瀏覽量

    210428
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    352

    瀏覽量

    24072
  • SPARK
    +關(guān)注

    關(guān)注

    1

    文章

    105

    瀏覽量

    19842
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    服務(wù)網(wǎng)格DPU卸載解決方案

    服務(wù)網(wǎng)格(Service Mesh)是微服務(wù)架構(gòu)中的一種重要技術(shù),它主要處理服務(wù)之間的通信,為服務(wù)間的信息交換提供更安全、更快速且更可靠的基礎(chǔ)設(shè)施層。服務(wù)網(wǎng)格將服務(wù)治理從業(yè)務(wù)邏輯中剝離出來,拆解為獨(dú)立的進(jìn)程,實(shí)現(xiàn)異構(gòu)系統(tǒng)的統(tǒng)一治理和增強(qiáng)網(wǎng)絡(luò)安全。
    的頭像 發(fā)表于 09-20 16:25 ?198次閱讀
    服務(wù)網(wǎng)格<b class='flag-5'>DPU</b><b class='flag-5'>卸載</b>解決<b class='flag-5'>方案</b>

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    、VMware、Palo Alto 等公司紛紛推出相關(guān)解決方案。這些方案背后共同的本質(zhì)思想是:將云計(jì)算的 IaaS 層組件從服務(wù)器側(cè)卸載后圍繞 DPU 構(gòu)筑高性能算力底座,與 AWS、
    發(fā)表于 07-24 15:32

    spark運(yùn)行的基本流程

    前言: 由于最近對(duì)spark的運(yùn)行流程非常感興趣,所以閱讀了《Spark大數(shù)據(jù)處理:技術(shù)、應(yīng)用與性能優(yōu)化》一書。通過這本書的學(xué)習(xí),了解了spark的核心技術(shù)、實(shí)際應(yīng)用場(chǎng)景以及性能優(yōu)化的方法。本文旨在
    的頭像 發(fā)表于 07-02 10:31 ?302次閱讀
    <b class='flag-5'>spark</b>運(yùn)行的基本流程

    Spark+Hive”在DPU環(huán)境下的性能測(cè)評(píng) | OLAP數(shù)據(jù)庫引擎選型白皮書(24版)DPU部分節(jié)選

    在奇點(diǎn)云2024年版《OLAP數(shù)據(jù)庫引擎選型白皮書》中,中科馭數(shù)聯(lián)合奇點(diǎn)云針對(duì)Spark+Hive這類大數(shù)據(jù)計(jì)算場(chǎng)景下的主力引擎,測(cè)評(píng)DPU環(huán)境下對(duì)比CPU環(huán)境下的性能提升效果。特此節(jié)
    的頭像 發(fā)表于 05-30 16:09 ?402次閱讀
    “<b class='flag-5'>Spark</b>+Hive”在<b class='flag-5'>DPU</b>環(huán)境下的性能測(cè)評(píng) | OLAP數(shù)據(jù)庫<b class='flag-5'>引擎</b>選型白皮書(24版)<b class='flag-5'>DPU</b>部分節(jié)選

    鴻蒙OS開發(fā)實(shí)例:【Native C++】

    使用DevEco Studio創(chuàng)建一個(gè)Native C++應(yīng)用。應(yīng)用采用Native C++模板,實(shí)現(xiàn)使用NAPI調(diào)用C標(biāo)準(zhǔn)庫的功能。使用C標(biāo)準(zhǔn)庫hypot接口計(jì)算兩個(gè)給定數(shù)平方和的平方根。在輸入框中輸入兩個(gè)數(shù)字,點(diǎn)擊計(jì)算結(jié)果按鈕顯示計(jì)算后的數(shù)值。
    的頭像 發(fā)表于 04-14 11:43 ?2347次閱讀
    鴻蒙OS開發(fā)實(shí)例:【<b class='flag-5'>Native</b> C++】

    中科馭數(shù)DPU技術(shù)開放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時(shí)網(wǎng)絡(luò)等方案組團(tuán)亮相

    DPU技術(shù)開放日既是對(duì)DPU技術(shù)應(yīng)用的典型方案展示,也是DPU技術(shù)在重要細(xì)分場(chǎng)景走向成熟的標(biāo)志。
    的頭像 發(fā)表于 04-01 11:48 ?671次閱讀
    中科馭數(shù)<b class='flag-5'>DPU</b>技術(shù)開放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時(shí)網(wǎng)絡(luò)等<b class='flag-5'>方案</b>組團(tuán)亮相

    Spark基于DPU Snappy壓縮算法的異構(gòu)加速方案

    一、總體介紹 1.1 背景介紹 Apache Spark是專為大規(guī)模數(shù)據(jù)計(jì)算而設(shè)計(jì)的快速通用的計(jì)算引擎,是一種與 Hadoop 相似的開源集群計(jì)算環(huán)境,但是兩者之間還存在一些不同之處,這些不同之處使
    的頭像 發(fā)表于 03-26 17:06 ?669次閱讀
    <b class='flag-5'>Spark</b>基于<b class='flag-5'>DPU</b> Snappy壓縮算法的異構(gòu)加速<b class='flag-5'>方案</b>

    基于DPU和HADOS-RACE加速Spark 3.x

    背景簡(jiǎn)介 Apache Spark(下文簡(jiǎn)稱Spark)是一種開源集群計(jì)算引擎,支持批/流計(jì)算、SQL分析、機(jī)器學(xué)習(xí)、圖計(jì)算等計(jì)算范式,以其強(qiáng)大的容錯(cuò)能力、可擴(kuò)展性、函數(shù)式API、多語言支持(SQL
    的頭像 發(fā)表于 03-25 18:12 ?1204次閱讀
    基于<b class='flag-5'>DPU</b>和HADOS-RACE加速<b class='flag-5'>Spark</b> 3.x

    興漢攜手芯啟源發(fā)布一款為網(wǎng)絡(luò)防火墻量身定制的DPU安全卸載模塊

    北京興漢網(wǎng)際股份有限公司(NEXSEC)與芯啟源電子科技有限公司(Corigine)攜手,經(jīng)過一整年的潛心研發(fā)與努力,正式發(fā)布了LAG 4A20—— 一款為網(wǎng)絡(luò)防火墻量身定制的DPU安全卸載模塊。
    的頭像 發(fā)表于 03-01 15:24 ?748次閱讀
    興漢攜手芯啟源發(fā)布一款為網(wǎng)絡(luò)防火墻量身定制的<b class='flag-5'>DPU</b>安全<b class='flag-5'>卸載</b>模塊

    《數(shù)據(jù)處理器:DPU編程入門》DPU計(jì)算入門書籍測(cè)評(píng)

    實(shí)踐 最后一部分是數(shù)據(jù)加速應(yīng)用的落地: 基于各個(gè)平臺(tái)的算力解決方案 推薦的存儲(chǔ)解決方案 邊緣計(jì)算方案 網(wǎng)絡(luò)平臺(tái)與融合加速技術(shù) 本書不能幫你完全入門DOCA和相關(guān)的DPU開發(fā)技術(shù),但是能
    發(fā)表于 12-24 10:54

    《數(shù)據(jù)處理器:DPU編程入門》讀書筆記

    首先感謝電子發(fā)燒友論壇提供的試讀機(jī)會(huì)。 第一周先閱讀了DPU的技術(shù)發(fā)展背景,了解到DPU是結(jié)合了高性能及軟件可編程的多核CPU、高性能網(wǎng)絡(luò)接口,以及各種靈活和可編程的加速引擎。DPU
    發(fā)表于 12-21 10:47

    淺談DPU和CPU、GPU的關(guān)系

    把CPU的一大部分算力卸載給GPU之后,人們發(fā)現(xiàn)可以把很多其他功能也外包出去,于是又有了智能網(wǎng)卡,或者叫做DPU。
    發(fā)表于 12-14 11:44 ?751次閱讀
    淺談<b class='flag-5'>DPU</b>和CPU、GPU的關(guān)系

    《數(shù)據(jù)處理器:DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    : 2.00Gb/s 以太網(wǎng)或 NDR 400Gb/s InfiniBand 網(wǎng)絡(luò)連接:BlueField-3 DPU 卸載、加速和隔離軟件定義的網(wǎng)絡(luò)、存儲(chǔ)、安全和管理功能。 16 個(gè) ARM 內(nèi)核
    發(fā)表于 12-08 18:03

    什么是DPU?

    ,能以線速或網(wǎng)絡(luò)中的可用速度解析、處理數(shù)據(jù),并高效地將數(shù)據(jù)傳輸?shù)紾PU和CPU。 各種靈活和可編程的加速引擎,可以卸載AI、機(jī)器學(xué)習(xí)、安全、電信和存儲(chǔ)等應(yīng)用,并提升性能。 所有這些DPU功能對(duì)于實(shí)現(xiàn)
    發(fā)表于 11-03 10:55

    【書籍評(píng)測(cè)活動(dòng)NO.23】數(shù)據(jù)處理器:DPU編程入門

    主席 人工智能正在呈爆發(fā)式發(fā)展,成為數(shù)據(jù)中心算力需求的主要驅(qū)動(dòng)力之一。為了卸載、加速和隔離數(shù)據(jù)中心基礎(chǔ)設(shè)施工作負(fù)載,DPU應(yīng)運(yùn)而生。本書是一本應(yīng)用NVIDIA BlueField系列DPU
    發(fā)表于 10-24 15:21