0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新一代數(shù)據(jù)中心加速卡Alveo U55C最大功耗低至150W

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:程文智?電 ? 2021-12-09 17:41 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/程文智)近年來,在數(shù)字化浪潮的推動下,傳感器及其產(chǎn)生的數(shù)據(jù)量呈現(xiàn)出了爆炸式的增長,對數(shù)據(jù)處理基礎(chǔ)架構(gòu)的需求也隨之增長。根據(jù)國際超級計算大會(ISC)的統(tǒng)計,在HPC領(lǐng)域,超算系統(tǒng)架構(gòu)正變得越來越多元化,在近幾年的TOP500超算榜單中,使用GPU、FPGA等加速卡的異構(gòu)計算系統(tǒng)占比呈上升趨勢。

近日,賽靈思(Xilinx)在SC21全球超級計算大會上推出了新的Alveo U55C數(shù)據(jù)中心加速器卡,以及一款基于標準、API-driven 的集群解決方案,用于大規(guī)模部署 FPGA。據(jù)賽靈思數(shù)據(jù)中心事業(yè)部高性能計算( HPC )產(chǎn)品經(jīng)理Nathan Chang介紹,Alveo U55C加速器卡結(jié)合了非常多當今HPC和大數(shù)據(jù)工作負載需要的關(guān)鍵功能。該加速器卡能夠提供Alveo 加速器產(chǎn)品系列中的最高計算密度和 HBM2容量。結(jié)合賽靈思基于 RoCE v2 的全新集群解決方案,可令運行大規(guī)模計算工作負載的各類客戶大獲裨益,支持其利用現(xiàn)有數(shù)據(jù)中心基礎(chǔ)架構(gòu)和網(wǎng)絡,實現(xiàn)強大的基于 FPGA 的 HPC 集群。

Alveo U55C最重要的特性

Alveo U55C卡融合了當前 HPC工作負載所需的眾多關(guān)鍵特性。它能提供更高的數(shù)據(jù)流水線并行度、卓越的存儲器管理、優(yōu)化的整個流水線的數(shù)據(jù)遷移,以及Alveo產(chǎn)品系列中最高的單位功耗性能。

Alveo U55C與其前一代產(chǎn)品Alveo U280相比,有了很多升級。從外觀上來看,Alveo U55C采用了單插槽、全高半長( FHHL )外形尺寸;從算力上來看,雖然Alveo U55C提供的算力沒變,但體積更小了,計算密度得到了很大的提升;從功耗上來看,Alveo U55C的最大功耗為150W,而Alveo U280的功耗為225W。而且,Alveo U55C還將HBM2的容量翻倍至16GB。

Nathan Chang解釋說,功耗降低的原因是Alveo U55C去掉了DDR,在存儲器卡方面讓HBM2增加了一倍,這就相當于讓高帶寬的數(shù)量增加了4倍,由于去掉了DDR,所以Alveo U55C整個TDP功耗也下降了。

在Nathan Chang看來,Alveo U55C有三個非常重要的特性:一是采用了RoCE v2、DCBx,還有MPI,在現(xiàn)有網(wǎng)絡和基礎(chǔ)架構(gòu)上,為現(xiàn)在的數(shù)據(jù)中心提供了最尖端的計算集群。第二,現(xiàn)有的應用開發(fā)人員可以利用Vitis平臺上的一些已有的API、庫以及MPI,來擴展他們的工作負載。第三就是高性能。

據(jù)他介紹,通過RoCE v2和 DCBx技術(shù),再結(jié)合200 Gbps帶寬,Alveo U55C構(gòu)建的集群解決方案使Alveo網(wǎng)絡可在性能和時延方面媲美 InfiniBand 網(wǎng)絡,且無需對廠商加鎖。MPI (信息傳遞接口)集成功能使 HPC 開發(fā)人員能以賽靈思 Vitis統(tǒng)一軟件平臺擴展Alveo數(shù)據(jù)流水線。利用現(xiàn)有開放標準和框架,現(xiàn)在能跨數(shù)百張 Alveo 卡上進行性能擴展,無需考慮服務器平臺和網(wǎng)絡基礎(chǔ)架構(gòu),同時還能共享工作負載和存儲器。

借助面向應用和集群的高層次編程,軟件開發(fā)者和數(shù)據(jù)科學家能夠運用 Vitis 平臺,解鎖 Alveo 和自適應計算的優(yōu)勢。賽靈思大力投入于 Vitis 開發(fā)平臺和工具流程,旨在令不具備硬件專業(yè)知識的軟件開發(fā)者和數(shù)據(jù)科學家,也能更容易地使用自適應計算。Vitis 平臺支持 Pytorch 和 Tensorflow 等主流 AI 框架,還支持 C、C++Python 等高層次編程語言,使開發(fā)者能利用特定 API 和庫來構(gòu)建領(lǐng)域解決方案,或者使用賽靈思軟件開發(fā)套件,從而在現(xiàn)有數(shù)據(jù)中心內(nèi)輕松加速關(guān)鍵 HPC 工作負載。

應用案例

談到Alveo U55C的應用,Nathan Chang列舉了幾個常用的應用場景,比如幾乎每一家汽車廠商都會用到的碰撞仿真軟件LS-DYNA。汽車廠商主要是用它賴進行汽車的撞擊測試,以便查看仿真效果,確保汽車在設計方面的安全性和結(jié)構(gòu)方面的完整性。而安全性和結(jié)構(gòu)系統(tǒng)的設計往往取決于模型性能,因其能以計算機輔助設計有限元方法( FEM )仿真來降低物理碰撞測試的成本。FEM求解器是驅(qū)動具備數(shù)億個自由度仿真的主要算法,而這些龐大的算法可以細分為更基本的求解器,如 PCG、稀疏矩陣、ICCG。與 x86 CPU 相比,利用超并行數(shù)據(jù)流水線在大量 Alveo 卡上進行性能擴展,LS-DYNA 能夠?qū)崿F(xiàn)超過 5 倍的性能加速。這能在一個 Alveo 流水線中提高單位時鐘周期的工作效率,令 LS-DYNA 客戶受益于突破性的仿真時間。

另外,他還介紹了一個圖分析的案例,“在加入賽靈思之前,我是一個創(chuàng)業(yè)者,當時我處于油氣行業(yè),主要做的工作是做地殼震動圖解決的AI和機器學習。我們知道,數(shù)據(jù)工程師、科學家、分析師在處理此類課題的時候,都會尋找數(shù)據(jù)的一些相關(guān)性。在尋找的過程中,我們發(fā)現(xiàn)了一個巨大的痛點,那就是數(shù)據(jù)的孤島越來越多,如果想要把這些不同孤島上的數(shù)據(jù)聯(lián)系起來,真的非常困難。”他感嘆。

不過,Nathan Chang表示,圖庫數(shù)據(jù)是科學家認為非常具有顛覆性的一個平臺,它能夠?qū)?shù)據(jù)從孤島中提取出來,讓偶讓數(shù)據(jù)科學家可以專注于數(shù)據(jù)之間的關(guān)系,而不是看單張圖。賽靈思的合作伙伴,TigerGraph 是一家圖分析平臺提供商,他們正使用多張 Alveo U55C 卡為兩種最高效算法進行集群與加速,以驅(qū)動基于圖的推薦和集群引擎。圖從信息孤島中采集數(shù)據(jù)并重點關(guān)注數(shù)據(jù)間的關(guān)系。圖領(lǐng)域的下一個前沿是實時查找答案。Alveo U55C 將推薦引擎的查詢和預測時間從數(shù)分鐘縮短至數(shù)毫秒。與基于 CPU 的集群相比,使用多張 U55C 卡擴展分析所提供的出色計算能力和存儲器帶寬,可將圖查詢速度提升高達 45 倍。質(zhì)量評分也提升高達 35%,從而顯著提升置信度,將誤報幾率降至低個位數(shù)

另外,他還列舉了Alveo U55C在信號處理、醫(yī)療和金融方面的應用。

總結(jié)

隨著高性能計算邁向百億億級大關(guān),功耗將成為下一個難關(guān)。而典型的高性能計算架構(gòu),即CPU和GPU的架構(gòu),難以提供可接收的單位功耗性能,因此,現(xiàn)在越來越多的高性能計算集群開始采用一機構(gòu)計算架構(gòu),預計未來將會有更多的算力會部署在專門的加速器上,而不是通用CPU上。對于整個HPC服務器集群的降功耗目標來說,使用加速器卡的效果更好,功耗更低。未來加速器卡的市場前景將會更加廣闊。

聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱huangjingjing@elecfans.com。

編輯:金巧

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7408

    瀏覽量

    163431
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10781

    瀏覽量

    210526
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4640

    瀏覽量

    128487
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4588

    瀏覽量

    71823

原文標題:新一代數(shù)據(jù)中心加速卡Alveo U55C,最大功耗低至150W

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AMD 以全球極快的纖薄尺寸電子交易加速卡擴展 Alveo 產(chǎn)品組合,助力廣泛且具性價比的服務器部署

    商和金融機構(gòu)提供了款針對機架空間和成本進行優(yōu)化的纖薄型加速卡,旨在快速部署到各種服務器中。 Alveo UL3422 加速卡
    發(fā)表于 10-16 14:35 ?88次閱讀
    AMD 以全球極快的纖薄尺寸電子交易<b class='flag-5'>加速卡</b>擴展 <b class='flag-5'>Alveo</b> 產(chǎn)品組合,助力廣泛且具性價比的服務器部署

    AMD 以全球極快的纖薄尺寸電子交易加速卡擴展 Alveo 產(chǎn)品組合,助力廣泛且具性價比的服務器部署

    商和金融機構(gòu)提供了款針對機架空間和成本進行優(yōu)化的纖薄型加速卡,旨在快速部署到各種服務器中。 Alveo UL3422 加速卡
    發(fā)表于 10-16 14:16 ?88次閱讀

    AMD推出新款纖薄尺寸電子交易加速卡

    AMD(超威,納斯達克股票代碼:AMD)今日宣布推出 AMD Alveo UL3422 加速卡 ,這是其創(chuàng)紀錄的加速卡系列1的最新成員,專為超低時延電子交易應用而設計。AMD Alveo
    的頭像 發(fā)表于 10-16 09:14 ?293次閱讀

    請問OPA1632的最大功耗是看最大輸出電流嗎?

    OPA1632的最大功耗是看最大輸出電流嗎
    發(fā)表于 10-16 07:13

    EPSON差分晶振SG3225VEN頻點312.5mhz應用于AI加速卡

    AI加速卡,通常也被稱為AI算力,是種專為加速人工智能(AI)應用和算法而設計的硬件設備。AI加速卡在數(shù)據(jù)中心、云計算、邊緣計算和高性能
    發(fā)表于 09-10 14:56 ?0次下載

    東盟能源和華為主編的《東盟下一代數(shù)據(jù)中心建設白皮書》正式發(fā)布

    2024年5月17日,在2024全球數(shù)據(jù)中心產(chǎn)業(yè)論壇上,由東盟能源中心(ASEAN Center for Energy)和華為主編的《東盟下一代數(shù)據(jù)中心建設白皮書》(以下簡稱《白皮書》)重磅發(fā)布,旨在推動東盟
    的頭像 發(fā)表于 05-19 14:19 ?700次閱讀
    東盟能源和華為主編的《東盟下<b class='flag-5'>一代數(shù)據(jù)中心</b>建設白皮書》正式發(fā)布

    借助全新 AMD Alveo? V80 計算加速卡釋放計算能力

    靈活應變能力以實現(xiàn)工作負載優(yōu)化。Alveo V80 加速卡現(xiàn)已量產(chǎn)出貨,其能提供較之上一代加速卡至高 2 倍的帶寬與計算密度1,并為使用 AMD Vivado? 設計套件的 FPGA
    發(fā)表于 05-16 14:09 ?180次閱讀
    借助全新 AMD <b class='flag-5'>Alveo</b>? V80 計算<b class='flag-5'>加速卡</b>釋放計算能力

    AMD Alveo V80計算加速卡實現(xiàn)量產(chǎn)

    AMD公司近日迎來了個重要的里程碑,其專為大型數(shù)據(jù)集和內(nèi)存受限型應用設計的Alveo V80計算加速卡,已正式進入量產(chǎn)出貨階段。這款創(chuàng)新產(chǎn)品針對高性能計算(HPC)、
    的頭像 發(fā)表于 05-16 11:40 ?547次閱讀

    儲能逆變器最大功率有多大?儲能逆變器最大可以逆變多少w

    和應用需求等。本文將詳細介紹儲能逆變器的最大功率、逆變能力以及影響因素。 儲能逆變器的最大功率 儲能逆變器的最大功率可以從幾百瓦(W)到幾兆瓦(MW)不等。市場上常見的儲能逆變器功率范
    的頭像 發(fā)表于 04-29 14:37 ?1849次閱讀

    1A、3V17V、–55°C+150°CIQ 降壓轉(zhuǎn)換器TPS629210E數(shù)據(jù)

    電子發(fā)燒友網(wǎng)站提供《1A、3V17V、–55°C+150°C
    發(fā)表于 03-29 09:15 ?0次下載
    1A、3V<b class='flag-5'>至</b>17V、–<b class='flag-5'>55</b>°<b class='flag-5'>C</b><b class='flag-5'>至</b>+<b class='flag-5'>150</b>°<b class='flag-5'>C</b><b class='flag-5'>低</b>IQ 降壓轉(zhuǎn)換器TPS629210E<b class='flag-5'>數(shù)據(jù)</b>表

    英偉達發(fā)布最強AI加速卡Blackwell GB200

    英偉達在最近的GTC開發(fā)者大會上發(fā)布了其最新、最強大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構(gòu)Blackwell,標志著英偉達在AI圖形處理領(lǐng)域邁入了個新的
    的頭像 發(fā)表于 03-20 11:38 ?999次閱讀

    1A、3V 17V、–55°C +150°C IQ 降壓轉(zhuǎn)換器TPS629210E數(shù)據(jù)

    電子發(fā)燒友網(wǎng)站提供《1A、3V 17V、–55°C +150°C
    發(fā)表于 03-08 13:45 ?0次下載
    1A、3V <b class='flag-5'>至</b> 17V、–<b class='flag-5'>55</b>°<b class='flag-5'>C</b> <b class='flag-5'>至</b> +<b class='flag-5'>150</b>°<b class='flag-5'>C</b> <b class='flag-5'>低</b> IQ 降壓轉(zhuǎn)換器TPS629210E<b class='flag-5'>數(shù)據(jù)</b>表

    Arm縮短數(shù)據(jù)中心處理器研發(fā)周期年內(nèi)

    事實證明,ARM的數(shù)據(jù)中心處理器技術(shù)受到了亞馬遜、微軟以及為Oracle供貨的安培計算的青睞。同時,ARM也宣布了新一代數(shù)據(jù)中心芯片“核心”的設計方案。
    的頭像 發(fā)表于 02-22 09:20 ?489次閱讀

    AD5422在電流輸出狀態(tài)下最大功耗是多少W

    AD5422在電流輸出狀態(tài)下最大功耗是多少W?參考設計PLC_Demo_System中的每塊芯片都給了2W的電源模塊,功耗有那么大嗎?另外我在別人的
    發(fā)表于 12-18 07:58

    Alveo? MA35D 投入量產(chǎn),AMD AMA SDK 1.0 發(fā)布

    ,即率先推出 5nm 基于 ASIC 的媒體加速卡,其專為大規(guī)模交互式流媒體而打造。我們也很高興地宣布,Alveo 媒體加速產(chǎn)品組合與 AMD Alveo
    的頭像 發(fā)表于 11-08 08:10 ?495次閱讀
    <b class='flag-5'>Alveo</b>? MA35D 投入量產(chǎn),AMD AMA SDK 1.0 發(fā)布