0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

納多德視點 | InfiniBand十大優(yōu)勢

維維為 ? 來源:維維為 ? 作者:維維為 ? 2022-12-27 17:19 ? 次閱讀

poYBAGOquJaARjkZAADbAxqCx9U289.png

InfiniBand(直譯為“無限帶寬”技術,縮寫為IB)是一個用于高性能計算的計算機網(wǎng)絡通信標準,它具有極高的吞吐量和極低的延遲,用于計算機與計算機之間的數(shù)據(jù)互連。

最新發(fā)布的全球最強超級計算機排名 Top500 的榜單中,InfiniBand 網(wǎng)絡再次以絕對的數(shù)量和性能優(yōu)勢蟬聯(lián)超級計算機互連設備數(shù)量榜首,比上次排行榜的數(shù)量又有了大幅度的增長??v觀這次的榜單,可以歸納出以下三個趨勢:

基于InfiniBand網(wǎng)絡的超級計算機以197臺的數(shù)量大幅領先于其它網(wǎng)絡技術。特別在 Top100 的系統(tǒng)中,基于 InfiniBand 網(wǎng)絡的超級計算機更是遙遙領先,InfiniBand 網(wǎng)絡已經(jīng)成為了追求性能的超級計算機的標配。

NVIDIA網(wǎng)絡產(chǎn)品成為Top500系統(tǒng)中的主流互連設備,其中超過三分之二的超級計算機在使用NVIDIA網(wǎng)絡互連,NVIDIA 網(wǎng)絡的性能和技術領先性已經(jīng)得到了廣泛認可。

還值得一提的是,InfiniBand網(wǎng)絡不僅在傳統(tǒng)的HPC業(yè)務,在企業(yè)級數(shù)據(jù)中心和公有云上也已被廣泛使用。目前性能第一的企業(yè)級超級計算機NVIDIA Selene 和微軟公司的Azure公有云都在利用InfiniBand網(wǎng)絡來發(fā)揮其超高的業(yè)務性能。

無論是數(shù)據(jù)通訊技術的演進、互聯(lián)網(wǎng)技術的革新、還是視覺呈現(xiàn)的升級,都是得益于更強大的計算、更大容量更安全的存儲以及更高效的網(wǎng)絡;基于InfiniBand網(wǎng)絡為基礎的集群架構方案,不僅可以提供更高帶寬的網(wǎng)絡服務,同時也降低了網(wǎng)絡傳輸負載對計算資源的消耗,降低了延時,又完美地將HPC與數(shù)據(jù)中心融合。

為什么InfiniBand網(wǎng)絡在 Top500 中受到如此高的重視?其性能優(yōu)勢起到了決定性的作用。下面,納多德將InfiniBand十大優(yōu)勢總結如下:

1. 簡單的網(wǎng)絡管理

InfiniBand是第一個真正意義上原生按照SDN設計的網(wǎng)絡架構,它由子網(wǎng)管理器來管理。

子網(wǎng)管理器對本地子網(wǎng)進行配置并確保能連續(xù)運行。所有的信道適配器和交換機都必須實現(xiàn)一個SMA,該SMA與子網(wǎng)管理器一起實現(xiàn)對通信的處理。每個子網(wǎng)必須至少有一個子網(wǎng)管理器來進行初始化管理以及在鏈路連接或斷開時對子網(wǎng)進行重新配置。通過仲裁機制來選擇一個子網(wǎng)管理器作為主子網(wǎng)管理器,而其他子網(wǎng)管理器工作于待機模式(每個待機模式下的子網(wǎng)管理器都會備份此子網(wǎng)的拓撲信息,并檢驗此子網(wǎng)是否能夠運行)。若主子網(wǎng)管理器發(fā)生故障,一個待機子網(wǎng)管理器接管子網(wǎng)的管理以確保不間斷運行。

pYYBAGOquJeAYohPAAFTQ5AeTrQ684.png

2. 高帶寬

自InfiniBand誕生以來,很長一段時間InfiniBand網(wǎng)絡速率的發(fā)展都是快于Ethernet的,主要原因就是因為InfiniBand應用于高性能計算中服務器之間的互連,對帶寬上的需求更高。

poYBAGOquJiANL8lAACKzh_vyjA545.png

各個速率的縮寫如下:

SDR - Single Data Rate

DDR - Double Data Rate

QDR - Quad Data Rate

FDR - Fourteen Data Rate

EDR - Enhanced Data Rate

HDR - High Dynamic Range

NDR - Next Data Rate

XDR - eXtreme Data Rate

3.CPU offload

加速計算的一個關鍵技術,是CPU卸載。InfiniBand網(wǎng)絡架構可以以最少的CPU資源來傳輸數(shù)據(jù),這點是通過下面的方式來做到的:

硬件卸載整個傳輸層協(xié)議棧

Bypass內核,zero copy

RDMA,把一個服務器內存中的數(shù)據(jù)直接寫入另一臺的內存,不需要CPU的參與

pYYBAGOquJmACaNMAACTSNA0gCM712.png

同時可以使用GPU Direct技術,可以直接訪問GPU內存中的數(shù)據(jù),將GPU內存中的數(shù)據(jù)傳輸?shù)狡渌?jié)點。這樣可以加速計算類的應用,比如AI, Deep Learning等。

poYBAGOquJqAeN8AAACEzENxi-0653.png

4.低延遲

此處主要分為兩部分進行對比,一部分在交換機上,作為網(wǎng)絡傳輸模型中的二層技術,Ethernet交換機普遍采用了MAC查表尋址和存儲轉發(fā)的方式(有部分產(chǎn)品借鑒了InfiniBand的Cut-though技術)由于需要考慮諸如IP、MPLS、QinQ等復雜業(yè)務的處理,導致Ethernet交換機處理流程較長,一般會在若干us(支持cut-though的會在200ns以上),而InfiniBand交換機二層處理非常簡單,僅需要根據(jù)16bit的LID就可以查到轉發(fā)路徑信息,同時采用了Cut-Through技術大大縮短了轉發(fā)時延至100ns以下,遠遠快于Ethernet交換機;網(wǎng)卡層面如前所述,采用RDMA技術,網(wǎng)卡轉發(fā)報文不需要經(jīng)過CPU,大大加快了報文在封裝解封裝處理的時延,一般InfiniBand的網(wǎng)卡收發(fā)時延(write,send)在600ns,而基于Ethernet上的TCP UDP應用的收發(fā)時延會在10us左右,相差十幾倍之多。

pYYBAGOquJyAYmQHAAHFZ4uBxj8224.png

5.擴展性和靈活性

IB網(wǎng)絡一個主要的優(yōu)勢就是單個子網(wǎng)可以部署一個48,000節(jié)點,形成一個巨大的2層網(wǎng)絡。而且IB網(wǎng)絡不依賴ARP等廣播機制,不會產(chǎn)生廣播風暴或者額外的帶寬浪費。

多個IB子網(wǎng)也可以通過路由器和交換機連接。

IB支持多種網(wǎng)絡拓撲:

poYBAGOquJ6AKyAbAAF8Nn-JDZU678.png

規(guī)模較小時,建議選用2層fat-tree。更大規(guī)??梢圆捎?層fat-tree的組網(wǎng)拓撲。一定規(guī)模以上,可以采用Dragonfly+的拓撲節(jié)約一部分成本。

pYYBAGOquKCAIP50AAEBEydT09U397.png

6.QoS

如果多個不同的應用在同一個子網(wǎng)運行,并且其中一些應用需要比其他更高的優(yōu)先級,IB網(wǎng)絡如何提供QoS支持呢?

QoS是一種能力,可以為不同的應用,用戶或者數(shù)據(jù)流提供不同的優(yōu)先級服務。高優(yōu)先級的應用可以被映射到不同的端口隊列,隊列里的報文可以被優(yōu)先發(fā)送。

InfiniBand采用虛通道(VL,即Virtual Lanes)方式來實現(xiàn)QoS。虛通道是一些相互分立的邏輯通信鏈路,它們共享一條物理鏈接,每條物理鏈接可支持多達15條的標準虛通道和一條管理通道(VL15)。

poYBAGOquKGAJIBcAABIUiyl5V0020.png

7.網(wǎng)絡穩(wěn)定性和彈性

理想情況下,網(wǎng)絡非常穩(wěn)定,沒有任何故障。但是長期運行的網(wǎng)絡不可避免的會出現(xiàn)一些故障,InfiniBand如何處理這些失敗,并且快速恢復的呢?

NVIDIA IB解決方案提供一個機制,叫做Self-Healing Networking。自愈網(wǎng)絡是一個硬件能力,它基于IB交換機。自愈網(wǎng)絡可以讓鏈路故障恢復的時間僅僅需要1毫秒,比普通的恢復時間快5000x倍。

pYYBAGOquKSATCuMAALO5O-9qSo846.png

8.優(yōu)化的負載均衡

在高性能數(shù)據(jù)中心里面,一個很重要的需求,是如何提高網(wǎng)絡的利用率。其中一種方法是使用負載均衡。

負載均衡是一種路由策略,它讓流量在多個可用端口上發(fā)送。

Adaptive Routing就是這樣一個特性,它可以讓流量在交換機端口上均勻的分布。AR在交換機上硬件支持,由Adaptive Routing Manager管理。

當AR開啟,交換機上的Queue Manager會監(jiān)測所有GROUP EXIT端口的流量,均衡每個隊列的負載,把流量導向利用率低的端口。AR支持動態(tài)負載均衡,避免網(wǎng)絡擁塞,并最大化網(wǎng)絡帶寬利用率。

9.網(wǎng)絡計算 - SHARP

IB交換機還支持網(wǎng)絡計算的技術,SHARP – Scalable Hierarchical Aggregation and Reduction Protocol.

SHARP是一個基于交換機硬件的軟件,并且是一個集中管理的軟件包。

SHARP可以把原來在CPU和GPU上運行的集合通信offload到交換機上,優(yōu)化集合通信,避免了節(jié)點間的多次數(shù)據(jù)傳輸,減少了需要在網(wǎng)絡上傳輸?shù)臄?shù)據(jù)量。因此,SHARP可以極大的提升加速計算的性能,基于MPI應用,比如AI,機器學習等等。

poYBAGOquKaAD4aeAAF3IY8ugKo882.png

10.支持多種網(wǎng)絡拓撲

InfiniBand網(wǎng)絡可以支持非常多的topo,比如:

Fat Tree

Torus

Dragonfly+

Hypercube

HyperX

支持不同的網(wǎng)絡topo,從而滿足不同的需求,比如:

易于網(wǎng)絡擴展

降低TCO

最大化阻塞比

最小化延遲

最大化傳輸距離

pYYBAGOquKiAHp2SAAFdgVAqpw0740.png

Infiniband憑借著無與倫比的技術優(yōu)勢,極大簡化了高性能網(wǎng)絡架構,并降低了多級架構層次造成的延時,為關鍵計算節(jié)點接入帶寬的平滑升級提供有力支撐。InfiniBand 網(wǎng)絡憑借其極致的性能,不斷創(chuàng)新的技術架構,在更低功耗、更少硬件設備的前提下幫助用戶實現(xiàn)了業(yè)務性能的最大化,其進入越來越多的使用場景自是大勢所趨。

納多德是NVIDIA網(wǎng)絡產(chǎn)品的Elite Partner,攜手NVIDIA實現(xiàn)光連接+網(wǎng)絡產(chǎn)品與解決方案的強強聯(lián)合,尤其是在InfiniBand高性能網(wǎng)絡建設與應用加速方面擁有深刻的業(yè)務理解和豐富的項目實施經(jīng)驗,可根據(jù)用戶不同的應用場景,提供最優(yōu)的InfiniBand高性能交換機+智能網(wǎng)卡+AOC/DAC/光模塊產(chǎn)品組合方案,為數(shù)據(jù)中心、高性能計算、邊緣計算、人工智能等應用場景提供更具優(yōu)勢與價值的光網(wǎng)絡產(chǎn)品和整體解決方案,以低成本和出色的性能,大幅提高客戶業(yè)務加速能力。

審核編輯黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • InfiniBand
    +關注

    關注

    1

    文章

    26

    瀏覽量

    9167
收藏 人收藏

    評論

    相關推薦

    “智能網(wǎng)聯(lián)汽車全球十大發(fā)展突破”在京發(fā)布

    “智能網(wǎng)聯(lián)汽車全球十大發(fā)展突破”是從過去5-10年的代表性成果中,評選出在政策法規(guī)、市場應用、技術創(chuàng)新等方面最具標志性的項發(fā)展突破。10月17日,2024世界智能網(wǎng)聯(lián)汽車大會(WICV2024
    的頭像 發(fā)表于 10-19 08:08 ?177次閱讀
    “智能網(wǎng)聯(lián)汽車全球<b class='flag-5'>十大</b>發(fā)展突破”在京發(fā)布

    中國信通院發(fā)布“2024云計算十大關鍵詞”

    7月23日,由中國通信標準化協(xié)會主辦,中國信息通信研究院(簡稱“中國信通院”)承辦的“2024可信云大會”在京召開。大會上,中國信通院正式發(fā)布“2024云計算十大關鍵詞”,中國信通院云計算與大數(shù)
    的頭像 發(fā)表于 08-02 08:28 ?489次閱讀
    中國信通院發(fā)布“2024云計算<b class='flag-5'>十大</b>關鍵詞”

    AI浪潮下的十大消費者新趨勢

    人工智能已經(jīng)風靡全球,當我們沉浸在AI技術為辦公與生活帶來的各種便利時,一些人也會質疑:AI 真的能為我們描繪出更美好的未來畫卷嗎? AI 賦能的十大消費者趨勢 愛立信消費者實驗室的最新報告
    發(fā)表于 06-05 10:30 ?257次閱讀

    深入探索InfiniBand網(wǎng)絡、HDR與IB技術

    InfiniBand和以太網(wǎng)之間的延遲對比可以分為兩個主要組成部分。首先,在交換機層面上,以太網(wǎng)交換機在網(wǎng)絡傳輸模型中作為第2層設備運行,通常采用MAC表查找尋址和存儲轉發(fā)機制(某些產(chǎn)品可能采用InfiniBand的直通技術)。
    發(fā)表于 04-19 11:01 ?1224次閱讀
    深入探索<b class='flag-5'>InfiniBand</b>網(wǎng)絡、HDR與IB技術

    臺積電重回全球十大上市公司

    臺積電重回全球十大上市公司 人工智能相關企業(yè)持續(xù)被資金關注,在AI需求旺盛的帶動下臺積電股價水漲船高,臺積電重回全球十大上市公司;這是臺積電2020年以來首次重返全球前十大上市公司之列。 臺積電長期
    的頭像 發(fā)表于 03-12 17:00 ?1001次閱讀

    睿創(chuàng)微8微米榮獲“2023年度山東十大科技創(chuàng)新成果”

    近日,在煙臺召開的兩院院士評選“2023年中國/世界十大科技進展新聞”發(fā)布會上,公布了“2023年度山東省十大科技創(chuàng)新成果”榜單。其中,睿創(chuàng)微憑借其研發(fā)的8微米非制冷紅外熱成像模組,榮獲榜單之首,填補了世界空白。
    的頭像 發(fā)表于 01-25 16:27 ?578次閱讀

    睿創(chuàng)微8微米榮獲“2023年度山東十大科技創(chuàng)新成果”

    1月11日,兩院院士評選“2023年中國/世界十大科技進展新聞”發(fā)布會在煙臺召開,會上公布“2023年度山東省十大科技創(chuàng)新成果”榜單。
    的頭像 發(fā)表于 01-16 09:48 ?469次閱讀
    睿創(chuàng)微<b class='flag-5'>納</b>8微米榮獲“2023年度山東<b class='flag-5'>十大</b>科技創(chuàng)新成果”

    2023年度十大科技名詞

    12月26日,“2023年度十大科技名詞”在京發(fā)布?!按笳Z言模型、生成式人工智能、量子計算、腦機接口、數(shù)據(jù)要素、智慧城市、碳足跡、柔性制造、再生稻、可控核聚變”入選。個最具影響力和代表性的科技名詞
    的頭像 發(fā)表于 01-03 08:27 ?542次閱讀
    2023年度<b class='flag-5'>十大</b>科技名詞

    新一代MES十大核心要素

    電子發(fā)燒友網(wǎng)站提供《新一代MES十大核心要素.docx》資料免費下載
    發(fā)表于 12-29 11:14 ?0次下載

    十大WiFi常見誤解

    電子發(fā)燒友網(wǎng)站提供《十大WiFi常見誤解.doc》資料免費下載
    發(fā)表于 11-10 16:06 ?1次下載
    <b class='flag-5'>十大</b>WiFi常見誤解

    最熱門的十大綠色能源公司

    電子發(fā)燒友網(wǎng)站提供《最熱門的十大綠色能源公司.doc》資料免費下載
    發(fā)表于 11-02 14:37 ?1次下載
    最熱門的<b class='flag-5'>十大</b>綠色能源公司

    機器學習的基本流程和十大算法

    為了進行機器學習和數(shù)據(jù)挖掘任務,數(shù)據(jù)科學家們提出了各種模型,在眾多的數(shù)據(jù)挖掘模型中,國際權威的學術組織 ICDM(the IEEE International Conference on Data Mining)評選出了十大經(jīng)典的算法。
    發(fā)表于 10-31 11:30 ?922次閱讀
    機器學習的基本流程和<b class='flag-5'>十大</b>算法

    InfiniBand AOC有源光纜簡介

    InfiniBand(直譯為“無限帶寬”技術,縮寫為IB)是一個用于高性能計算的計算機網(wǎng)絡通信標準,它具有極高的吞吐量和極低的延遲,用于計算機與計算機之間的數(shù)據(jù)互連。InfiniBand也用作服務器與存儲系統(tǒng)之間的直接或交換互連,以及存儲系統(tǒng)之間的互連。
    的頭像 發(fā)表于 10-26 10:54 ?550次閱讀
    <b class='flag-5'>InfiniBand</b> AOC有源光纜簡介

    InfiniBand與以太網(wǎng)標準的區(qū)別

    我們在購買光模塊時,經(jīng)常看到簡介上描寫“符合IEEE某以太網(wǎng)標準”以及“兼容InfiniBand xDR協(xié)議”等描述,那么,InfiniBand(IB)和以太網(wǎng)(Ethernet)身為常見的通信網(wǎng)絡標準,具體有什么區(qū)別?
    的頭像 發(fā)表于 10-26 09:58 ?703次閱讀

    單片機ADC,十大C語言濾波算法

    單片機ADC,十大C語言濾波算法
    的頭像 發(fā)表于 10-24 15:53 ?1109次閱讀