0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你們知道什么是葉脊網(wǎng)絡(luò)嗎

iotmag ? 來(lái)源:鮮棗課堂 ? 作者:鮮棗課堂 ? 2021-05-31 10:50 ? 次閱讀

今天這個(gè)故事,要從67年前開始說(shuō)起。

1953年,貝爾實(shí)驗(yàn)室有一位名叫Charles Clos的研究員,發(fā)表了一篇名為《A Study of Non-blocking Switching Networks》的文章,介紹了一種“用多級(jí)設(shè)備來(lái)實(shí)現(xiàn)無(wú)阻塞電話交換”的方法。

自從1876年電話被發(fā)明之后,電話交換網(wǎng)絡(luò)歷經(jīng)了人工交換機(jī)、步進(jìn)制交換機(jī)、縱橫制交換機(jī)等多個(gè)階段。20世紀(jì)50年代,縱橫制交換機(jī)處于鼎盛時(shí)期。

縱橫交換機(jī)的核心,是縱橫連接器。如下圖所示:

cc077e84-bfa4-11eb-9e57-12bb97331649.jpg

縱橫制接線器

這種交換架構(gòu),是一種開關(guān)矩陣,每個(gè)交點(diǎn)(Crosspoint)都是一個(gè)開關(guān)。交換機(jī)通過(guò)控制開關(guān),來(lái)完成從輸入到輸出的轉(zhuǎn)發(fā)。

可以看出,開關(guān)矩陣很像一塊布的纖維。所以,交換機(jī)的內(nèi)部架構(gòu),被稱為Switch Fabric。Fabric,就是“纖維、布料”的意思。

Fabric這個(gè)詞,我相信所有核心網(wǎng)工程師和數(shù)通工程師都非常熟悉?!癋abric平面”、“Fabric總線”等概念,經(jīng)常出現(xiàn)在工作中。

隨著電話用戶數(shù)量急劇增加,網(wǎng)絡(luò)規(guī)模快速擴(kuò)大,基于crossbar模型的交換機(jī)在能力和成本上都無(wú)法滿足要求。于是,才有了文章開頭Charles Clos的那篇研究文章。

Charles Clos提出的網(wǎng)絡(luò)模型,核心思想是:用多個(gè)小規(guī)模、低成本的單元,構(gòu)建復(fù)雜、大規(guī)模的網(wǎng)絡(luò)。例如下圖:

cc637162-bfa4-11eb-9e57-12bb97331649.jpg

圖中的矩形,都是低成本的轉(zhuǎn)發(fā)單元。當(dāng)輸入和輸出增加時(shí),中間的交叉點(diǎn)并不需要增加很多。

這種模型,就是后來(lái)產(chǎn)生深遠(yuǎn)影響的CLOS網(wǎng)絡(luò)模型。

到了80年代,隨著計(jì)算機(jī)網(wǎng)絡(luò)的興起,開始出現(xiàn)了各種網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),例如星型、鏈型、環(huán)型、樹型。

樹型網(wǎng)絡(luò)逐漸成為主流,大家也非常熟悉。

傳統(tǒng)的樹型網(wǎng)絡(luò),帶寬是逐級(jí)收斂的。什么是收斂呢?物理端口帶寬一致,二進(jìn)一出,不就1:2的收斂了嘛。

2000年之后,互聯(lián)網(wǎng)從經(jīng)濟(jì)危機(jī)中復(fù)蘇,以谷歌和亞馬遜為代表的互聯(lián)網(wǎng)巨頭開始崛起。他們開始推行云計(jì)算技術(shù),建設(shè)大量的數(shù)據(jù)中心IDC),甚至超級(jí)數(shù)據(jù)中心。

面對(duì)日益龐大的計(jì)算規(guī)模,傳統(tǒng)樹型網(wǎng)絡(luò)肯定是不行的了。于是,一種改進(jìn)型樹型網(wǎng)絡(luò)開始出現(xiàn),它就是胖樹(Fat-Tree)架構(gòu)。

胖樹(Fat-Tree)就是一種CLOS網(wǎng)絡(luò)架構(gòu)。

相比于傳統(tǒng)樹型,胖樹(Fat-Tree)更像是真實(shí)的樹,越到樹根,枝干越粗。從葉子到樹根,網(wǎng)絡(luò)帶寬不收斂。

胖樹架構(gòu)的基本理念是:使用大量的低性能交換機(jī),構(gòu)建出大規(guī)模的無(wú)阻塞網(wǎng)絡(luò)。對(duì)于任意的通信模式,總有路徑讓他們的通信帶寬達(dá)到網(wǎng)卡帶寬。

胖樹架構(gòu)被引入到數(shù)據(jù)中心之后,數(shù)據(jù)中心變成了傳統(tǒng)的三層結(jié)構(gòu):

ccbbd884-bfa4-11eb-9e57-12bb97331649.jpg

接入層:用于連接所有的計(jì)算節(jié)點(diǎn)。通常以機(jī)柜交換機(jī)(TOR,Top of Rack,柜頂交換機(jī))的形式存在。

匯聚層:用于接入層的互聯(lián),并作為該匯聚區(qū)域二三層的邊界。各種防火墻、負(fù)載均衡等業(yè)務(wù)也部署于此。

核心層:用于匯聚層的的互聯(lián),并實(shí)現(xiàn)整個(gè)數(shù)據(jù)中心與外部網(wǎng)絡(luò)的三層通信。

在很長(zhǎng)的一段時(shí)間里,三層網(wǎng)絡(luò)結(jié)構(gòu)在數(shù)據(jù)中心十分盛行。在這種架構(gòu)中,銅纜布線是主要的布線方式,使用率達(dá)到了80%。而光纜,只占了20%。

用著用著,人們發(fā)現(xiàn),傳統(tǒng)三層架構(gòu)有很多的缺點(diǎn)。

首先,是資源的浪費(fèi)。

傳統(tǒng)三層結(jié)構(gòu)中,一臺(tái)下層交換機(jī)會(huì)通過(guò)兩條鏈路與兩臺(tái)上層交換機(jī)互連。

由于采用的是STP協(xié)議( Spanning Tree Protocol,生成樹協(xié)議),實(shí)際承載流量的只有一條。其它上行鏈路,是被阻塞的(只用于備份)。這就造成了帶寬的浪費(fèi)。

其次,是故障域比較大。

STP協(xié)議由于其本身的算法,在網(wǎng)絡(luò)拓?fù)浒l(fā)生變更時(shí)需要重新收斂,容易發(fā)生故障,從而影響整個(gè)VLAN的網(wǎng)絡(luò)。

第三點(diǎn),也是最重要的一點(diǎn)——隨著時(shí)間推移,數(shù)據(jù)中心的流量走向發(fā)生了巨大變化。

2010年之后,為了提高計(jì)算和存儲(chǔ)資源的利用率,所有的數(shù)據(jù)中心都開始采用虛擬化技術(shù)。網(wǎng)絡(luò)中開始出現(xiàn)了大量的虛擬機(jī)(VM,Virtual Machine)。

與此同時(shí),微服務(wù)架構(gòu)開始流行,很多軟件開始推行功能解耦,單個(gè)服務(wù)變成了多個(gè)服務(wù),部署在不同的虛擬機(jī)上。虛擬機(jī)之間的流量,大幅增加。

這種平級(jí)設(shè)備之間的數(shù)據(jù)流動(dòng),我們稱之為“東西向流量”。

相對(duì)應(yīng)的,那種上上下下的垂直數(shù)據(jù)流動(dòng),稱為“南北向流量”。這個(gè)很容易理解,“上北下南,左西右東”嘛。

東西向流量,其實(shí)也就是一種“內(nèi)部流量”。這種數(shù)據(jù)流量的大幅增加,給傳統(tǒng)三層架構(gòu)帶來(lái)了很大的麻煩——因?yàn)榉?wù)器和服務(wù)器之間的通信,需要經(jīng)過(guò)接入交換機(jī)、匯聚交換機(jī)和核心交換機(jī)。

這意味著,核心交換機(jī)和匯聚交換機(jī)的工作壓力不斷增加。要支持大規(guī)模的網(wǎng)絡(luò),就必須有性能最好、端口密度最大的匯聚層核心層設(shè)備。這樣的設(shè)備成本高,價(jià)格非常昂貴。

于是乎,網(wǎng)絡(luò)工程師們提出了“Spine-Leaf網(wǎng)絡(luò)架構(gòu)”,也就是我們今天的主角——葉脊網(wǎng)絡(luò)(有時(shí)候也被稱為脊葉網(wǎng)絡(luò))。Spine的中文意思是脊柱,Leaf是葉子。

葉脊網(wǎng)絡(luò)架構(gòu),和胖樹結(jié)構(gòu)一樣,同屬于CLOS網(wǎng)絡(luò)模型。

相比于傳統(tǒng)網(wǎng)絡(luò)的三層架構(gòu),葉脊網(wǎng)絡(luò)進(jìn)行了扁平化,變成了兩層架構(gòu)。如下圖所示:

cd96adb0-bfa4-11eb-9e57-12bb97331649.jpg

葉交換機(jī),相當(dāng)于傳統(tǒng)三層架構(gòu)中的接入交換機(jī),作為 TOR(Top Of Rack)直接連接物理服務(wù)器。葉交換機(jī)之上是三層網(wǎng)絡(luò),之下都是個(gè)獨(dú)立的 L2 廣播域。如果說(shuō)兩個(gè)葉交換機(jī)下的服務(wù)器需要通信,需要經(jīng)由脊交換機(jī)進(jìn)行轉(zhuǎn)發(fā)。

脊交換機(jī),相當(dāng)于核心交換機(jī)。葉和脊交換機(jī)之間通過(guò)ECMP(Equal Cost Multi Path)動(dòng)態(tài)選擇多條路徑。

脊交換機(jī)下行端口數(shù)量,決定了葉交換機(jī)的數(shù)量。而葉交換機(jī)上行端口數(shù)量,決定了脊交換機(jī)的數(shù)量。它們共同決定了葉脊網(wǎng)絡(luò)的規(guī)模。

葉脊網(wǎng)絡(luò)的優(yōu)勢(shì)非常明顯:

1、帶寬利用率高每個(gè)葉交換機(jī)的上行鏈路,以負(fù)載均衡方式工作,充分的利用了帶寬。

2、網(wǎng)絡(luò)延遲可預(yù)測(cè)在以上模型中,葉交換機(jī)之間的連通路徑的條數(shù)可確定,均只需經(jīng)過(guò)一個(gè)脊交換機(jī),東西向網(wǎng)絡(luò)延時(shí)可預(yù)測(cè)。

3、擴(kuò)展性好當(dāng)帶寬不足時(shí),增加脊交換機(jī)數(shù)量,可水平擴(kuò)展帶寬。當(dāng)服務(wù)器數(shù)量增加時(shí),增加脊交換機(jī)數(shù)量,也可以擴(kuò)大數(shù)據(jù)中心規(guī)模??傊?guī)劃和擴(kuò)容非常方便。

4、降低對(duì)交換機(jī)的要求南北向流量,可以從葉節(jié)點(diǎn)出去,也可從脊節(jié)點(diǎn)出去。東西向流量,分布在多條路徑上。這樣一來(lái),不需要昂貴的高性能高帶寬交換機(jī)。

5、安全性和可用性高傳統(tǒng)網(wǎng)絡(luò)采用STP協(xié)議,當(dāng)一臺(tái)設(shè)備故障時(shí)就會(huì)重新收斂,影響網(wǎng)絡(luò)性能甚至發(fā)生故障。葉脊架構(gòu)中,一臺(tái)設(shè)備故障時(shí),不需重新收斂,流量繼續(xù)在其他正常路徑上通過(guò),網(wǎng)絡(luò)連通性不受影響,帶寬也只減少一條路徑的帶寬,性能影響微乎其微。

我們來(lái)結(jié)合一個(gè)案例模型,分析一下葉脊網(wǎng)絡(luò)的支持能力。

假設(shè)一個(gè)這樣的資源條件:

脊交換機(jī)數(shù)量:16臺(tái) 每個(gè)脊交換機(jī)的上聯(lián)端口:8個(gè) × 100G每個(gè)脊交換機(jī)的下聯(lián)端口:48個(gè) × 25G葉交換機(jī)數(shù)量:48臺(tái)每個(gè)葉交換機(jī)的上聯(lián)端口:16個(gè) × 25G每個(gè)葉交換機(jī)的下聯(lián)端口:64個(gè) × 10G

在理想情況下,這樣的葉脊網(wǎng)絡(luò)總共可支持的服務(wù)器數(shù)量為:48×64=3072臺(tái)。(注意,葉脊交換機(jī)北向總帶寬一般不會(huì)和南向總帶寬一致,通常大于1:3即可。上例為400:640,有點(diǎn)奢侈了。)

從這個(gè)例子也可以看出,葉脊網(wǎng)絡(luò)帶來(lái)了一個(gè)趨勢(shì),那就是對(duì)光模塊的數(shù)量需求大幅增加。

下圖就是傳統(tǒng)三層架構(gòu)和葉脊架構(gòu)所使用光模塊數(shù)量的對(duì)比案例,差別可能達(dá)到15-30倍之多。

cde7e1da-bfa4-11eb-9e57-12bb97331649.png

(來(lái)自國(guó)泰君安證券研究)

正因?yàn)槿绱?,資本市場(chǎng)對(duì)葉脊網(wǎng)絡(luò)非常關(guān)注,希望借此帶動(dòng)光模塊市場(chǎng)的增長(zhǎng),尤其是100G、400G這樣的高速率光模塊。

葉脊拓?fù)渚W(wǎng)絡(luò)從2013年左右開始出現(xiàn),發(fā)展速度驚人,很快就取代了大量的傳統(tǒng)三層網(wǎng)絡(luò)架構(gòu),成為現(xiàn)代數(shù)據(jù)中心的新寵。

最具有代表性的,是Facebook在2014年公開的數(shù)據(jù)中心架構(gòu)。Facebook使用了一個(gè)五級(jí)CLOS架構(gòu),甚至是一個(gè)立體的架構(gòu)。大家有興趣可以研究一下。

Facebook數(shù)據(jù)中心架構(gòu)

除了Facebook之外,谷歌公司的第五代數(shù)據(jù)中心架構(gòu)Jupiter也大規(guī)模采用了葉脊網(wǎng)絡(luò),其可以支持的網(wǎng)絡(luò)帶寬已經(jīng)達(dá)到Pbps級(jí)。谷歌數(shù)據(jù)中心中10萬(wàn)臺(tái)服務(wù)器的每一個(gè),都可以用任意模式以每秒10千兆比特的速度互相通信。

好啦,關(guān)于葉脊網(wǎng)絡(luò)的介紹,今天就到這里。

感謝大家的耐心觀看,我們下期再見(jiàn)!

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    無(wú)風(fēng)扇燈的優(yōu)缺點(diǎn)有哪些

    無(wú)風(fēng)扇燈是一種結(jié)合了風(fēng)扇和照明功能的家用電器,它通過(guò)創(chuàng)新的設(shè)計(jì)消除了傳統(tǒng)風(fēng)扇的葉片,從而提高了安全性和美觀性。 無(wú)風(fēng)扇燈的優(yōu)點(diǎn): 安全性 :無(wú)設(shè)計(jì)消除了傳統(tǒng)風(fēng)扇的葉片,減少了兒童或?qū)櫸锸軅?/div>
    的頭像 發(fā)表于 09-07 11:44 ?1854次閱讀

    怎樣使用矢量網(wǎng)絡(luò)分析儀測(cè)量RLC諧振電路的幅頻、相頻特性曲線?

    各位大神你們好,我想用矢量網(wǎng)絡(luò)分析儀測(cè)量RLC諧振電路的幅頻特性和相頻特性曲線,但是我不知道測(cè)量的步驟(本人還是新手一枚),哪位大神會(huì)的教教我吧,謝謝了。
    發(fā)表于 08-27 08:17

    基于分布式計(jì)算的AR光波導(dǎo)中測(cè)試圖像的仿真

    使用一個(gè)由5個(gè)提供41個(gè)客戶端的多核PC組成的網(wǎng)絡(luò),模擬時(shí)間可以減少到大約4小時(shí)(與之前的大約43小時(shí)相比)。 模擬任務(wù) 入射耦合 周期:380 nm;光柵寬度:190 nm;高度:100 nm
    發(fā)表于 08-07 14:13

    斯濾波和卡爾曼濾波的區(qū)別

    斯濾波和卡爾曼濾波是兩種常用的濾波方法,它們?cè)谛盘?hào)處理、導(dǎo)航、機(jī)器人定位等領(lǐng)域有著廣泛的應(yīng)用。 貝斯濾波 1.1 貝斯濾波的基本原理 貝斯濾波是一種基于貝
    的頭像 發(fā)表于 08-01 15:25 ?375次閱讀

    一文解析AI驅(qū)動(dòng)光模塊變革

    傳統(tǒng)的三層架構(gòu)已不再適應(yīng)日益增長(zhǎng)的數(shù)據(jù)中心流量需求,架構(gòu)的出現(xiàn)解決了這一問(wèn)題。架構(gòu)下,光模塊數(shù)量可高達(dá)數(shù)十倍,以滿足大規(guī)模AI集群對(duì)大帶寬、低時(shí)延、無(wú)損
    發(fā)表于 04-22 10:42 ?598次閱讀
    一文解析AI驅(qū)動(dòng)光模塊變革

    網(wǎng)絡(luò)布局與光模塊配置需求深度解析

    以傳統(tǒng)三層架構(gòu)到架構(gòu)的轉(zhuǎn)變?yōu)槔?b class='flag-5'>葉網(wǎng)絡(luò)架構(gòu)下,光模塊數(shù)量提升最高可達(dá)到數(shù)十倍。
    發(fā)表于 04-01 10:09 ?1619次閱讀
    <b class='flag-5'>網(wǎng)絡(luò)</b>布局與光模塊配置需求深度解析

    傳統(tǒng)數(shù)據(jù)中心架構(gòu)和架構(gòu)網(wǎng)絡(luò)解決方案

    網(wǎng)絡(luò)帶寬- 特別是滿足東西向流量的要求(數(shù)據(jù)中心中大部分流量是東西向的)。 注意:東西向流量表示數(shù)據(jù)中心內(nèi)的服務(wù)器/應(yīng)用之間的流量,而南北向流量表示出入數(shù)據(jù)中心的流量。
    發(fā)表于 03-21 10:52 ?917次閱讀
    傳統(tǒng)數(shù)據(jù)中心架構(gòu)和<b class='flag-5'>葉</b><b class='flag-5'>脊</b>架構(gòu)<b class='flag-5'>網(wǎng)絡(luò)</b>解決方案

    傅里紅外光譜儀的用途 傅里紅外光譜儀的工作原理及基本結(jié)構(gòu)

    傅里紅外光譜儀(Fourier Transform Infrared Spectrometer,F(xiàn)TIR)是一種廣泛應(yīng)用于化學(xué)、生物、材料科學(xué)等領(lǐng)域的儀器設(shè)備。它通過(guò)測(cè)量樣品在紅外光區(qū)的吸收、散射
    的頭像 發(fā)表于 02-01 13:43 ?1721次閱讀

    無(wú)風(fēng)扇控制器怎么調(diào) 無(wú)風(fēng)扇控制器怎么接線

    無(wú)風(fēng)扇控制器是一種新型的風(fēng)扇控制設(shè)備,以其獨(dú)特的設(shè)計(jì)和革新的風(fēng)扇技術(shù)而備受關(guān)注。無(wú)風(fēng)扇控制器通過(guò)軸流風(fēng)扇和特殊的進(jìn)風(fēng)口設(shè)計(jì),將空氣吸入并加速,然后通過(guò)噴口進(jìn)行注入和加熱。與傳統(tǒng)的葉片風(fēng)扇相比,無(wú)
    的頭像 發(fā)表于 01-24 16:51 ?1643次閱讀

    一種基于擴(kuò)散模型的傅里單像素成像高分辨率迭代重建方法

    傅里單像素成像(FSPI)是一種基于傅里分析理論的計(jì)算光學(xué)成像技術(shù)。
    的頭像 發(fā)表于 01-24 09:43 ?839次閱讀
    一種基于擴(kuò)散模型的傅里<b class='flag-5'>葉</b>單像素成像高分辨率迭代重建方法

    無(wú)風(fēng)扇的工作原理

    無(wú)風(fēng)扇也叫空氣增倍機(jī),它能產(chǎn)生自然持續(xù)的涼風(fēng),因無(wú)葉片,不會(huì)覆蓋塵土或傷到兒童插進(jìn)的手指。更奇妙的是其造型奇特,外表既流線又清爽。
    的頭像 發(fā)表于 01-21 10:54 ?1601次閱讀

    基于不同位日光誘導(dǎo)葉綠素?zé)晒庑畔⒌乃?b class='flag-5'>葉瘟病早期監(jiān)測(cè)

    水稻瘟病可以發(fā)生在生長(zhǎng)期各個(gè)階段,感染后,水稻葉子上會(huì)產(chǎn)生黃色的斑點(diǎn),葉子變得脆弱而易于折斷。先是葉片出現(xiàn)長(zhǎng)條形或圓形的褐斑,斑點(diǎn)一般先從葉尖或緣開始,逐漸向中央擴(kuò)大。葉片褪綠,伴有病斑處出現(xiàn)黃化
    的頭像 發(fā)表于 12-29 16:15 ?254次閱讀

    連續(xù)時(shí)間信號(hào)的傅里分析

    電子發(fā)燒友網(wǎng)站提供《連續(xù)時(shí)間信號(hào)的傅里分析.pdf》資料免費(fèi)下載
    發(fā)表于 11-18 15:25 ?0次下載

    高速吹風(fēng)筒馬達(dá)扇為什么是奇數(shù)而非偶數(shù)?

    或許你曾留意到,高速吹風(fēng)筒的無(wú)刷馬達(dá)扇是11或者13的?而非12或10呢? 處于好奇和網(wǎng)絡(luò)上信息收集不肯定的情況下,我特意咨詢了一位資深無(wú)刷電機(jī)專家,以解開這一謎題,在此分享給諸
    的頭像 發(fā)表于 11-17 20:00 ?1121次閱讀
    高速吹風(fēng)筒馬達(dá)扇<b class='flag-5'>葉</b>為什么是奇數(shù)而非偶數(shù)?

    電子硬件中的傅里變化

    說(shuō)起電子硬件專業(yè),那不得不提的就是傅里葉變換了。 大學(xué)課程中應(yīng)該嚇倒了很多人,談傅里色變了。 本次就來(lái)重新認(rèn)識(shí)一下電子硬件中的傅里變化。 首先理解之前,當(dāng)然是需要先知道傅里這位大
    的頭像 發(fā)表于 11-06 11:03 ?580次閱讀
    電子硬件中的傅里<b class='flag-5'>葉</b>變化