電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)6月8日,廣東電信發(fā)生重大故障,導(dǎo)致廣東電信全省本地及漫游用戶通話異常。當(dāng)天16時(shí)左右,陸續(xù)有網(wǎng)友在社交媒體上發(fā)文指出,使用電信卡的手機(jī)無法通話和通信?!肮收习l(fā)生后,自己嘗試了拔卡重啟、檢查手機(jī)硬件、充話費(fèi)等不同方法,依然無法解決問題?!?/p>
隨后不久,中國(guó)電信廣東客服回應(yīng)稱,“因網(wǎng)絡(luò)異常,影響部分移動(dòng)用戶接聽電話,我們正在進(jìn)行搶修,由此給您帶來的不便,我們深表歉意,感謝您的理解和支持?!倍笤?日18時(shí)左右,中國(guó)電信廣東客服又補(bǔ)充發(fā)文表示,“經(jīng)緊急搶修,自16:30起,受影響的用戶正逐步恢復(fù),對(duì)在此期間受到影響的客戶表示真誠(chéng)的歉意。”
到了19時(shí)左右,此官微又發(fā)布了一條消息稱,“截至目前,受影響的移動(dòng)用戶接聽語音業(yè)務(wù)已全面恢復(fù),給您帶來的不便我們?cè)俅紊畋砬敢狻!?br />
圖源:中國(guó)電信廣東客服官微
對(duì)于此次故障的具體原因,中國(guó)電信官方還沒有公布。不過,針對(duì)這起歷史性的電信事故,8日晚,廣東省通信管理局召集廣東電信、廣東移動(dòng)、廣東聯(lián)通、廣東廣電、廣東鐵塔相關(guān)負(fù)責(zé)人召開網(wǎng)絡(luò)運(yùn)行安全緊急調(diào)度會(huì)。
跳出事件本身來看,電信系統(tǒng)到底是如何運(yùn)營(yíng)的呢?容災(zāi)系統(tǒng)不起作用原因有哪些呢?
解密電信網(wǎng)絡(luò)系統(tǒng)
對(duì)于電信網(wǎng)絡(luò)的運(yùn)轉(zhuǎn),其上方有兩套系統(tǒng),分別是上層IT軟件和底層基礎(chǔ)硬件。
其中IT系統(tǒng)又可以分為BSS、OSS、MSS和EDW。BSS(Business Support System,業(yè)務(wù)支撐系統(tǒng))和OSS(Operation Support System,運(yùn)營(yíng)支撐系統(tǒng))合稱為BOSS系統(tǒng),也就是電信業(yè)務(wù)運(yùn)營(yíng)支撐系統(tǒng)。BOSS系統(tǒng)以客戶服務(wù)、業(yè)務(wù)運(yùn)營(yíng)和管理為核心,支持客戶服務(wù)和計(jì)費(fèi)等關(guān)鍵事物的運(yùn)轉(zhuǎn)。
在BOSS系統(tǒng)中,BSS實(shí)際上是具有主動(dòng)式管理能力的。這種能力讓運(yùn)維人員在故障發(fā)生之前就能夠提前介入處理,消除系統(tǒng)故障帶來的潛在風(fēng)險(xiǎn),是運(yùn)營(yíng)商系統(tǒng)層面提升客戶滿意度的關(guān)鍵功能。不過很顯然,在此次廣東電信故障事故中,BSS系統(tǒng)并沒能起到主動(dòng)式管理的作用,從這個(gè)層面來看,這次的事故突發(fā)性很強(qiáng)。
MSS(Management Supporting System,管理支撐系統(tǒng))負(fù)責(zé)IT系統(tǒng)的規(guī)劃和窗口展現(xiàn),幫助電信運(yùn)營(yíng)商實(shí)現(xiàn)業(yè)務(wù)和市場(chǎng)需求更好地結(jié)合,并提升企業(yè)管理和IT系統(tǒng)升級(jí)的效率,也對(duì)企業(yè)運(yùn)營(yíng)效率提升有幫助。
EDW(Enterprise Data Warehouse,企業(yè)數(shù)據(jù)倉(cāng)庫)主要負(fù)責(zé)數(shù)據(jù)存儲(chǔ)和信息化管理。
IT系統(tǒng)是電信運(yùn)營(yíng)商業(yè)務(wù)的神經(jīng)樞紐,當(dāng)然其運(yùn)轉(zhuǎn)還需要部署在底層的硬件設(shè)備上。在介紹底層硬件結(jié)構(gòu)之前,我們先結(jié)合下圖看一下電信業(yè)務(wù)是如何運(yùn)轉(zhuǎn)的。如下圖所示,無論是電話業(yè)務(wù),還是移動(dòng)手機(jī)業(yè)務(wù),最終都需要連接到核心網(wǎng)。
電信業(yè)務(wù)服務(wù)架構(gòu)示意圖,圖源:華為培訓(xùn)
再看一下另一張圖,寬帶業(yè)務(wù)實(shí)際上也是如此,全部業(yè)務(wù)支撐最終都要回歸到核心網(wǎng)層面。
寬帶業(yè)務(wù)示意圖,圖源:華為培訓(xùn)
所以,這就是為什么運(yùn)營(yíng)商很多時(shí)候被稱為“管道商”。實(shí)際上,所有的電信運(yùn)營(yíng)業(yè)務(wù)都像是水管一樣,網(wǎng)絡(luò)流量由核心網(wǎng)分化而來,每一項(xiàng)業(yè)務(wù)都是基于管道里的流量,從骨干網(wǎng)分流,如下圖所示。
電信網(wǎng)絡(luò)分流示意圖,圖源:中國(guó)電信
當(dāng)然,網(wǎng)絡(luò)是一個(gè)相對(duì)虛化的概念,具體還是要靠設(shè)備來支撐。在整個(gè)網(wǎng)絡(luò)架構(gòu)中,三種設(shè)備最為常見和關(guān)鍵,分別是路由器、交換機(jī)和核心交換機(jī)。如下圖所示,無論網(wǎng)絡(luò)在核心網(wǎng)、IP傳輸網(wǎng)還是業(yè)務(wù)網(wǎng)上傳輸,依靠的都是交換機(jī)來中轉(zhuǎn)。
圖源:廣州移動(dòng)培訓(xùn)資料
運(yùn)營(yíng)商在建設(shè)網(wǎng)絡(luò)時(shí),一般會(huì)選擇使用多臺(tái)核心交換器來構(gòu)建超級(jí)節(jié)點(diǎn),超級(jí)節(jié)點(diǎn)基本只存在北上廣等重要節(jié)點(diǎn)城市部署,負(fù)責(zé)國(guó)際和省際之間的網(wǎng)絡(luò)傳輸,也構(gòu)成了核心網(wǎng)傳輸?shù)牡谝黄矫?。這個(gè)平面包括超級(jí)節(jié)點(diǎn)及其鏈路,以及各省第一出口鏈路。當(dāng)然,骨干網(wǎng)絡(luò)還有第二層,由普通核心節(jié)點(diǎn)到超級(jí)節(jié)點(diǎn)的鏈路和各省第二出口鏈路組成,負(fù)責(zé)跨大區(qū)域間的流量轉(zhuǎn)發(fā),大約全國(guó)2/3的流量都在這個(gè)網(wǎng)絡(luò)上跑。如下圖所示,為了增加網(wǎng)絡(luò)接入的效率,在節(jié)點(diǎn)上將流量進(jìn)一步分流,也就到了基站和普通交換機(jī)/路由器一端,方便用戶的接入。
網(wǎng)絡(luò)接入和傳輸示意圖,圖源:華為培訓(xùn)
那么,很顯然一個(gè)普通的路由器和交換機(jī)是很難讓一個(gè)省的網(wǎng)絡(luò)全部出現(xiàn)問題的,很可能就是核心交換機(jī)出現(xiàn)了問題,影響骨干網(wǎng)的傳輸,導(dǎo)致一個(gè)省沒有網(wǎng)絡(luò)流量入口。
雖然二層網(wǎng)絡(luò)已經(jīng)推出很多年,不過目前依然是電信運(yùn)營(yíng)商主要采用的骨干網(wǎng)架構(gòu)。雖然二層網(wǎng)絡(luò)的擴(kuò)展性不好,不過其跨域傳輸?shù)男阅芎艹錾?。?dāng)然,這也造成了一個(gè)問題,那就是看似互聯(lián)互通的網(wǎng)絡(luò),會(huì)存在一些重要的節(jié)點(diǎn),這些節(jié)點(diǎn)是不容有失的。
電信網(wǎng)絡(luò)的容災(zāi)機(jī)制
電信網(wǎng)絡(luò)是一個(gè)關(guān)系到國(guó)計(jì)民生的領(lǐng)域,因此在構(gòu)建的過程中,是需要具有容災(zāi)機(jī)制的,面對(duì)一些突發(fā)的挑戰(zhàn)。
我們上面已經(jīng)提到,電信網(wǎng)絡(luò)基本靠?jī)商紫到y(tǒng)在運(yùn)作,一個(gè)是IT系統(tǒng),另外一個(gè)是底層設(shè)備。由于用戶信息和業(yè)務(wù)高度集中,因此每一個(gè)電信業(yè)務(wù)開始部署時(shí)都有一套“plan B”,也被稱為容災(zāi)措施,主要是為了應(yīng)對(duì)突發(fā)的火災(zāi)、洪水、颶風(fēng)和其他突發(fā)因素等。
據(jù)介紹,除了在BSS系統(tǒng)中加入故障預(yù)判的機(jī)制以外,電信系統(tǒng)在硬件層面具有多層容災(zāi)措施,包括單板主備容災(zāi)、設(shè)備主備容災(zāi)、網(wǎng)元主備容災(zāi)、同城異域容災(zāi)以及異城異地容災(zāi)。通過多維度豐富的容災(zāi)措施,一般在重大故障之后,電信運(yùn)營(yíng)商都能夠很快地恢復(fù)網(wǎng)絡(luò)。
上一次發(fā)生地域性大規(guī)模斷網(wǎng)是在鄭州大洪水期間。由于數(shù)十年難得一見的洪水,導(dǎo)致鄭州骨干核心機(jī)房和主備機(jī)房全部被水淹。最終,為了讓鄭州市民能夠盡快使用網(wǎng)絡(luò),啟動(dòng)了異城異地的容災(zāi)機(jī)制。
不過,一般而言,異城異地容災(zāi)已經(jīng)是最高規(guī)格的電信網(wǎng)絡(luò)容災(zāi)機(jī)制了,一旦遇到全省范圍內(nèi)的突發(fā)事件,實(shí)際上也很難起到作用。
寫在最后
此次廣東電信的故障是一次歷史性的事件,也給國(guó)內(nèi)的主要運(yùn)營(yíng)商提了醒。在當(dāng)前的骨干網(wǎng)絡(luò)架構(gòu)里,一些關(guān)鍵節(jié)點(diǎn)的重要性與日俱增,一旦出現(xiàn)問題,就會(huì)帶來大面積的影響。當(dāng)然,此次廣東電信故障還沒有公布真正的原因,上述也只是從電信運(yùn)營(yíng)商軟硬件體系結(jié)構(gòu)下推斷出來的。具體原因如何,相信廣東電信會(huì)給大家一個(gè)解釋。
-
電信
+關(guān)注
關(guān)注
2文章
721瀏覽量
61811
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論