容錯(cuò)是一個(gè)依賴于系統(tǒng)內(nèi)元素失效的系統(tǒng)。它也可以稱為失效安全設(shè)計(jì)。例如,在其中一個(gè)電源發(fā)生失效后,容錯(cuò)系統(tǒng)可能會(huì)繼續(xù)正常運(yùn)行。或者它可能在減少或退化的狀態(tài)下運(yùn)行。其他系統(tǒng)可能具有“跛行回家”狀態(tài),允許系統(tǒng)保存關(guān)鍵數(shù)據(jù)或允許您開車到安全的地方更換漏氣的輪胎。在某些情況下,徹底的系統(tǒng)失效是不可接受的。
通信、銀行、空中交通管制、運(yùn)輸和許多其他領(lǐng)域都有系統(tǒng),一旦發(fā)生失效,可能會(huì)導(dǎo)致災(zāi)難性的后果。創(chuàng)建一個(gè)可能會(huì)遇到組件、子系統(tǒng)或軟件失效的系統(tǒng),并且該系統(tǒng)能夠以通常非常需要的某種能力繼續(xù)運(yùn)行。
容錯(cuò)系統(tǒng)的基本特征
容錯(cuò)系統(tǒng)可能具有以下一個(gè)或多個(gè)特征:
無單點(diǎn)失效
這意味著如果電容器、軟件代碼塊、電機(jī)或任何單個(gè)項(xiàng)目發(fā)生失效,則系統(tǒng)不會(huì)發(fā)生失效。例如,許多醫(yī)院都有備用電源系統(tǒng),以防電網(wǎng)出現(xiàn)失效,從而使醫(yī)院內(nèi)的關(guān)鍵系統(tǒng)保持運(yùn)行。
關(guān)鍵系統(tǒng)可能有多個(gè)冗余方案來保持高水平的容錯(cuò)和彈性。
沒有單點(diǎn)修復(fù)會(huì)導(dǎo)致系統(tǒng)宕機(jī)
例如,擴(kuò)展單點(diǎn)失效的想法,實(shí)現(xiàn)失效組件的修復(fù)不需要關(guān)閉系統(tǒng)。
這也意味著系統(tǒng)在維修期間保持在線和運(yùn)行。這可能會(huì)給系統(tǒng)的設(shè)計(jì)和維護(hù)帶來挑戰(zhàn)。熱插拔電源是修復(fù)操作的一個(gè)示例,它可以在更換失效電源的同時(shí)保持系統(tǒng)運(yùn)行。
失效隔離或識(shí)別
該系統(tǒng)能夠識(shí)別系統(tǒng)內(nèi)何時(shí)發(fā)生失效,并且不允許失效元件對(duì)功能產(chǎn)生不利影響(即丟失數(shù)據(jù)或在銀行系統(tǒng)中產(chǎn)生邏輯錯(cuò)誤)。識(shí)別并隔離失效元件。
系統(tǒng)的某些部分可能具有檢測失效的唯一目的,內(nèi)置自測試(BIST)就是一個(gè)例子。
失效遏制
當(dāng)發(fā)生失效時(shí),可能會(huì)損壞系統(tǒng)內(nèi)的其他元件,從而造成第二個(gè)或第三個(gè)失效和系統(tǒng)失效。
例如,如果模擬電路發(fā)生失效,則可能會(huì)增加系統(tǒng)中的電流,從而損壞無法承受高電流條件的邏輯電路。失效遏制的想法是避免或盡量減少由單點(diǎn)失效引起的附帶損害。
魯棒性或變異性控制
當(dāng)系統(tǒng)遇到單點(diǎn)失效時(shí),系統(tǒng)就會(huì)發(fā)生變化。
更改可能會(huì)導(dǎo)致暫時(shí)或永久的更改,從而影響系統(tǒng)的工作元素如何響應(yīng)和運(yùn)行。變化會(huì)發(fā)生,當(dāng)發(fā)生失效時(shí),變化通常會(huì)增加。
例如,當(dāng)兩個(gè)電源中的一個(gè)發(fā)生失效時(shí),其余電源將承擔(dān)全部電力需求。這種轉(zhuǎn)變應(yīng)該在不影響系統(tǒng)性能的情況下發(fā)生。設(shè)計(jì)和制造穩(wěn)健系統(tǒng)的能力可能涉及六西格瑪設(shè)計(jì)、實(shí)驗(yàn)優(yōu)化設(shè)計(jì)和其他工具,以創(chuàng)建能夠在發(fā)生失效時(shí)運(yùn)行的系統(tǒng)。
恢復(fù)狀態(tài)操作(回退或跛行)
當(dāng)發(fā)生失效時(shí),系統(tǒng)可以通過多種方式改變其性能,從而使系統(tǒng)能夠以某種方式繼續(xù)運(yùn)行。
例如,如果計(jì)算機(jī)的部分冷卻系統(tǒng)出現(xiàn)失效,中央處理器(CPU)可能會(huì)降低其速度或命令執(zhí)行率,從而有效地減少CPU產(chǎn)生的熱量。fail失效會(huì)導(dǎo)致冷卻能力損失,CPU會(huì)進(jìn)行調(diào)整以適應(yīng)并避免過熱和失效。其他還原方案可能包括回滾到先前的工作狀態(tài),或切換到先前或安全模式軟件集。
在某些情況下,系統(tǒng)可能能夠在沒有或只有最小功能損失的情況下操作員,或者恢復(fù)操作將系統(tǒng)操作顯著限制在關(guān)鍵的幾個(gè)功能上。
概括
盡管系統(tǒng)內(nèi)任何單個(gè)元件發(fā)生失效,系統(tǒng)仍能繼續(xù)運(yùn)行的能力意味著該系統(tǒng)不在串聯(lián)配置中。
有一組冗余或一組替代方法可以繼續(xù)運(yùn)行。系統(tǒng)可以使用多個(gè)冗余元素,或者對(duì)系統(tǒng)配置的變化具有彈性。
創(chuàng)建容錯(cuò)系統(tǒng)的適當(dāng)解決方案通常需要仔細(xì)規(guī)劃,了解元素如何發(fā)生失效以及失效周圍元素的影響。
編輯:黃飛
-
模擬電路
+關(guān)注
關(guān)注
125文章
1551瀏覽量
102569 -
容錯(cuò)系統(tǒng)
+關(guān)注
關(guān)注
0文章
4瀏覽量
1380
原文標(biāo)題:容錯(cuò)基礎(chǔ)知識(shí)
文章出處:【微信號(hào):QCDZYJ,微信公眾號(hào):汽車電子工程知識(shí)體系】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論