<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 測試測量 > 設計應用 > 分析高可用性系統的硬件和軟件設計模式

分析高可用性系統的硬件和軟件設計模式

作者：時(shí)間：2009-02-03 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

嵌入式系統設計人員經(jīng)常需要實(shí)現那些能在99.999%的業(yè)務(wù)時(shí)間內可靠運行的系統，這意味著(zhù)一天內系統故障的時(shí)間將少于一秒。這些系統稱(chēng)為高可用性系統。高可用性系統的設計通過(guò)對冗余硬件和軟件進(jìn)行組合，無(wú)需人為干預即可管理故障檢測和糾錯。本文首先簡(jiǎn)要回顧了與高可用性系統和故障管理相關(guān)的一些概念，然后研究了容錯系統的一些硬件和軟件設計模式。

故障與失效

在設計高可用性系統時(shí)，需要重點(diǎn)關(guān)注“故障”和“失效”。為了更好地說(shuō)明，這里將“失效”定義為系統提供的業(yè)務(wù)與設計規范不符的情況。故障則是與系統相互作用的一種錯誤，它是人們通常所指的不期望發(fā)生事件的可能原因。因此，故障可能是系統的子系統失效、器件失效、外部系統失效或程序錯誤。

故障可以是瞬時(shí)故障、永久故障或周期性故障。故障一旦發(fā)生，將導致系統或子系統的狀態(tài)出錯，而這些錯誤將引發(fā)系統失效。故障處理主要有以下四種主要方法：

1. 故障預測；

2. 故障避免；

3. 故障消除；

4. 容錯。

故障預測利用數學(xué)模型和試驗提供故障及其后果的預估。例如，實(shí)際中采用的一種故障預測技術(shù)就是在系統中插入故障，研究可能出現的各種系統失效。

故障避免和消除則通過(guò)嚴格的系統、硬件和軟件開(kāi)發(fā)工藝及正式規范和驗證技術(shù)加以實(shí)現。

容錯通過(guò)采用各種冗余系統實(shí)現，從而避免了故障影響?！笆趸笔菍?shí)現容錯的一種方法：即便該方法難以提供整體系統性能，也能提供切合實(shí)際的部分功能?！笆ПＷo(fail safe)或失效即停(fail stop)”則是另一種容錯方法：當故障發(fā)生時(shí)，該方法在一個(gè)安全狀態(tài)終止系統，而不讓系統繼續執行。

容錯涉及的主要概念是冗余。容錯基于這樣的思想(或愿望)：多個(gè)獨立的故障不會(huì )同時(shí)攻擊系統。容錯系統應能規避單點(diǎn)失效，換言之，如果系統的某部分可能出現故障，那么系統中應當存在解決該故障的冗余部分，從而避免失效。

冗余具有很多種形式：

1. 硬件冗余(低端、高端或兩者兼有)；

2. 軟件冗余；

3. 時(shí)間冗余；

4. 信息冗余。

飛機內的自校驗邏輯電路及多臺飛行計算機即為典型的硬件冗余。軟件冗余可采用兩種完全不同的算法，得到的結果也完全相同。時(shí)間冗余可以利用通信重傳實(shí)現，而信息冗余則可采用備份、校驗及糾錯代碼實(shí)現。

冗余可以是動(dòng)態(tài)的，也可以是靜態(tài)的，兩者均需復制系統的基本要素。在靜態(tài)冗余中，同一時(shí)刻所有的復制要素均保持激活。如果一個(gè)復制“拋出”故障，系統能夠馬上使用另一復制，并繼續正確的操作。在動(dòng)態(tài)冗余中，只有一個(gè)復制保持激活，而其余復制則不激活。如果被激活的復制產(chǎn)生故障，先前未被激活的一個(gè)復制將被激活并接管臨界操作。

那么上述各種方法是如何實(shí)現高可用性的呢？首先，必須對高可用性進(jìn)行定義。高可用性表征系統容錯并根據規范繼續提供業(yè)務(wù)的能力。系統可以采用本文給出的所有概念和方法實(shí)現高可用性。圖2：通過(guò)發(fā)送隊列消息進(jìn)行通信的軟件客戶(hù)和軟件服務(wù)器。

可用性通常采用“可用度”或“每年故障時(shí)間”進(jìn)行量度。常規的容錯系統可以達到99.99%的可靠度，即相當于每年故障1小時(shí)(每天故障10秒鐘)。但高可用性系統則有望實(shí)現高達99.999%的可用度，即每年故障少于5分鐘(簡(jiǎn)單地說(shuō)，即每天故障1秒鐘)。這意味著(zhù)當故障出現時(shí)，系統必須能自動(dòng)處理，因為操作人員難以在很短的時(shí)間內移除或掩蓋任何故障。

硬件冗余

與采用極可用器件構建單個(gè)極可用模塊的硬件設計相比，使用由常規商業(yè)級質(zhì)量的器件構成的常規商業(yè)級質(zhì)量硬件進(jìn)行冗余復制模塊設計，無(wú)疑具有更高的成本效益。

每個(gè)復制通常都要求具有“快速失效”或“失效即?！碧匦?，這極大地簡(jiǎn)化了故障管理決策。每次失效都使硬件在運行中停止，而不是試圖勉強執行下去并要求管理人員指出模塊中哪些輸出發(fā)生故障，哪些則一切正常。

對于采用靜態(tài)冗余的容錯，每個(gè)復制模塊都具有常規的商用可用性。采用雙重復制的模式稱(chēng)為配對或雙路復用(duplexing)。如果采用了N個(gè)復制，則稱(chēng)為N路復用(N-plexing)。

圖1顯示了3路復用或3重冗余硬件設計，這三重復制均位于方框圖的底端附近。這些復制向“表決器”提交輸出，表決器決定了子系統的最終實(shí)際輸出。在N路復用設計中，當N ≥ 3時(shí)，表決器通常采用多數決策策略。但是，這需要占不失效復制的絕大多數，而不僅僅是占復制總數(失效和不失效復制)的簡(jiǎn)單多數。

然而，表決器的硬件和軟件不是類(lèi)似于系統中的任何其他模塊，也會(huì )失效嗎？實(shí)際上，確實(shí)如此；而且一旦失效，還會(huì )給系統帶來(lái)災難性的影響。但表決器通常極為簡(jiǎn)單，因此可以通過(guò)設計和測試保證其魯棒性。此外，還可以設計復雜表決器和二級表決器等復雜系統，但本文不準備進(jìn)行深入討論。

對于采用動(dòng)態(tài)冗余的容錯，復制模塊仍然只需具有常規的商用可用性。一種實(shí)現方法是采用由一個(gè)被激活模塊和一個(gè)備用模塊組成的冗余對。另一方法則采用一簇模塊，這些模塊不必是其他模塊的精確復制，可以具有不同的特征、接口和容量。這簇復制需要采用失效接替策略，這樣當主模塊出現故障時(shí)，就能確定如何對多個(gè)模塊進(jìn)行管理。下面給出了一些選擇：

1. 熱備用。主模塊在系統中運行時(shí)，備份模塊處于“熱備用”狀態(tài)，一旦主模塊出現故障，備份模塊將啟動(dòng)并接管主模塊。例如，可以采用這種方法設計高可用性的互聯(lián)網(wǎng)服務(wù)器。

2. 轉動(dòng)備用。主模塊在系統運行時(shí)，可以具有許多備用模塊。一旦主模塊出現故障，一個(gè)備用模塊將接管系統的運行。航天飛機上飛行計算機的設計就基于該原理：主模塊由兩臺總穩定工作的計算機組成，其中一個(gè)備用模塊是一個(gè)相似對(similar pair)，而第二個(gè)備用模塊則是一臺只能根據操作員指令接管系統的計算機。

3. 圖3：檢驗點(diǎn)設計模式的缺陷在于啟動(dòng)或重啟服務(wù)器需要進(jìn)行許多處理才能恢復到檢驗點(diǎn)狀態(tài)。非關(guān)鍵模塊的失效接替。主模塊占用系統的關(guān)鍵資源，備用模塊則占用其他非關(guān)鍵資源。一旦主模塊出現故障，備用模塊就能接管主模塊占用的大部分關(guān)鍵資源。日常生活中我們也常常這么做：當我們試圖發(fā)送一封緊急的電子郵件時(shí)，如果計算機的高速互聯(lián)網(wǎng)連接出現故障，我們會(huì )立即切換到舊式的調制解調器。

4. 共同接管。每個(gè)模塊均運行自帶的關(guān)鍵資源，而且一旦某個(gè)模塊發(fā)生故障，其他模塊還能接管故障模塊的關(guān)鍵資源。例如，在功能增強的心護理室中，每8位病人將設置一臺心臟監控計算機。如果一臺心臟監控計算機崩潰，那么鄰近的計算機也能對故障計算機監控的8位病人進(jìn)行監控(或許性能將有所降低)。

正確的失效接替實(shí)現非常關(guān)鍵。如果故障的主模塊需要拋棄故障并繼續執行，而同時(shí)另一模塊也試圖接管其業(yè)務(wù)，那么后果將是災難性的，因為它們的業(yè)務(wù)有可能產(chǎn)生沖突。如果主模塊拋棄故障后停止執行，而又沒(méi)有其他模塊接管其業(yè)務(wù)，這樣的后果同樣是災難性的。因此失效接替的驗證和測試非常關(guān)鍵，盡管我們當中的許多人并不熱衷于此。

軟件冗余

大多數硬件故障都是隨機產(chǎn)生并由物理缺陷導致，這些缺陷要么在生產(chǎn)過(guò)程中維持不變，要么隨器件的老化而不斷變化，要么將受到外部物理環(huán)境的沖擊。相反，軟件故障與物理條件無(wú)關(guān)，因為軟件不會(huì )老化。與硬件故障不同，軟件故障源自對軟件設計或實(shí)現中固有故障的軟件路徑調用。由于軟件通常比硬件復雜，因此軟件中可能具有比硬件多得多的內置缺陷，從而導致軟件中的故障更多，容錯設計的成本也更高。

N版編程（N-version programming ）是久經(jīng)考驗的一種軟件容錯設計方法。20世紀70年代偶然接觸到該方法時(shí)，那時(shí)還被稱(chēng)為異質(zhì)軟件(dissimilar software)。這是硬件N路復用(如圖1所示)的等價(jià)軟件實(shí)現。但該方法比硬件N路復用的復制機制復雜，N路復用中相同軟件的N個(gè)復制將包含相同的故障并產(chǎn)生N次相同的錯誤。在N版編程中，如果N套軟件功能需要并行運行，那么它們應當是該功能的N個(gè)不同實(shí)現，而且是由N個(gè)單獨的開(kāi)發(fā)團隊獨立開(kāi)發(fā)完成。這就是N版編程的基本原理。

1996年6月，當首次發(fā)射的阿麗安娜-5衛星發(fā)送火箭上升到4000米高空時(shí)，突然發(fā)生了爆炸。該事故的原因在于火箭的慣性參考系統(這是數字飛行控制的一部分)發(fā)生了故障。盡管慣性參考系統中引入了硬件冗余，但軟件冗余沒(méi)有得到正確的處理。阿麗安娜-5帶有兩臺慣性參考計算機，一臺處于工作狀態(tài)，而另一臺則處于“開(kāi)機”備用狀態(tài)。這兩套系統并行運行，并具有完全一樣的硬件和軟件。系統上的軟件也與先前已經(jīng)成功發(fā)射的阿麗安娜-4幾乎一模一樣，但由于阿麗安娜-5上的某些飛行參數值比阿麗安娜-4大，因此數據發(fā)生了溢出。解決問(wèn)題的方法是關(guān)閉計算機，由于冗余計算機也在運行相同的軟件，因此也將受到數據溢出的沖擊，從而很快關(guān)閉，這樣整個(gè)慣性參考系統就完全崩潰。結果，引擎的噴管被回旋至極限位置，導致火箭突然轉向，并在自毀之前裂成兩半。這種處理數據溢出錯誤的方法適用于處理隨機出現的硬件錯誤，但不適用于處理兩臺計算機上出現的類(lèi)似軟件錯誤。N版編程可以避免兩臺計算機出現類(lèi)似的軟件錯誤。圖4：動(dòng)態(tài)軟件冗余的另一種設計是選擇一種數據處理方式作為主方式。

在20世紀70年代，N版編程(N-version programming)是先進(jìn)的軟件容錯設計方法。此后，這種設計模式引發(fā)了一系列問(wèn)題：隨著(zhù)該技術(shù)的采用，軟件開(kāi)發(fā)成本直線(xiàn)飆升，因為必須成立N個(gè)單獨的團隊開(kāi)發(fā)N套相互獨立的軟件。如果期望降低成本，則將陷入所謂的“平均智商( Average IQ)”怪圈：較低成本的開(kāi)發(fā)團隊意味著(zhù)較低質(zhì)量的軟件工程師，而這些工程師只能開(kāi)發(fā)出較低質(zhì)量的代碼。因此，最終只能得到充斥著(zhù)以N種不同方式產(chǎn)生故障的N種不同程序。

上一頁(yè) 1 2 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 高可用性 設計模式 自動(dòng)播音器

評論

相關(guān)推薦

基于嵌入式系統的藍牙模塊設計

四弦 | 2013-03-17

Enea Element：高可用性（HA）和嵌入式管理中間件

嵌入式系統 Enea Element 嵌入式高可用性 | 2016-09-12

多內核設計的三種設計模式概述

嵌入式系統概述設計模式設計內核 | 2012-04-06

ARM+Linux 的儀器控制系統的設計模式分析

嵌入式系統設計模式分析控制系統儀器 Linux ARM | 2012-07-25

嵌入式實(shí)時(shí)系統設計模式的研究與應用

資源下載嵌入式實(shí)時(shí)系統設計模式 | 2007-04-19

模式在主控機軟件中的應用與研究

嵌入式系統設計模式主控機通信層對象池模式 | 2012-01-19

設計模式在業(yè)務(wù)邏輯層中的應用

設計模式 DAO 數據庫 | 2009-09-06

設計模式在業(yè)務(wù)邏輯層中的應用

手機與無(wú)線(xiàn)通信應用邏輯業(yè)務(wù) 設計模式 | 2009-09-03

分析高可用性系統的硬件和軟件設計模式

測試測量高可用性設計模式自動(dòng)播音器 | 2009-02-03

高可用性系統的硬件和軟件設計模式

xiaosongs | 2005-12-15

在高可用性系統中以簡(jiǎn)化方法數字地管理電源

資源下載凌力爾特高可用性數字管理電源差分輸入 | 2007-04-19

一種基于VRRP的核心路由器高可用性方法研究與實(shí)現

資源下載 VRRP 核心路由器高可用性主備用 | 2009-03-13

嵌入式開(kāi)發(fā)的設計模式及發(fā)展趨勢

模擬技術(shù) 嵌入式開(kāi)發(fā) 設計模式 | 2013-09-09

我所理解的代碼設計

嵌入式系統代碼設計設計模式編程 | 2012-08-24

一種新型的網(wǎng)絡(luò )層心跳探測方案

資源下載網(wǎng)絡(luò )層心跳探測高可用性 | 2009-03-10

書(shū)籍推薦：實(shí)時(shí)設計模式

newcore | 2004-08-10

基于嵌入式實(shí)時(shí)系統設計模式的研究與應用

嵌入式系統研究應用設計模式系統嵌入式實(shí)時(shí) 基于 | 2012-02-20

48V/50A開(kāi)關(guān)電源整流模塊主電路設計

四弦 | 2013-03-11

防火墻集群負載均衡算法設計與實(shí)現

資源下載防火墻集群負載均衡高可用性哈希函數 | 2007-04-19

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>