嵌入式系統的可靠性設計
嵌入式應用系統是一個(gè)有計算機內核,軟、硬件整合的智能化電子系統。與傳統的激勵響應型電子系統的本質(zhì)差異,是它的智力嵌入,從而形成嵌入式應用系統全新的可靠性設計觀(guān)念、方法與技術(shù)。這些全新的可靠性設計觀(guān)念是:從二值可靠性到多值可靠性、建立系統的可靠性設計模型、確定系統的可靠性設計等級、應用系統的本質(zhì)可靠性設計與可靠性控制設計。支持可靠性設計觀(guān)念的基礎是LSIC支持下硬件結構的超??煽啃?、會(huì )出錯的軟件體系、智力內核的可靠性控制。
1 創(chuàng )建可靠性設計新觀(guān)念
1.1 嵌入式應用系統可靠性設計背景
嵌入式應用系統可靠性設計背景是集成電路的超長(cháng)壽命、計算機軟件介入與計算機內核的可靠性控制能力。
① 集成電路的超長(cháng)壽命。經(jīng)歷半個(gè)世紀的發(fā)展,集成電路從電路集成、功能集成、技術(shù)集成到知識集成。依靠頂級電子學(xué)專(zhuān)家的可靠性設計,大規模集成電路的可靠性迅速增長(cháng)。與電子產(chǎn)品的更新周期相比,集成電路具有超長(cháng)壽命與超??煽啃?,器件失效周期遠大于產(chǎn)品的更新周期。
② 計算機軟件介入。與傳統電子系統相比,嵌入式應用系統有軟件介入,系統在軟件介入下運行。因而系統的可靠性基礎是軟件的可靠性。軟件的可靠性決定了嵌入式應用系統的可靠性特征。
③ 計算機內核的智能化管理能力。嵌入式應用系統的計算機內核,決定了嵌入式應用系統是一個(gè)智能化系統。這個(gè)智能化的計算機內核可以實(shí)現可靠性的主動(dòng)控制,如噪聲失敏、動(dòng)態(tài)冗余、出錯控制、容錯管理和系統測試等。
1.2 嵌入式應用系統可靠性設計的新觀(guān)念
嵌入式應用系統可靠性設計的新觀(guān)念是多值可靠性、可靠性等級、可靠性模型與可靠性控制。
(1) 多值可靠性
傳統電子系統是二值可靠性系統,是一個(gè)非好即壞的電子系統。嵌入式應用系統則經(jīng)常表現為不好不壞,是一個(gè)多值可靠性的電子系統,這是由軟件不斷出錯引發(fā)出系統的不可靠性。當軟件運行出錯時(shí)系統無(wú)法正常工作,軟件運行恢復正常時(shí)系統恢復正常運行,這是介于“好”、“壞”之間的多值可靠性。這種多值可靠性可以用出錯概率的統計方法來(lái)界定系統的可靠性品質(zhì)。
硬件系統的超長(cháng)壽命、超??煽啃缘钠骷WC,使軟件“出錯”成為系統可靠性的主要因素。
(2) 可靠性等級
在嵌入式應用系統中客觀(guān)存在一個(gè)可靠性等級要求。相似的功能要求、相似的軟硬件,在不同的運行環(huán)境下,會(huì )有不同的可靠性設計要求。例如,運載火箭中星箭分離的爆炸螺栓控制系統,由于是空間應用環(huán)境、無(wú)人監管、強烈的機械振動(dòng)條件、出錯后果嚴重,可靠性等級要求極高;對比實(shí)驗室應用環(huán)境中的萬(wàn)用表,可靠性等級要求很低。
建立應用系統設計的可靠性等級概念,有助于在系統設計的論證階段,對系統可靠性設計的技術(shù)投入做到心中有底,在確保系統可靠的前提下有最佳的技術(shù)投入。
(3) 可靠性模型
傳統電子系統是一個(gè)激勵響應型電子系統,嵌入式應用系統則是一個(gè)軟件基礎上的激勵處理響應型智能化電子系統。從而建立起嵌入式系統激勵輸入、信息處理、響應輸出三元素的可靠性模型,在可靠性模型基礎上可以建立系統可靠性設計的一些原則與方法。
(4) 可靠性控制
嵌入式應用系統是一個(gè)有計算機內核的智能化電子系統。計算機內核的存在決定了系統具有可靠性控制能力。因此,嵌入式應用系統中,基于系統智能化特征的可靠性控制設計、功耗管理的最小功耗系統設計應與功能性設計并列為嵌入式應用系統的三大常規設計內容。
2 *定系統的可靠性等級
2.1 *定可靠性等級的重要性
在測試技術(shù)領(lǐng)域的數據采集系統中,首先有一個(gè)數據采集精度要求。如果沒(méi)有數據采集精度指標,數據采集系統的研發(fā)工作便無(wú)法啟動(dòng)。任何一個(gè)嵌入式應用系統都工作在一個(gè)特定環(huán)境中,如果不了解特定環(huán)境對系統運行影響的可能后果,應用系統的研發(fā)工作便陷入盲目性。
一個(gè)合格的嵌入式應用系統,應該在實(shí)際應用環(huán)境中可靠地工作。研發(fā)環(huán)境與實(shí)際運行環(huán)境的巨大差異,是可靠性設計的出發(fā)點(diǎn);可靠性等級*定應該是應用系統研發(fā)前期,甚至項目立項時(shí)必不可少的一項任務(wù)。如果前期缺乏應有的重視,導致可靠性設計投入欠缺,會(huì )使后續嵌入式應用系統的研發(fā)工作陷入無(wú)止境的軟、硬件修補工作之中。許多事例證明,在項目收尾工作中陷入可靠性問(wèn)題者居大多數。
2.2 可靠性等級*定方法
研發(fā)環(huán)境與實(shí)際運行環(huán)境的巨大差異也是可靠性等級*定的出發(fā)點(diǎn),實(shí)際運行環(huán)境的因子化是可靠性等級*定的基本方法。與準確的精度概念相比,可靠性等級是一個(gè)模糊量。
確定系統可靠性等級的方法是:確定可靠性*定因子、可靠性因子的順序量化、統計出系統的可靠性等級。
充分考慮到實(shí)際運行環(huán)境下,所有影響系統可靠性的因素,將這些因素確定為可靠性*定因子。為了保證不同的應用系統之間有可比性,應建立相對統一的標準,并將它作為本單位的可靠性等級*定標準。
(1) 可靠性*定因子
最常用的可靠性*定因子有環(huán)境因子、人機耦合因子、系統集成因子、知識平臺因子和安全性因子。
“環(huán)境因子”是指系統運行環(huán)境對可靠性的影響因素,如電氣環(huán)境、機械環(huán)境、氣氛環(huán)境。電氣環(huán)境中的電磁兼容性、機械環(huán)境中的抗震性、氣氛環(huán)境中的抗鹽霧、抗粉塵、防潮等。
“人機耦合因子”是指系統運行時(shí)有無(wú)操作者介入,或操作者的可介入深度。操作者的可介入度大,有利于發(fā)現系統早期的出錯征兆,并實(shí)施可靠性介入。
“系統集成因子”是指應用系統的最大芯片集成度??紤]到當前集成電路的超長(cháng)可靠性,系統集成度越大,可靠性越高。
“基礎平臺因子”是指應用系統研發(fā)時(shí),基礎平臺占據的比例?;A平臺包括半導體廠(chǎng)家提供的廠(chǎng)家平臺、企業(yè)內部的產(chǎn)品平臺、應用平臺,這些平臺都經(jīng)歷過(guò)實(shí)踐考驗。顯然,基礎平臺占據的比例越大,可靠性越高。
“安全性因子”是指系統出錯時(shí)產(chǎn)生威脅安全的因素。通用計算機死機后不會(huì )出現重大安全問(wèn)題;自動(dòng)生產(chǎn)線(xiàn)上機器人出現失控后會(huì )產(chǎn)生破壞因素;宇宙火箭星箭分離控制機構出現故障后會(huì )造成極其嚴重的后果。
我們還可以列出一些可靠性因子。
(2) 可靠性因子的順序量化
將所有可靠性因子,按照對系統可靠性設計要求的程度高低,統一量化成“上、中上、中、中下、下”5級,或“上、中、下”3級的標準級別。把這些量化標準的內容具體化,形成量化等級表,作為企業(yè)的標準,以界定不同應用系統可靠性設計要求的相對難易程度。
(3) 用量化積分確定可靠性等級
制定好可靠性因子的順序量化標準后,確定一個(gè)具體應用系統的可靠性等級時(shí),只需將應用系統具體運行環(huán)境、運行條件,在可靠性因子的量化等級表中對號入座,將量化值相加后得出系統的可靠性等級。例如,5個(gè)可靠性因子,按5個(gè)等級劃分時(shí),可靠性等級(要求)最高者為25級,最低者為5級。
3 建立系統可靠性設計模型
3.1 軟件介入下的激勵響應系統
傳統的電子系統是實(shí)時(shí)的激勵響應系統,嵌入式應用系統則是一個(gè)軟件廣泛介入下的激勵響應系統。由于軟件的介入,在激勵響應進(jìn)程中增加了軟件運行時(shí)間,造成了嵌入式應用系統的兩個(gè)新問(wèn)題,即實(shí)時(shí)性與軟件可靠性問(wèn)題。
由于軟件介入,一方面出現軟件可靠性問(wèn)題,另一方面為系統增加了可靠性的控制技術(shù),即利用軟件技術(shù)來(lái)提高系統的可靠性。
3.2 嵌入式應用系統的可靠性模型
與傳統的電子的激勵響應系統相比,嵌入式應用系統在軟件介入下,增加了一個(gè)在激勵響應中的時(shí)空過(guò)程。激勵端、過(guò)程空間、響應端,構成了嵌入式應用系統的可靠性模型。如圖1所示。
圖1 嵌入式應用系統的可靠性模型
在嵌入式應用系統的可靠性模型中,系統可靠性取決于從激勵端到響應端的唯一性管道原則。即保證在激勵端有唯一的正常激勵輸入,在運行空間有正常激勵下唯一的運行路徑,在響應端有唯一的正常響應輸出。所有破壞唯一性管道原則的因素,都會(huì )造成系統的不可靠運行。系統可靠性設計就是要保證在一切不可靠因素侵害下,都能保證唯一性管道的通暢性與穩定性。
3.3 應用系統的可靠性設計原則
在實(shí)際應用環(huán)境中,應用系統會(huì )被眾多的不可靠因素侵害。在眾多的不可靠因素侵害下,應該遵循哪些原則來(lái)保證系統的可靠性?圖2所示為可靠性設計的一些基本原則。
圖2 嵌入式應用系統的可靠性設計原則
按照唯一性管道原則,保證正常激勵輸入下有唯一的正常響應輸出,在全部路徑上都應有相應的可靠性保障措施。
在激勵端,除了正常激勵外,還會(huì )有許多非正常激勵。在保證唯一的正常激勵輸入時(shí),必須對非正常激勵采取屏蔽措施,或容錯技術(shù)。
在軟件的運行空間上,要在保證軟件的唯一運行路徑的同時(shí),盡量減少軟件漏洞,防止程序飛跑。當程序飛跑吋,能迅速發(fā)現并使之進(jìn)入安全管道。在與程序運行相關(guān)的物理空間上,不斷進(jìn)行自檢與修補。
在響應端,能及時(shí)判斷異常狀態(tài)下的非正常響應,并即時(shí)剔除。對于無(wú)法避免的非正常響應輸出,應采取安全性包容措施,以免造成不可挽回的損失。
在所有數據流的路徑上,都會(huì )有許多通道干擾,應實(shí)施管道化的屏蔽措施。按照電磁兼容性原則,不僅要屏蔽入侵的電磁干擾,也要防止本機電磁輻射外泄。在某些狀況下,防電磁輻射外泄是出于信息安全的考慮。
建立可靠性模型,有利于制定可靠性設計的技術(shù)標準。在可靠性模型基礎上,總結、歸納出系統可靠性設計的原則、方法、措施,形成企業(yè)的可靠性設計標準。使企業(yè)的可靠性設計科學(xué)化與規范化。
4 嵌入式應用系統的可靠性設計
可靠性設計是應用系統設計的常規內容,應貫徹到項目開(kāi)發(fā)的始終,并突出在項目的前期管理中。嵌入式應用系統的可靠性設計包括本質(zhì)可靠性設計與可靠性控制設計。
本質(zhì)可靠性設計是保證系統可靠性品質(zhì)的先天性設計;可靠性控制設計是軟件介入下提升系統可靠性的后天性設計。
在進(jìn)行可靠性設計時(shí),必須對系統的可靠性等級、可靠性因子有充分了解,防止陷入盲目性。
4.1 應用系統的本質(zhì)可靠性設計
本質(zhì)可靠性設計是系統可靠性品質(zhì)的先天性設計內容,是系統可靠性設計的基礎。本質(zhì)可靠性設計主要體現在項目的前期論證與總體設計中。例如,應用系統的體系結構、操作系統選擇,廠(chǎng)家平臺、應用平臺、產(chǎn)品平臺的技術(shù)支持,以及可靠性設計規范等。
拒絕“從零開(kāi)始”,是本質(zhì)可靠性設計的基本信條,“成熟度”與“繼承性”是*定應用系統本質(zhì)可靠性設計的兩個(gè)重要指標。
“成熟度”是指在項目開(kāi)發(fā)中,所使用的技術(shù)是否都經(jīng)過(guò)實(shí)踐考驗,證明其安全可靠。“繼承性”是指本項目是否有原型系統或參照系統,通常用原型系統或參照系統在本項目所占比例來(lái)確定“繼承性”的高低。
“繼承性”越高,系統的本質(zhì)可靠性越好。
在項目總體設計中,不妨將“成熟度”與“繼承性”進(jìn)一步量化,規定為總體設計中可靠性設計的一項重要指標。
4.2 應用系統的可靠性控制設計
可靠性控制設計是一種軟件介入的可靠性設計技術(shù)。例如,選擇最少出錯的運行路徑;最小的操作時(shí)空占空比,可使出錯概率最小;信息流的管道控制,防止邊界泄漏與入侵;數據的邊界管理,邊界的設定與出錯判定;重要數據的保護,校驗、糾錯、備份與重建等。
還可以舉出許多在實(shí)際使用中行之有效的可靠性設計技術(shù),如,噪聲失敏控制、時(shí)空邊界管理、系統容錯、冗余設計、系統自檢與自修復、出錯后的安全性包容等。
結語(yǔ)
① 由于計算機軟件及智能化控制的介入,嵌入式應用系統與傳統電子系統有本質(zhì)區別。因此嵌入式應用系統的可靠性設計應有全新的觀(guān)念、方法和技術(shù)。
② 隨著(zhù)器件可靠性的保證、系統的SoC化,產(chǎn)品使用周期縮短,嵌入式應用系統的可靠性將突出表現在系統的出錯概率上。
③ 應建立可靠性等級概念。不同的嵌入式應用系統對可靠性的要求不同。建立可靠性等級就會(huì )減少可靠性設計的盲目性。呼吁建立可靠性等級的國家標準。
④ 應建立可靠性模型,可靠性模型可給出嵌入式應用系統可靠性設計的一般規律和方法。
⑤ 嵌入式應用系統設計,決不是單純的功能性設計,應把功能性設計、可靠性設計、最小功耗設計列為常規設計內容。
⑥ 應不斷地把具體項目實(shí)踐中的一些可靠性設計方法、技術(shù)進(jìn)行綜合、歸納,不斷完善嵌入式應用系統可靠性設計原理與方法。
評論