單片機應用系統的可靠性設計
隨著(zhù)單片機在國防、金融、工業(yè)控制等重要領(lǐng)域應用越來(lái)越廣泛,單片機應用系統的可靠性越來(lái)越成為人們關(guān)注的一個(gè)重要課題。單片機應用系統的可靠性是由多種因素決定的,大體分為硬件系統可靠性設計和軟件系統可靠性設計。
本文引用地址:http://dyxdggzs.com/article/201612/328511.htm一、硬件系統可靠性設計
(1)選優(yōu)設計
在系統硬件設計和加工時(shí),應該選用質(zhì)量好的接插件,設計好工藝結構;選用合格的元器件,進(jìn)行嚴格的測試、篩選和老化;設計時(shí)技術(shù)參數(如負載)要留有一定的余量或降額使用元器件;提高印制板和組裝的質(zhì)量。
(2)冗余與容錯設計
保證單片機應用系統100%無(wú)故障是不可能的。容錯是指當系統的某個(gè)部件發(fā)生故障時(shí),系統仍能完全正常地工作,即給系統增加容忍故障的能力。為使系統具有容錯能力,必須在系統中增加適當的冗余單元,以保證當某個(gè)部件發(fā)生故障時(shí)能由冗余部件接替其工作,原部件修復后再恢復出錯前的狀態(tài)。硬件冗余設計可以在元件級、子系統或系統級上進(jìn)行。例如,在系統級上采用雙機系統,兩套系統互為備用。
(3)采用硬件抗干擾措施
來(lái)自供電系統以及通過(guò)導線(xiàn)傳輸、電磁耦合等產(chǎn)生的電磁干擾信號,是單片機系統工作不穩定的重要因素,在系統硬件設計時(shí)必須采取有效的干擾抑制措施。單片機應用系統中還常使用系統監視電路檢測系統發(fā)生的錯誤或故障,自動(dòng)報警或使系統自動(dòng)恢復正常工作狀態(tài)。如采用電源故障監視、看門(mén)狗定時(shí)器等采用89C51單片機和X25045組成的看門(mén)狗電路,X25045硬件連接圖如圖所示。X25045芯片內包含有一個(gè)看門(mén)狗定時(shí)器,可通過(guò)軟件預置系統的監控時(shí)間。在看門(mén)狗定時(shí)器預置的時(shí)間內若沒(méi)有總線(xiàn)活動(dòng),則X25045將從RESET輸出一個(gè)高電平信號,經(jīng)過(guò)微分電路C2、R3輸出一個(gè)正脈沖,使CPU復位。如圖1所示電路中,CPU的復位信號共有3個(gè):上電復位(C1、R2),人工復位(S、R1、R2)和Watchdog復位(C2、R3),通過(guò)或門(mén)綜合后加到RESET端。C2、R3的時(shí)間常數不必太大,有數百微秒即可,因為這時(shí)CPU的振蕩器已經(jīng)在工作。
看門(mén)狗電路的定時(shí)時(shí)間長(cháng)短可由具體應用程序的循環(huán)周期決定,通常比系統正常工作時(shí)最大循環(huán)周期的時(shí)間略長(cháng)即可。編程時(shí),可在軟件的合適地方加一條喂狗指令,使看門(mén)狗的定時(shí)時(shí)間永遠達不到預置時(shí)間,系統就不會(huì )復位而正常工作。當系統跑飛,用軟件陷阱等別的方法無(wú)法捕捉回程序時(shí),則看門(mén)狗定時(shí)時(shí)間很快增長(cháng)到預置時(shí)間,迫使系統復位。需要注意的是,在程序正常運行的時(shí)候,應該在適當的地方加一條喂狗指令,使系統正常運行時(shí)的定時(shí)時(shí)間達不到預置時(shí)間。系統就不會(huì )復位。
二、軟件可靠性設計
單片機應用系統的軟件和硬件是緊密相關(guān)的。要使整個(gè)系統具有較高的可靠性,除了在盡可能提高硬件可靠性的前提下,軟件的可靠性設計也是必不可少的,必須從設計、測試及長(cháng)期使用等方面來(lái)解決軟件可靠性。單片機系統的抗干擾能力是系統可靠性的重要指標。由于51單片機的指令系統是復雜指令集結構,致使其抗干擾性能較低,尤其用在工業(yè)控制的場(chǎng)合,如果不增加額外的抗干擾措施,甚至無(wú)法正常工作。單片機軟件抗干擾設計的主要目的就是及時(shí)發(fā)現“跑飛”的程序,并及時(shí)地將程序拉入正常軌道,主要方法有:指令冗余、軟件“陷阱”、軟件“看門(mén)狗”等等。
(1)指令冗余
CPU取指令過(guò)程是先取操作碼,再取操作數。在程序的關(guān)鍵地方人為的插入一些單字節指令,或將有效單字節指令重寫(xiě)稱(chēng)為指令冗余,通常是在雙字節指令和三字節指令后插入兩個(gè)字節以上的NOP指令。這樣即使跑飛程序飛到雙字節指令和三字節指令操作數上。由于窄操作指令NOP的存在,避免了后面的指令被錯誤地執行,為程序納入正軌做好準備。此外,對系統流向起重要作用的指令,如RET、RETI、LCALI.、LJMP,JC等,可以在這些指令之后插入兩條NOP指令,可將跑飛程序納入正軌,以確保這些重要指令的執行。指令冗余只能使CPU不再將操作數當作操作碼錯誤地執行,卻不能主動(dòng)地將程序的錯誤執行方向扭轉過(guò)來(lái),要想糾止程序的錯誤執行方向,就需要下面的技術(shù)。(2)設計軟件“陷阱”
通常在程序存儲器中未使用的EPROM空間填入窄操作指令NOP,最后再填入一條跳轉指令,跳轉到跑飛處理程序,或者直接填入指令LJMP 0000H,當跑飛程序落到此區域。即可在執行一段空操作后轉入正軌。如果未使用的EPROM空間比較大,可以均勻地填入幾條空操作指令和跳轉指令,這種幾條空操作指令加一條跳轉指令的結構我們稱(chēng)之為“軟件陷阱”.
軟件陷阱的一般結構為:
NOP
NOP
LJMP FLY
FLY為跑飛處理子程序,如果程序正常執行,軟件陷阱部分是永遠也執行不到的,只有在程序跑飛到陷阱里,軟件陷阱會(huì )立刻將程序跳轉到正常軌道。即使程序沒(méi)有跑飛到陷阱里,也可以在程序執行一段錯誤操作后遇到一個(gè)軟件陷阱,從而轉入正軌。除了程序存儲器的空白區域,程序的數據表結尾也應該設置軟件陷阱,如果數據表比較大,應該在數據表的中間也設置軟件陷阱,以保證程序跑飛到數據區能及時(shí)轉入正軌。另外,如果程序存儲器的空間足夠大的話(huà),可以在每?jì)蓚€(gè)子程序中間設 置一個(gè)軟件陷阱。當使用的中斷因干擾而開(kāi)放時(shí),在對應的中斷服務(wù)程序中設置軟件陷阱,能及時(shí)捕獲錯誤的中斷。軟件陷阱的數量要根據實(shí)際受到干擾的情況和程序存儲器的容量來(lái)確定,如果太少不能進(jìn)行有效的跑飛攔截,如果太多又會(huì )占用大量的程序存儲器空間。
(3)軟件“看門(mén)狗”技術(shù)
跑飛的程序在執行一些錯誤操作之后。
經(jīng)常會(huì )進(jìn)入“死循環(huán)”,也就足常說(shuō)的“死機”.通常采用“軟件看門(mén)狗”技術(shù)使程序脫離“死循環(huán)”,軟件“看門(mén)狗”技術(shù)的原理是通過(guò)不斷檢測程序循環(huán)運行時(shí)間,若發(fā)現程序循環(huán)時(shí)間超過(guò)最大循環(huán)運行時(shí)間,則認為系統陷入“死循環(huán)”,需要進(jìn)行出錯處理。在實(shí)際應用中,通常用定時(shí)中斷服務(wù)程序定時(shí)地檢查主程序的運行情況。例如,在RAM區選擇一個(gè)字節作為軟件看門(mén)狗寄存器,主程序每循環(huán)一次將該寄存器加l,定時(shí)器TO的中斷服務(wù)程序每中斷一次將該寄存器減l并檢查一次,如果程序執行正常??撮T(mén)狗寄存器不會(huì )改變或改變不大,如果看門(mén)狗寄存器發(fā)生了改變或改變很大,則說(shuō)明系統陷入“死循環(huán)”.需要進(jìn)行出錯處理。在工業(yè)應用中,嚴重的干擾有時(shí)會(huì )破壞中斷方式控制字,關(guān)閉中斷,造成看門(mén)狗失效,這時(shí)可以采用環(huán)形中斷監視系統。用定時(shí)器TO監視定時(shí)器Tl,用定時(shí)器Tl監視豐程序,主程序監視定時(shí)器T0.
采用這種環(huán)形結構的軟件“看門(mén)狗”具有良好的抗干擾性能,大大提高了系統可靠性。對于需經(jīng)常使用Tl定時(shí)器進(jìn)行串口通訊的測控系統,則定時(shí)器Tl不能進(jìn)行中斷,可改由串口中斷進(jìn)行監控。當然,對主程序最大循環(huán)周期、定時(shí)器T0和Tl定時(shí)周期應于全盤(pán)合理考慮。軟件“看門(mén)狗”技術(shù)需要使用定時(shí)器,而在大多數的控制程序中,定時(shí)器都是緊俏的資源。這就使“軟件看門(mén)狗”技術(shù)的實(shí)際應用受到了限制,我們可以采取一些技巧性的處理,將軟件“看門(mén)狗”程序與其它定時(shí)程序復用同一個(gè)定時(shí)器,這樣既完成定時(shí)功能又完成軟件“看門(mén)狗”的功能。
(4)檢查RAM區標志數據及時(shí)發(fā)現嚴重干擾
這種方法是在RAM區中選擇幾個(gè)固定單元,在初始化程序中將其設置成固定的數據,只要程序正常運行,這些單元的內容是不會(huì )改變的。如果因為程序“跑飛”或其它干擾導致這些RAM單元中的任何單元的數據發(fā)生了變化,說(shuō)明單片機系統已經(jīng)受到了嚴重的干擾,不能可靠地運行下去了。我們可以在程序執行的過(guò)程中適時(shí)地檢查這些RAM單元的內容,一旦發(fā)現有數據改變,立刻執行LJMP 0000 H語(yǔ)句,強制單片機復位。
(5)刷新輸出端口
排除嚴重干擾,當單片機系統受到嚴重干擾時(shí),輸出端口的狀態(tài)也可能因干擾而改變,在程序的執行過(guò)程中適時(shí)地根據相關(guān)程序模塊的運算結果刷新輸出端口,可以排除干擾對輸出端口狀態(tài)的影響,使錯誤的輸出狀態(tài)及時(shí)得到糾正。
(6)進(jìn)行多次輸入采樣
避免嚴重干擾,強烈的干擾會(huì )影響單片機的輸入信號,造成輸入信號瞬間采樣的誤差或誤讀,要避免干擾的影響,通常采取重復采樣,加權平均的方法。
三、結束語(yǔ)
單片機系統運行的可靠性會(huì )不確定因素的干擾。提高單片機應用系統的可靠性要從軟硬件入手。提高系統的自身防御行為,以上所提到幾種提高可靠性的方法,都不是單獨使用的,只有根據實(shí)際情況將這些方法有效地結合起來(lái),才能達到最佳抗干擾效果,使我們的單片機系統穩定可靠地工作。
評論