多任務(wù)系統看門(mén)狗的實(shí)現
該結構體包括被監視的任務(wù)號taskID,用來(lái)模擬“喂狗”的變量CurCnt、LastCnt(具體含義見(jiàn)下文),看門(mén)狗狀態(tài)標志RunState用來(lái)控制當前任務(wù)是否接受監視。
被監視的任務(wù)Task1~Taskn調用自定義函數CreateWatchDog(int taskid)來(lái)創(chuàng )建看門(mén)狗,被監視任務(wù)一段時(shí)間內要求“喂狗”,調用ResetWatchDog(int taskid),這個(gè)“喂狗”動(dòng)作實(shí)質(zhì)就是對看門(mén)狗定時(shí)器結構體中的變量CurCnt加1操作。TaskMonitor大部分時(shí)間處于延時(shí)狀態(tài),假設硬件看門(mén)狗定時(shí)是2秒,監視任務(wù)可以延時(shí)1.5秒,接著(zhù)對創(chuàng )建的看門(mén)狗定時(shí)器組一一檢驗,延時(shí)前保存CurCnt的當前值到LastCnt,延時(shí)后比較CurCnt與LastCnt是否相等,都不相等系統才是正常的。需要注意的是CurCnt和LastCnt數據字節數太小,而“喂狗”過(guò)于頻繁,可能出現CurCnt加1操作達到一個(gè)循環(huán)而與LastCnt相等。
如果有任意一組的CurCnt等于LastCnt,認為對應接受監視的任務(wù)沒(méi)有“喂狗”動(dòng)作,也就檢測到該任務(wù)出現故障需要重啟,這時(shí)候TaskMonitor不對硬件看門(mén)狗定時(shí)器清零,或者延時(shí)很長(cháng)的時(shí)間,比如10秒,足以使得系統重啟。反之,系統正常,Task1~Taskn定期對TaskMonitor“喂狗”,TaskMonitor又定期對硬件看門(mén)狗“喂狗”,系統就得不到復位。還有一點(diǎn),被監視任務(wù)可以通過(guò)調用PauseWatchDog(int taskid)來(lái)取消對應的看門(mén)狗,實(shí)際上就是對STRUCT_WATCH_DOG結構體中的RunState操作,該標志體現看門(mén)狗有效與否。
這種方式可監視的最大任務(wù)數由STRUCT_WATCH_DOG結構數據的個(gè)數決定。程序中應該有一個(gè)變量記錄當前已創(chuàng )建的看門(mén)狗數,判斷被監視任務(wù)Task1~Taskn是否“喂狗”只需比較CurCnt與LastCnt的值n次。
圖3:系統復位邏輯圖。
硬件看門(mén)狗監視TaskMonitor任務(wù),TaskMonitor任務(wù)又監視其他的被監視任務(wù)Task1~Taskn,形成這樣一種鏈條。這種方式系統的故障圖表示如圖3所示。被監視任務(wù)Task1~Taskn及TaskMonitor都是或的關(guān)系,因此被監視的任一任務(wù)發(fā)生故障,硬件電路看門(mén)狗就能復位。
為實(shí)現多任務(wù)系統的看門(mén)狗監視功能額外增加了TaskMonitor任務(wù),這個(gè)任務(wù)占用執行時(shí)間多少也是一個(gè)重要問(wèn)題。假設TaskMonitor任務(wù)一個(gè)監視周期延時(shí)1.5秒,此外需要執行保存當前計數值,判斷是否“喂狗”等語(yǔ)句,它的CPU占用時(shí)間是很小的。用一個(gè)具體的試驗證實(shí),使用50M工作頻率的CPU(S3C4510),移植vxWorks操作系統,cache不使能條件下監視10個(gè)任務(wù),每個(gè)監視周期占用220~240微秒??梢?jiàn)該任務(wù)絕大多數時(shí)間都處于任務(wù)延時(shí)狀態(tài)。
被監視任務(wù)可能有獲取消息、等待一個(gè)信號量等的語(yǔ)句,往往這個(gè)消息、信號量的等待是無(wú)限期的等待。這就需要將這類(lèi)語(yǔ)句作一些修改。比
如在vxWorks中將一次無(wú)期限的獲取信號量操作
semTake(semID, WAIT_FOREVER); // WAIT_FOREVER為無(wú)限時(shí)間等待
分解為
do
{
ResetWatchDog; // “喂狗”操作
}while(semTake(semID, sysClkRateGet( )) != OK); // 1s內的等待信號量操作
多次的時(shí)間范圍內的獲取信號量操作,這樣才能保證及時(shí)“喂狗”。
另外需要注意的是系統中是否有的任務(wù)優(yōu)先級比TaskMonitor高并且長(cháng)時(shí)間處于執行狀態(tài),TaskMonitor長(cháng)時(shí)間得不到調度,使得看門(mén)狗錯誤復位。良好的任務(wù)劃分,配置是不應該出現這種高優(yōu)先級任務(wù)長(cháng)期執行狀況的。
評論