μC/OS的任務(wù)調度實(shí)現方法及PowerPC上的優(yōu)化
?、?設置任務(wù)退出就緒態(tài)。
y = OSTCBCur>OSTCBY;
OSRdyTbl[y] = ~OSTCBCur>OSTCBBitX;
if (OSRdyTbl[y] == 0) {
OSRdyGrp = ~OSTCBCur>OSTCBBitY;
}
?、?尋找最高優(yōu)先級的就緒態(tài)任務(wù)。以OSRdyGrp的值做偏移量,查OSUnMapTbl表,得到1個(gè)0到7的數Y,作為優(yōu)先級高3位,再根據Y的值,找出OSRdyTbl中對應的字節,并且再次查OSUnMapTbl表,得到1個(gè)0到7的數X,作為優(yōu)先級低3位的值,通過(guò)將Y左移3位再加上X的值,得到就緒任務(wù)中優(yōu)先級最高的那個(gè)。
y = OSUnMapTbl[OSRdyGrp];
SPrioHighRdy = (INT8U)((y 3) + OSUnMapTbl[OSRdyTbl[y]]);
μC/OS的任務(wù)調度算法采用了以空間換時(shí)間的策略,將特定字節值的最低位1所在位的信息預先計算并保存到表中,運行時(shí)通過(guò)查表快速得到;每個(gè)任務(wù)的TCB中除了保存優(yōu)先級信息本身外,還使用額外的4個(gè)字節保存優(yōu)先級的高低3位和對應的OSUnMapTbl值,以避免運行時(shí)實(shí)時(shí)計算這幾個(gè)值所帶來(lái)的延遲。這些措施增加了系統ROM和RAM的開(kāi)銷(xiāo)。
3 利用PowerPC“數出前導零數目”指令實(shí)現任務(wù)調度
PowerPC是Motorola 、IBM和Apple三家公司于20世紀90年代初期聯(lián)合設計的32位CPU。Freescale(其前身是Motorola半導體部)發(fā)展了針對汽車(chē)電子的MPC5xx系列單片機及后續基于e200內核的MPC5xxx系列單片機;更高端的e500、e600內核是用于通信領(lǐng)域的MPC6xxx、7xxx和8xxx系列。
下面對μC/OS任務(wù)優(yōu)先級調度算法的改進(jìn)和優(yōu)化是在MPC5554單片機上實(shí)現的。
PowerPC處理器具有一條“數出前導零數目” 的指令cntlzw(count leading zero word),可以以硬件指令方式實(shí)現優(yōu)先級的多任務(wù)調度算法。這條指令也可用于圖像處理和算法加密的場(chǎng)合。該指令數出一個(gè)32位寄存器中前置零的數目,例如,返回0表示b0不為零,即沒(méi)有前導零;返回3表示b3不為零,b3位的前面從b0到b2共有3個(gè)零;返回32表示RS寄存器中所有的位都為零。(在PowerPC架構中,最高位MSB表示為b0,低位MSB根據位寬表示為b7、b15或b31。)
利用這條指令,用匯編語(yǔ)言改寫(xiě)尋找最高優(yōu)先級的就緒任務(wù)的函數,則不需要進(jìn)行循環(huán)移位判斷,可以直接從64個(gè)任務(wù)中找出優(yōu)先級最高的那個(gè)任務(wù)。代碼如下:
asm INT8U FindHighestRdyTask(void){
lisr5,OSRdyTbl@ha//讓r5寄存器指向OSRdyTbl[]
orir5,r5,OSRdyTbl@l
lwzr3,0(r5)//將OSRdyTbl[0]的值載入r3寄存器
cntlzwr3,r3//計算OSRdyTbl[0]中前導零數目
cmpi0,0,r3,32//判斷前32個(gè)任務(wù)是否就緒
bne __FindEnd//如果前導零數目為32,說(shuō)明前32個(gè)任務(wù)均未就緒,需要從后32個(gè)任務(wù)中尋找
lwzr4,4(r5)//將OSRdyTbl[1]的值載入r4寄存器
cntlzwr4,r4//計算OSRdyTbl[1]的前導零數目
addir3,r4,32//后32個(gè)任務(wù)需要加上偏移量
__FindEnd:
blr //返回值保存在r3寄存器中
}
在這段代碼中,首先判斷前32個(gè)任務(wù)是否有處于就緒態(tài)的,如果沒(méi)有的話(huà),再對后32個(gè)任務(wù)進(jìn)行判斷。由于優(yōu)先級最低的空閑任務(wù)總是處于就緒態(tài),所以后32個(gè)任務(wù)總能返回一個(gè)有效值。該代碼在前32個(gè)任務(wù)有就緒態(tài)時(shí)運行7條指令,在前32個(gè)任務(wù)均沒(méi)有就緒時(shí)需要執行10條指令;而μC/OS原有的代碼編譯出來(lái)的匯編程序,則需要運行15條指令。
使用這個(gè)方法的另一個(gè)好處是不再需要使用256字節的OSUnMapTbl表,任務(wù)控制塊TCB也不需要使用OSTCBX、OSTCBY和OSTCBBitY、OSTCBBitX變量,每個(gè)ECB中也不再需要OSRdyGrp,這也減少了對ROM和RAM的占用。
4 改進(jìn)擴展任務(wù)數的優(yōu)先級調度性能
當對μC/OSII支持的任務(wù)數進(jìn)行擴展時(shí),按照μC/OSII原有的做法,需要按照高低字節分別查找OSUnMapTbl對照表。任務(wù)數為256時(shí),尋找最高優(yōu)先級就緒任務(wù)的函數將需要運行約35條指令。數出前導零數目的指令在這種情況下的作用將更加顯著(zhù),對于32位PowerPC處理器,精心設計的代碼可以做到僅需10條指令就將任務(wù)數擴展到1024個(gè)。
此時(shí)OSRdyGrp擴展為32位,OSrdyTbl擴展成32個(gè)32位的數組。從OSRdyGrp得到的前導零數目,就是任務(wù)優(yōu)先級高5位的值,乘以4可以得到該字的相對偏移地址;在OSRdyTbl中,定義高位對應高優(yōu)先級任務(wù),低位對應低優(yōu)先級任務(wù),則其前導零數目就是任務(wù)優(yōu)先級低5位的值,和高5位的值移位相加就得到完整的任務(wù)優(yōu)先級。通過(guò)將OSRdyGrp和OSRdyTbl定義成結構體,利用結構體首地址的相對尋址來(lái)分別讀取其數值,可以減少一次取地址的操作。
尋找最高優(yōu)先級就緒態(tài)的最終代碼如下:
typedef struct {//定義結構體
INT32U Tbl[32];
INT32U Grp;
} OSTaskRdyBlock;
OSTaskRdyBlock OSRdy;//定義全局變量OSRdy
asm INT16U FindHighestRdyTask(void){
lisr5,OSRdy@ha//將OSRdy結構體指針載入r5寄存器
orir5,r5,OSRdy@l
評論