嵌入式Linux Kernel錯誤跟蹤技術(shù)
2 LCRT機制的設計與實(shí)現
通過(guò)對Linux內核代碼的分析可知,Linux內核本身提供了一種“內核通知機制”[7-8],并預定義了“內核事件通知鏈”,使得Linux內核擴展開(kāi)發(fā)人員可以通過(guò)這些預定義的內核事件通知鏈在特定的內核事件發(fā)生時(shí)執行附加的處理流程。通過(guò)對Linux內核源代碼的研究發(fā)現,對于上文中提到的“嚴重不可恢復的內核異?!?,預定義了一個(gè)通知鏈和通知點(diǎn),使得在發(fā)生Linux內核崩潰之后,可以在Linux內核的panic函數中預定義的一個(gè)“內核崩潰通知鏈”[7]上掛接LCRT機制來(lái)獲得Linux內核崩潰現場(chǎng)的一些信息并記錄到非易失性存儲器中,以便分析引起Linux內核崩潰的原因。
2.1 設計要點(diǎn)
LCRT機制的設計和實(shí)現基于如下特定的機制:
(1) 編譯器選項與內核依賴(lài)
Linux內核及相應的驅動(dòng)程序都采用GNU[9]的開(kāi)源編譯器GCC[9]編譯,為了結合LCRT機制方便地提取信息和記錄信息,需要采用特定的GCC編譯器選項來(lái)編譯Linux內核和相關(guān)的驅動(dòng)程序以及應用程序。用到的選項為:-mpoke-function-name[9]。使用這個(gè)選項編譯出的二進(jìn)制程序中可以包含C語(yǔ)言函數名稱(chēng)的信息,以方便函數調用鏈回溯時(shí)記錄信息的可讀性。
(2) Linux內核notify_chain機制[8]
Linux內核提供“通知鏈”功能,并預定義了一個(gè)內核崩潰通知鏈,在Linux內核的異常處理例程中判斷出系統進(jìn)入“不可恢復”狀態(tài)時(shí),會(huì )沿預定義的通知鏈順序調用注冊到相應鏈中的通知函數。
(3) 函數調用的棧布局
Linux內核的絕大部分由C語(yǔ)言實(shí)現,而且C語(yǔ)言也多用來(lái)進(jìn)行Linux內核開(kāi)發(fā)。Linux內核及使用LKM擴展而加入Linux內核執行環(huán)境的代碼是有規律可循的,這些代碼在執行過(guò)程中產(chǎn)生的棧布局和這些規律的代碼相關(guān)聯(lián)。例如,這些函數在執行函數之前會(huì )保存本函數調用后的返回地址、本函數被調用時(shí)傳遞過(guò)來(lái)的參數及調用本函數的函數所擁有的棧幀的棧底。
2.2 LCRT機制的設計思想
LCRT機制分為L(cháng)inux內核模塊[8]部分和Linux用戶(hù)程序部分。內核模塊部分的設計采用了Linux內核模塊的模式而不是直接修改Linux內核。這樣的設計降低了Linux內核和LCRT機制之間的耦合度,同時(shí)滿(mǎn)足了Linux內核和LCRT機制獨立升級完善的便利性。用戶(hù)程序部分完成從非易失性存儲器中讀取、清除LCRT機制保存的信息等相關(guān)功能。
在LCRT機制的設計中,針對嵌入式系統的特點(diǎn),其設計決策有:
(1) 將對于解決和定位問(wèn)題最具輔助意義的函數調用關(guān)系鏈記錄下來(lái)。
(2) 為了不占用過(guò)多的存儲空間,有選擇性地將函數調用序列上的函數各自用到的棧內容保存起來(lái),而不是保存全部?jì)热荨?P style="MARGIN-TOP: 24px">(3) 將記錄的信息保存到非易失性存儲器中,這樣既達到了掉電保存的目的、又縮短了寫(xiě)入時(shí)間。
LCRT機制的設計包括以下五個(gè)方面。
(1) 設計Linux內核模塊、動(dòng)態(tài)地加載LCRT機制、盡量少地修改Linux內核代碼。
(2)在相應、預定義的Linux內核通知鏈上掛接LCRT的通知函數。
(3) 在LCRT機制的通知處理函數中進(jìn)行堆?;厮莸玫胶瘮嫡{用信息。
(4) 記錄回溯到的函數調用信息和堆??臻g內容到非易失性存儲器。
(5) 開(kāi)發(fā)用戶(hù)空間的工具,可以從非易失性存儲器中讀取保存的信息。
2.3 LCRT機制的實(shí)現
LCRT機制的實(shí)現可參照2.2節的設計思想,分步予以實(shí)現。限于篇幅,本文不過(guò)多涉及Linux內核模塊的原理和實(shí)現相關(guān)的細節,僅僅給出LCRT機制的內核模塊實(shí)現偽代碼。用偽代碼描述LCRT機制的加載函數如下:
int lcrt_init(void)
{
printk("Registering my__panic notifier.");
bt_nvram_ptr=(volatile unsigned char*)ioremap_
nocache (BT_NVRAM_BASE,BT_NVRAM_LENGTH);
bt_nvram_index+=sizeof(struct bt_info);
*)bt_nvram_ptr,BT_NVRAM_LENGTH);
notifier_chain_register(panic_notifier_list,my_
panic_block);
return 0;
}
LCRT機制的通知處理函數完成函數調用關(guān)系回溯、得到函數名稱(chēng)、函數棧內容等工作,限于篇幅,在這里用下面偽代碼說(shuō)明:
void ll_bt_information(struct pt_regs *pr)
{
變量定義等初始化工作
do {
reglist=*(unsigned long *)(*myfp-8);
//從函數棧幀的頂部獲取函數開(kāi)始執行時(shí)保存的寄存器信息
//從函數的代碼區中取得函數的名稱(chēng)
//從函數的棧幀里取出函數執行函數體代碼之前保存的函數參數信息
//從本函數的棧幀中得到調用本函數的代碼所在位置和調用本函數的函數棧幀的棧底
}while(直到函數調用鏈的鏈頭);
linux操作系統文章專(zhuān)題:linux操作系統詳解(linux不再難懂)
評論