Linux編程時(shí)遇到Oops提示該如何排查?
用于表示函數的調用關(guān)系,通過(guò)這段信息我們可以知道,函數的整個(gè)執行流程,知道它的函數調用關(guān)系,最后整理出來(lái)的函數執行流程如下:
本文引用地址:http://dyxdggzs.com/article/201811/395128.htm

從中我們看到了熟悉的init函數、probe函數、以及清楚probe函數下執行的操作過(guò)程是到哪一步出錯的?,F在我們知道了代碼的執行流程,出錯的PC指針的位置,但還是看不到代碼,出錯指針處我們只看到了一串數字,那么接下來(lái)我們就操作一下,把pc指針的數據變?yōu)橛幸饬x的代碼。
第一步,分辨出錯誤代碼在什么位置
這次實(shí)驗涉及的二進(jìn)制文件有內核的燒錄固件以及驅動(dòng)的ko文件,所以第一步分析就需要確定出錯代碼是在內核固件里還是ko文件里。
首先得到內核代碼的范圍,用以下命令將內核反匯編。

查看這個(gè)文件的格式如是:

第一列行數,第二列運行地址,第三列二進(jìn)制碼,第四列匯編代碼,既然第二列為運行地址,即等同于程序運行到這行時(shí),pc指針的值等于這個(gè)數值。這樣只要翻看這個(gè)文件的頭部以及尾部,就能知道內核代碼的PC指針?lè )秶鸀椋篶0008000~c0562338。
根據前面第5步寄存器值,出錯時(shí)PC指針為c02f1878,即在內核源碼范圍內。
第二步,分析出錯函數的出錯語(yǔ)句
那么根據第3步PC指針,得到regulator_set_current_limit的匯編代碼,如下:

函數入口地址為c02f186c。
在第3步PC指針指出偏移地址為“PC is at regulator_set_current_limit+0xc”。
PC = 0xc02f1878 = 0xc02f186c + 0xc,符合匯編代碼地址。
第三步,找到出錯函數的C語(yǔ)言代碼
這步可以說(shuō)是最困難的,因為內核代碼層次多,同名函數也可能存在許多份,可能幾份編譯進(jìn)內核(static聲明的局部函數),也可能沒(méi)編譯進(jìn)內核,如何從眾多的代碼中分析出具體哪段呢。
本人就使用了一些小手段,首先給每個(gè)同名函數的入口加段亂碼,讓編譯器篩選出編譯進(jìn)內核的文件(因為亂碼,所以編譯會(huì )報錯),然后給剩下的函數加打印語(yǔ)句,通常經(jīng)過(guò)第一步之后,可選的目標就兩三個(gè),通過(guò)打印進(jìn)一步確認代碼即可。
以下為篩選出來(lái)的C語(yǔ)言代碼。

看到這好像是定位了函數,但對于不熟悉匯編的人來(lái)說(shuō),C與匯編還是沒(méi)有關(guān)聯(lián)起來(lái),好像進(jìn)入了死胡同,但先別氣餒,從上面的匯編代碼中我們知道,函數名即為函數的首地址,那么調用子函數即需要讓CPU知道子函數名,那么匯編如何調用子函數呢?使用bl指令, bl+子函數名。既然匯編有這么一個(gè)特性,那么我們看匯編代碼。
上面582734行為“bl c0493104”這句調用了子函數,再看C中調用此函數的語(yǔ)句。

那么結果顯而易見(jiàn),不可能定義個(gè)變量都報錯吧,所以唯一可能錯誤的語(yǔ)句就是struct regulator_dev *rdev = regulator->rdev,同理,這句的前半部也只是定義一個(gè)rdev的變量,再結合內核給出來(lái)的提示——空指針,所以錯誤就是regulator->rdev是一個(gè)空指針。
最終的問(wèn)題就歸結于,為什么regulatar->rdev為空指針。這部分的查閱代碼以及推理需要更深層次地挖掘,工作量也非本文能說(shuō)清的,故作者在這里就大膽地推測與上面的A->B->C模型類(lèi)似。所以我們就需要在這個(gè)資源存在的時(shí)刻,調用它之前給它賦值。
這時(shí)侯,我們就需要拿出第8步函數執行的回溯關(guān)系圖,既然知道這個(gè)圖中最后的函數的輸入參數regulator的rdev為空,那么我們就關(guān)心regulator結構體以及它的意義。從結構體的意義我們才能知道如何給它賦值。

在相關(guān)的代碼文件中搜索關(guān)鍵字”regulator”或”regulator =”(建議搜這個(gè),因為這種才是賦值語(yǔ)句)得到如下代碼。

分析這個(gè)函數可知,regulator實(shí)際是pdata的一個(gè)成員,他需要data來(lái)初始化,那么接下來(lái)的事情就簡(jiǎn)單了,在回溯關(guān)系中找一個(gè)位置把data的數據塞入pdata中,剛好這段函數就是初始化的regulator的,那就直接拿去用吧。
把這段添加到probe函數內的這個(gè)位置,實(shí)現了在mxsbl_probe和mxsbl_do_probe之間賦值此變量。

這樣重新編譯后即可正常加載ko文件。
評論