如何編寫(xiě)Linux設備驅動(dòng)程序
序言
Linux是Unix操作系統的一種變種,在Linux下編寫(xiě)驅動(dòng)程序的原理和思想完全類(lèi)似于其他的Unix系統,但它dos或window環(huán)境下的驅動(dòng)程序有很大的區別。在Linux環(huán)境下設計驅動(dòng)程序,思想簡(jiǎn)潔,操作方便,功能也很強大,但是支持函數少,只能依賴(lài)kernel中的函數,有些常用的操作要自己來(lái)編寫(xiě),而且調試也不方便。本人這幾周來(lái)為實(shí)驗室自行研制的一塊多媒體卡編制了驅動(dòng)程序,獲得了一些經(jīng)驗,愿與Linux fans共享,有不當之處,請予指正。
以下的一些文字主要來(lái)源于khg,johnsonm的Write linux device driver,Brennan's Guide to Inline Assembly,The Linux A-Z,還有清華BBS上的有關(guān)device driver的一些資料. 這些資料有的已經(jīng)過(guò)時(shí),有的還有一些錯誤,我依據自己的試驗結果進(jìn)行了修正.
一、Linux device driver 的概念
系統調用是操作系統內核和應用程序之間的接口,設備驅動(dòng)程序是操作系統內核和機器硬件之間的接口.設備驅動(dòng)程序為應用程序屏蔽了硬件的細節,這樣在應用程序看來(lái),硬件設備只是一個(gè)設備文件, 應用程序可以象操作普通文件一樣對硬件設備進(jìn)行操作.設備驅動(dòng)程序是內核的一部分,它完成以下的功能:
1.對設備初始化和釋放.
2.把數據從內核傳送到硬件和從硬件讀取數據.
3.讀取應用程序傳送給設備文件的數據和回送應用程序請求的數據.
4.檢測和處理設備出現的錯誤.
在Linux操作系統下有兩類(lèi)主要的設備文件類(lèi)型,一種是字符設備,另一種是塊設備.字符設備和塊設備的主要區別是:在對字符設備發(fā)出讀/寫(xiě)請求時(shí),實(shí)際的硬件I/O一般就緊接著(zhù)發(fā)生了,塊設備則不然,它利用一塊系統內存作緩沖區,當用戶(hù)進(jìn)程對設備請求能滿(mǎn)足用戶(hù)的要求,就返回請求的數據,如果不能,就調用請求函數來(lái)進(jìn)行實(shí)際的I/O操作.塊設備是主要針對磁盤(pán)等慢速設備設計的,以免耗費過(guò)多的CPU時(shí)間來(lái)等待.
已經(jīng)提到,用戶(hù)進(jìn)程是通過(guò)設備文件來(lái)與實(shí)際的硬件打交道.每個(gè)設備文件都都有其文件屬性(c/b),表示是字符設備還蔤強檣璞?另外每個(gè)文件都有兩個(gè)設備號,第一個(gè)是主設備號,標識驅動(dòng)程序,第二個(gè)是從設備號,標識使用同一個(gè)設備驅動(dòng)程序的不同的硬件設備,比如有兩個(gè)軟盤(pán),就可以用從設備號來(lái)區分他們.設備文件的的主設備號必須與設備驅動(dòng)程序在登記時(shí)申請的主設備號一致,否則用戶(hù)進(jìn)程將無(wú)法訪(fǎng)問(wèn)到驅動(dòng)程序.
最后必須提到的是,在用戶(hù)進(jìn)程調用驅動(dòng)程序時(shí),系統進(jìn)入核心態(tài),這時(shí)不再是搶先式調度.也就是說(shuō),系統必須在你的驅動(dòng)程序的子函數返回后才能進(jìn)行其他的工作.如果你的驅動(dòng)程序陷入死循環(huán),不幸的是你只有重新啟動(dòng)機器了,然后就是漫長(cháng)的fsck./hehe
讀/寫(xiě)時(shí),它首先察看緩沖區的內容,如果緩沖區的數據
如何編寫(xiě)Linux操作系統下的設備驅動(dòng)程序
我們來(lái)寫(xiě)一個(gè)最簡(jiǎn)單的字符設備驅動(dòng)程序。雖然它什么也不做,但是通過(guò)它可以了解Linux的設備驅動(dòng)程序的工作原理.把下面的C代碼輸入機器,你就會(huì )獲得一個(gè)真正的設備驅動(dòng)程序.不過(guò)我的kernel是2.0.34,在低版本的kernel上可能會(huì )出現問(wèn)題,我還沒(méi)測試過(guò)./xixi
#define __NO_VERSION__
#include linux/modules.h>
#include linux/version.h>
char kernel_version [] = UTS_RELEASE;
這一段定義了一些版本信息,雖然用處不是很大,但也必不可少.Johnsonm說(shuō)所有的驅動(dòng)程序的開(kāi)頭都要包含linux/config.h>,但我看倒是未必.
由于用戶(hù)進(jìn)程是通過(guò)設備文件同硬件打交道,對設備文件的操作方式不外乎就是一些系統調用,如 open,read,write,close...., 注意,不是fopen, fread,但是如何把系統調用和驅動(dòng)程序關(guān)聯(lián)起來(lái)呢?這需要了解一個(gè)非常關(guān)鍵的數據結構:
struct file_operations { int (*seek) (struct inode * ,struct file *, off_t ,int); |
這個(gè)結構的每一個(gè)成員的名字都對應著(zhù)一個(gè)系統調用.用戶(hù)進(jìn)程利用系統調用在對設備文件進(jìn)行諸如read/write操作時(shí),系統調用通過(guò)設備文件的主設備號找到相應的設備驅動(dòng)程序,然后讀取這個(gè)數據結構相應的函數指針,接著(zhù)把控制權交給該函數.這是linux的設備驅動(dòng)程序工作的基本原理.既然是這樣,則編寫(xiě)設備驅動(dòng)程序的主要工作就是編寫(xiě)子函數,并填充file_operations的各個(gè)域.
相當簡(jiǎn)單,不是嗎?
下面就開(kāi)始寫(xiě)子程序.
#include linux/types.h> static int read_test(struct inode *node,struct file *file, int left; if (verify_area(VERIFY_WRITE,buf,count) == -EFAULT ) for(left = count ; left > 0 ; left--) |
這個(gè)函數是為read調用準備的.當調用read時(shí),read_test()被調用,它把用戶(hù)的緩沖區全部寫(xiě)1.buf 是read調用的一個(gè)參數.它是用戶(hù)進(jìn)程空間的一個(gè)地址.但是在read_test被調用時(shí),系統進(jìn)入核心態(tài).所以不能使用buf這個(gè)地址,必須用__put_user(),這是kernel提供的一個(gè)函數,用于向用戶(hù)傳送數據.另外還有很多類(lèi)似功能的函數.請參考.在向用戶(hù)空間拷貝數據之前,必須驗證buf是否可用。
這就用到函數verify_area.
static int write_tibet(struct inode *inode,struct file *file, static int open_tibet(struct inode *inode,struct file *file ) static void release_tibet(struct inode *inode,struct file *file ) |
這幾個(gè)函數都是空操作.實(shí)際調用發(fā)生時(shí)什么也不做,他們僅僅為下面的結構提供函數指針。
struct file_operations test_fops = { NULL, read_test, write_test, NULL, /* test_readdir */ NULL, NULL, /* test_ioctl */ NULL, /* test_mmap */ open_test, release_test, NULL, /* test_fsync */ NULL, /* test_fasync */ /* nothing more, fill with NULLs */ }; |
設備驅動(dòng)程序的主體可以說(shuō)是寫(xiě)好了?,F在要把驅動(dòng)程序嵌入內核。驅動(dòng)程序可以按照兩種方式編譯。一種是編譯進(jìn)kernel,另一種是編譯成模塊(modules),如果編譯進(jìn)內核的話(huà),會(huì )增加內核的大小,還要改動(dòng)內核的源文件,而且不能動(dòng)態(tài)的卸載,不利于調試,所以推薦使用模塊方式。
int init_module(void) result = register_chrdev(0, "test", test_fops); if (result 0) { if (test_major == 0) test_major = result; /* dynamic */ |
在用insmod命令將編譯好的模塊調入內存時(shí),init_module 函數被調用。在這里,init_module只做了一件事,就是向系統的字符設備表登記了一個(gè)字符設備。register_chrdev需要三個(gè)參數,參數一是希望獲得的設備號,如果是零的話(huà),系統將選擇一個(gè)沒(méi)有被占用的設備號返回。參數二是設備文件名,參數三用來(lái)登記驅動(dòng)程序實(shí)際執行操作的函數的指針。
如果登記成功,返回設備的主設備號,不成功,返回一個(gè)負值。
void cleanup_module(void) { unregister_chrdev(test_major, "test"); } |
在用rmmod卸載模塊時(shí),cleanup_module函數被調用,它釋放字符設備test在系統字符設備表中占有的表項。
一個(gè)極其簡(jiǎn)單的字符設備可以說(shuō)寫(xiě)好了,文件名就叫test.c吧。
下面編譯
$ gcc -O2 -DMODULE -D__KERNEL__ -c test.c
得到文件test.o就是一個(gè)設備驅動(dòng)程序。
如果設備驅動(dòng)程序有多個(gè)文件,把每個(gè)文件按上面的命令行編譯,然后
ld -r file1.o file2.o -o modulename.
驅動(dòng)程序已經(jīng)編譯好了,現在把它安裝到系統中去。
$ insmod -f test.o
如果安裝成功,在/proc/devices文件中就可以看到設備test,并可以看到它的主設備號。
要卸載的話(huà),運行
$ rmmod test
下一步要創(chuàng )建設備文件。
mknod /dev/test c major minor
c 是指字符設備,major是主設備號,就是在/proc/devices里看到的。
用shell命令
$ cat /proc/devices | awk "\$2=="test" {print \$1}"
就可以獲得主設備號,可以把上面的命令行加入你的shell script中去。
minor是從設備號,設置成0就可以了。
我們現在可以通過(guò)設備文件來(lái)訪(fǎng)問(wèn)我們的驅動(dòng)程序。寫(xiě)一個(gè)小小的測試程序。
#include stdio.h> main() testdev = open("/dev/test",O_RDWR); if ( testdev == -1 ) read(testdev,buf,10); for (i = 0; i 10;i ) close(testdev); |
編譯運行,看看是不是打印出全1 ?
以上只是一個(gè)簡(jiǎn)單的演示。真正實(shí)用的驅動(dòng)程序要復雜的多,要處理如中斷,DMA,I/O port等問(wèn)題。這些才是真正的難點(diǎn)。請看下節,實(shí)際情況的處理。
三、設備驅動(dòng)程序中的一些具體問(wèn)題
1. I/O Port.
和硬件打交道離不開(kāi)I/O Port,老的ISA設備經(jīng)常是占用實(shí)際的I/O端口,在linux下,操作系統沒(méi)有對I/O口屏蔽,也就是說(shuō),任何驅動(dòng)程序都可對任意的I/O口操作,這樣就很容易引起混亂。每個(gè)驅動(dòng)程序應該自己避免誤用端口。
有兩個(gè)重要的kernel函數可以保證驅動(dòng)程序做到這一點(diǎn)。
1)check_region(int io_port, int off_set)
這個(gè)函數察看系統的I/O表,看是否有別的驅動(dòng)程序占用某一段I/O口。
參數1:io端口的基地址,
參數2:io端口占用的范圍。
返回值:0 沒(méi)有占用, 非0,已經(jīng)被占用。
2)request_region(int io_port, int off_set,char *devname)
如果這段I/O端口沒(méi)有被占用,在我們的驅動(dòng)程序中就可以使用它。在使用之前,必須向系統登記,以防止被其他程序占用。登記后,在/proc/ioports文件中可以看到你登記的io口。
參數1:io端口的基地址。
參數2:io端口占用的范圍。
參數3:使用這段io地址的設備名。
在對I/O口登記后,就可以放心地用inb(), outb()之類(lèi)的函來(lái)訪(fǎng)問(wèn)了。
在一些pci設備中,I/O端口被映射到一段內存中去,要訪(fǎng)問(wèn)這些端口就相當于訪(fǎng)問(wèn)一段內存。經(jīng)常性的,我們要獲得一塊內存的物理地址。在dos環(huán)境下,(之所以不說(shuō)是dos操作系統是因為我認為DOS根本就不是一個(gè)操作系統,它實(shí)在是太簡(jiǎn)單,太不安全了)只要用段:偏移就可以了。在window95中,95ddk提供了一個(gè)vmm 調用 _MapLinearToPhys,用以把線(xiàn)性地址轉化為物理地址。但在Linux中是怎樣做的呢?
評論