Linux網(wǎng)卡驅動(dòng)程序編寫(xiě)
方法都很短小以盡量減少系統負荷。(translatedfromarticlewrittenbyAlanCox)
常用的方法包括:
.alloc_skb()申請一個(gè)sk_buff并對它初始化。返回就是申請到的sk_buff。
.dev_alloc_skb()類(lèi)似alloc_skb,在申請好緩沖區后,保留16字節的幀頭空間。主要用在Ethernet驅動(dòng)程序。
.kfree_skb()釋放一個(gè)sk_buff。
.skb_clone()復制一個(gè)sk_buff,但不復制數據部分。
.skb_copy()完全復制一個(gè)sk_buff。
.skb_dequeue()從一個(gè)sk_buff鏈表里取出第一個(gè)元素。返回取出的sk_buff,如果鏈表空則返回NULL。這是常用的一個(gè)操作。
.skb_queue_head()在一個(gè)sk_buff鏈表頭放入一個(gè)元素。
.skb_queue_tail()在一個(gè)sk_buff鏈表尾放入一個(gè)元素。這也是常用的一個(gè)操作。網(wǎng)絡(luò )數據的處理主要是對一個(gè)先進(jìn)先出隊列的管理,skb_queue_tail()
和skb_dequeue()完成這個(gè)工作。
.skb_insert()在鏈表的某個(gè)元素前插入一個(gè)元素。
.skb_append()在鏈表的某個(gè)元素后插入一個(gè)元素。一些協(xié)議(如TCP)對沒(méi)按順序到達的數據進(jìn)行重組時(shí)用到skb_insert()和skb_append()。
.skb_reserve()在一個(gè)申請好的sk_buff的緩沖區里保留一塊空間。這個(gè)空間一般是用做下一層協(xié)議的頭空間的。
.skb_put()在一個(gè)申請好的sk_buff的緩沖區里為數據保留一塊空間。在
alloc_skb以后,申請到的sk_buff的緩沖區都是處于空(free)狀態(tài),有一個(gè)tail指針指向free空間,實(shí)際上開(kāi)始時(shí)tail就指向緩沖區頭。skb_reserve()
在free空間里申請協(xié)議頭空間,skb_put()申請數據空間。見(jiàn)下面的圖。
.skb_push()把sk_buff緩沖區里數據空間往前移。即把Headroom中的空間移一部分到Dataarea。
.skb_pull()把sk_buff緩沖區里Dataarea中的空間移一部分到Headroom中。
--------------------------------------------------
|Tailroom(free)|
--------------------------------------------------
Afteralloc_skb()
--------------------------------------------------
|Headroom|Tailroom(free)|
--------------------------------------------------
Afterskb_reserve()
--------------------------------------------------
|Headroom|Dataarea|Tailroom(free)|
--------------------------------------------------
Afterskb_put()
--------------------------------------------------
|Head|skb_|Data|Tailroom(free)|
|room|push|||
||Dataarea||
--------------------------------------------------
Afterskb_push()
--------------------------------------------------
|Head|skb_|Dataarea|Tailroom(free)|
||pull|||
|Headroom|||
--------------------------------------------------
Afterskb_pull()
三.編寫(xiě)Linux網(wǎng)絡(luò )驅動(dòng)程序中需要注意的問(wèn)題
3.1中斷共享
Linux系統運行幾個(gè)設備共享同一個(gè)中斷。需要共享的話(huà),在申請的時(shí)候指明共享方式。系統提供的request_irq()調用的定義:
intrequest_irq(unsignedintirq,
void(*handler)(intirq,void*dev_id,structpt_regs*regs),
unsignedlongirqflags,
constchar*devname,
void*dev_id);
如果共享中斷,irqflags設置SA_SHIRQ屬性,這樣就允許別的設備申請同一個(gè)中斷。需要注意所有用到這個(gè)中斷的設備在調用request_irq()都必須設置這個(gè)屬性。系統在回調每個(gè)中斷處理程序時(shí),可以用dev_id這個(gè)參數找到相應的設備。一般dev_id就設為device結構本身。系統處理共享中斷是用各自的dev_id參數依次調用每一個(gè)中斷處理程序。
3.2硬件發(fā)送忙時(shí)的處理
主CPU的處理能力一般比網(wǎng)絡(luò )發(fā)送要快,所以經(jīng)常會(huì )遇到系統有數據要發(fā),但上一包數據網(wǎng)絡(luò )設備還沒(méi)發(fā)送完。因為在Linux里網(wǎng)絡(luò )設備驅動(dòng)程序一般不做數據緩存,不能發(fā)送的數據都是通知系統發(fā)送不成功,所以必須要有一個(gè)機制在硬件不忙時(shí)及時(shí)通知系統接著(zhù)發(fā)送下面的數據。
一般對發(fā)送忙的處理在前面設備的發(fā)送方法(hard_start_xmit)里已經(jīng)描述過(guò),即如果發(fā)送忙,置tbusy為1。處理完發(fā)送數據后,在發(fā)送結束中斷里清tbusy,同時(shí)用mark_bh()調用通知系統繼續發(fā)送。
但在具體實(shí)現我的驅動(dòng)程序時(shí)發(fā)現,這樣的處理系統好象并不能及時(shí)地知道硬件已經(jīng)空閑了,即在mark_bh()以后,系統要等一段時(shí)間才會(huì )接著(zhù)發(fā)送。造成發(fā)送效率很低。2M線(xiàn)路只有10%不到的使用率。內核版本為2.0.35。
我最后的實(shí)現是不把tbusy置1,讓系統始終認為硬件空閑,但是報告發(fā)送不成功。系統會(huì )一直嘗試重發(fā)。這樣處理就運行正常了。但是遍循內核源碼中的網(wǎng)絡(luò )驅動(dòng)程序,似乎沒(méi)有這樣處理的。不知道癥結在哪里。
3.3流量控制(flowcontrol)
網(wǎng)絡(luò )數據的發(fā)送和接收都需要流量控制。這些控制是在系統里實(shí)現的,不需要驅動(dòng)程序做工作。每個(gè)設備數據結構里都有一個(gè)參數dev->tx_queue_len,這個(gè)參數標明發(fā)送時(shí)最多緩存的數據包。在Linux系統里以太網(wǎng)設備(10/100Mbps)tx_queue_len一般設置為100,串行線(xiàn)路(異步串口)為10。實(shí)際上如果看源碼可以知道,設置了dev->tx_queue_len并不是為緩存這些數據申請了空間。這個(gè)參數只是在收到協(xié)議層的數據包時(shí)判斷發(fā)送隊列里的數據是不是到了tx_queue_len的限度,以決定這一包數據加不加進(jìn)發(fā)送隊列。發(fā)送時(shí)另一個(gè)方面的流控是更高層協(xié)議的發(fā)送窗口(TCP協(xié)議里就有發(fā)送窗口)。達到了窗口大小,高層協(xié)議就不會(huì )再發(fā)送數據。
接收流控也分兩個(gè)層次。netif_rx()緩存的數據包有限制。另外高層協(xié)議也會(huì )有一個(gè)最大的等待處理的數據量。
發(fā)送和接收流控處理在net/core/dev.c的do_dev_queue_xmit()和netif_rx()中。
3.4調試
很多Linux的驅動(dòng)程序都是編譯進(jìn)內核的,形成一個(gè)大的內核文件。但對調試來(lái)說(shuō),這是相當麻煩的。調試驅動(dòng)程序可以用module方式加載。支持模塊方式的驅動(dòng)程序必須提供兩個(gè)函數:intinit_module(void)和voidcleanup_module(void)。init_module()在加載此模塊時(shí)調用,在這個(gè)函數里可以register_netdev()注冊設備。init_module()返回0表示成功,返回負表示失敗。cleanup_module()在驅動(dòng)程序被卸載時(shí)調用,清除占用的資源,調用unregister_netdev()。
linux操作系統文章專(zhuān)題:linux操作系統詳解(linux不再難懂)
評論