CAN協(xié)議的錯幀漏檢率改進(jìn)

表1 錯誤序列尾部形式和漏錯多項式Ut(x)
2.4 Ut的擴充形成Ec頭部
在Ut中增加高于x5的項成為U,它不會(huì )影響Ec尾部的形式,但是它會(huì )增加錯誤序列的長(cháng)度。由此U生成的Ec與Tx序列也將被漏檢。Tx在數據域內不同位置的集合就構成了所有漏檢實(shí)例。發(fā)生第一次bit錯后并不立即開(kāi)始TxRx位序的錯位,要等到有填充位發(fā)生時(shí)才會(huì )有位序錯。
2.5 構造出錯實(shí)例Tx
以Ut= x4+x3+1為例,對應尾部第1位處出了傳送錯,Ut加上x(chóng)6后有U=x6+x4+x3+1,計算得Ec=U×G=(1110,1111,0101,1010,0000,01),整個(gè)錯誤序列的長(cháng)度為22位。該Ec確定頭部出第1個(gè)傳送錯的位置是6,假定為漏刪填充位錯,則在尾部應取誤刪信息位錯。假定在頭部出現的是Tx送100000,在第6位處Rx收到的是1,出了第1個(gè)bit錯,第7位Rx得到填充位1而未刪去,Tx第7位可由Ec及Rx求得為0,然后逐位反推,得到Tx發(fā)生漏檢錯的實(shí)例,如圖3所示。

圖3 構造的會(huì )出漏檢錯的Tx實(shí)例
這個(gè)例子中Tx序列的長(cháng)度為27 bit。此種長(cháng)度的Tx可以有227種,每一種都可能出錯,但重構出的這一種在特定位發(fā)生2個(gè)bit錯時(shí)會(huì )漏檢。這個(gè)Tx在別的位置發(fā)生bit錯時(shí),將可以檢出錯,因此它是一個(gè)可能被漏檢的可疑實(shí)例。Tx頭部共有4種可能:Tx=10000(0),10000(1),01111(1),01111(0)。(括號中的位在傳送中出了錯)。因此這幾種可疑實(shí)例占可能Tx的2-25??梢蒚x在64 bit的數據域中會(huì )有64-27+1=38種位置。對頭部Tx=100000和100001,其高4位可以與CAN的DLC重合,對Tx=011111和011110,其最高位可和DLC0重合,因此此種Tx實(shí)例在8字節數據域的幀中出現的可能數目是39種。于是這一種漏檢實(shí)例有概率39×2-25=1.16×10-6。當誤碼率為0.02時(shí),64 bit內出2個(gè)bit錯的概率是(1-0.02)62×0.022=1.14×10-4,由這一個(gè)實(shí)例引起的CAN錯幀漏檢率就是1.32×10-10,已經(jīng)大于Bosch的指標??紤]U中可增加的xk中k可由6一直到43,各種xk項有237=1.37×1011種組合,需要對每一種U進(jìn)行計算,雖然它們的漏檢實(shí)例概率不同,其增量還是很大的。還要考慮不同Ut的貢獻,可見(jiàn)CAN錯幀漏檢率是非常大的。
2.6 計算結果
根據上述分析編制了在MATLAB中運行的程序pcan.m,在MATLAB中設置format long e格式,運行pcan(ber)即可得到不同誤碼率ber時(shí)的結果,如表2所列。

表2 典型的CAN漏檢錯幀概率
表中ber=0.02的錯幀漏檢率為1.882×10-8,而參考文獻[2]在同樣誤碼率下給出的漏檢率是:低速系統4.7×10-14和高速系統8.5×10-14??梢?jiàn)差別極大。對500 kbps的系統,假定總線(xiàn)利用率為40%,幀長(cháng)為135 bit,那么按這個(gè)結果,CAN系統將在9.96小時(shí)出1個(gè)漏檢錯幀。
3 改善錯幀漏檢率的方法
在本文的分析中可以見(jiàn)到,由于填充位規則需要收發(fā)同步執行,不同步時(shí)會(huì )極大干擾CRC校驗,例如CRC校驗本來(lái)可以將所有奇數個(gè)錯檢測出的,小于5位的多bit錯是可以檢測出的,但只要有了成對的填充位錯位,增加的奇數個(gè)錯也可以是漏檢的,增加的多bit錯也可以是漏檢的,如圖4所示。

圖4 有多位錯的例子
漏檢錯的根源是CAN的CRC在執行填充位規則前生成,最根本的解決辦法是像參考文獻[3]指出的那樣,要把CRC校驗放在執行填充位規則之后。但是這樣作就會(huì )根本修改CAN協(xié)議,在已經(jīng)大量應用的情況下如何作到的改進(jìn)前后的兼容性是個(gè)艱難的課題。作為局部的改正,參考文獻[3]建議加附加的檢驗。在數據域添加一個(gè)新的不同的CRC檢驗時(shí),根據本文的分析方法,當誤差多項式Ec是這個(gè)新CRC和CAN的CRC的公倍數時(shí),仍然可以構造出漏檢的實(shí)例,并計算出新條件下的漏檢錯幀概率。例如采用8位的DARC8生成多項式x8+x5+x4+x3+1,它不含x+1因子,所以與CAN生成多項式的最小公倍數構成的漏錯多項式Ec將有24階,此時(shí)如2.5節所分析的那樣,總幀數將增大28倍,而漏檢幀數不變,漏檢率就減少28。但是這種方法的缺點(diǎn)是不能實(shí)現自動(dòng)報錯,無(wú)法使節點(diǎn)間取得數據的一致性:有局部錯的節點(diǎn)在添加上述措施后在收完幀后才能發(fā)現錯,已無(wú)法要其他節點(diǎn)也丟棄該幀并要求自動(dòng)重發(fā)。
本文建議采用7b/8b的編碼辦法,犧牲一些帶寬,換取錯幀漏檢的避免。具體做法是在8b代碼中選取不會(huì )發(fā)生填充位條件的部分,供原來(lái)7b編碼使用。
其他的編碼辦法也是可行的,類(lèi)似7b/8b的還有6b/7b、5b/6b、4b/5b,它們的區別是軟件實(shí)現時(shí)的復雜程度以及開(kāi)銷(xiāo)占用數據域的多少,當用7b/8b時(shí)CAN可以每幀送7字節數據,而用4b/5b時(shí)每幀只能送6字節數據。
在附加數據域的軟件補丁后,若發(fā)生在ID域和CRC域的填充位規則只有單邊執行情況時(shí),夾在它們中間的控制域就會(huì )左移或右移,幀長(cháng)就會(huì )變大或變小。幀長(cháng)的單位是1字節,它會(huì )使CRC域移入EOF域,CRC最多連續5位相同,就破壞了EOF的格式,或者EOF域移入CRC域,EOF的連續8位破壞了CRC的填充格式,所以此時(shí)單邊執行填充位規則的錯的后果是能被發(fā)現的。也就是說(shuō)加軟件補丁后不再有錯幀漏檢可能。
如果可疑Tx只發(fā)生在ID域,由于Tx有一個(gè)最短長(cháng)度,相應于Ec,t= x3+x+1,這個(gè)長(cháng)度是3+15+6=24位,所以對CAN2.0B的29位ID可能會(huì )出錯,那么產(chǎn)生的后果就是接收節點(diǎn)收到的ID有錯,這是一種假冒錯(Masquerade)。在參考文獻[6]中提到了CAN防止假冒錯的方法,實(shí)際上將ID分為二部分,一部分是一個(gè)附加的CRC,只要這個(gè)CRC生成多項式與CAN的不同,就不會(huì )產(chǎn)生假冒ID通過(guò)接收濾的可能。
評論