應用兩級分類(lèi)實(shí)現車(chē)牌字符識別
車(chē)牌識別系統LPR(License Plate Recognition)包括車(chē)牌定位、字符分割和字符識別三大部分。其中,字符識別的準確及高效成為整個(gè)車(chē)牌識別系統的關(guān)鍵。
車(chē)牌字符識別是模式識別的一個(gè)重要研究領(lǐng)域,字符特征提取可分為基于統計特征和基于結構特征兩大類(lèi)[1],統計方法具有良好的魯棒性和抗干擾性等,但是,由于其采用累加的方法,對于“敏感部位”的差異也隨之消失,即對形近字的區分能力較差。而結構方法對細節特征較敏感,區分形近字符的能力較強,但是難以抽取、不穩定、算法復雜度高。分類(lèi)器設計方面,人工神經(jīng)網(wǎng)絡(luò )和支持向量機SVM(Support Vector Machine)[2]等技術(shù)已被用于車(chē)牌字符識別研究中,有效地提高了識別率,但缺少基于特征的優(yōu)化設計。
本文針對實(shí)際采集的車(chē)牌圖像質(zhì)量不高所導致的字符形變、噪聲、易混淆的問(wèn)題,根據人類(lèi)視覺(jué)活動(dòng)的問(wèn)題,選取基于輪廓的統計特征反映字符整體信息;選取結構特征反映字符細節信息,采用SVM作為分類(lèi)器,并對基于輪廓的特征提取方法進(jìn)行了優(yōu)化設計。
1 車(chē)牌字符識別算法框架
本文提出的識別算法模擬人類(lèi)智能,采用兩級分類(lèi)識別的思想處理車(chē)牌字符識別問(wèn)題,引入可信度評判機制。經(jīng)預處理后的字符首先進(jìn)入粗分類(lèi)識別,采用基于輪廓的統計特征作為粗分類(lèi)的特征提取方法,利用SVM分類(lèi)器得出分類(lèi)識別結果,并計算結果的可信度。識別系統將粗分類(lèi)識別結果的可信度與預先設置好的用于判別形近字的可信度閾值相比較,如果可信度大于閾值,則識別系統將字符歸為非形近字,并將結果輸出;否則, 識別系統將字符歸為形近字,并根據粗分類(lèi)識別結果,計算字符所屬的形近字類(lèi)別,將字符送入細分類(lèi)識別,提取字符的結構特征作為細分類(lèi)的特征提取方法,利用決策表中的形近字區分規則,得到識別結果。圖1為識別系統算法流程圖。
2 一級分類(lèi)識別
2.1 粗分類(lèi)特征提取
粗分類(lèi)的特征提取方法應該能夠描繪字符的整體信息,基于輪廓的統計特征描繪字符外圍輪廓的變化。利用距離反映輪廓的方法,通過(guò)計算字符圖像左、右、上、下四個(gè)邊框到筆畫(huà)間的距離,得到圖像輪廓的統計特征。設預處理后的二值化字符圖像為f(i,j),具體算法為:
其中,width、length為字符圖像的寬和高。規定此行或此列沒(méi)有筆畫(huà)時(shí),其特征值為零。
圖2為字符‘6’的四組輪廓特征,從圖中可以看出,曲線(xiàn)在高度變化上反映出了字符外圍輪廓特征。根據輪廓特征曲線(xiàn)可以找出同類(lèi)字符間的相關(guān)性、不同類(lèi)字符間的差異性。
然而,這樣直接提取的特征容易受到字符偏移的影響,因此,本文對提取的原始特征進(jìn)行了如下優(yōu)化:
(1)分別循環(huán)平移特征值LP(i)、RP(i)、TP(i)、BP(i),使其前后為零特征值的個(gè)數大致相等,這樣提取的特征值在分類(lèi)器中更具可比性。
(2)由于字符存在水平偏移和垂直偏移,所以需要消除字符偏移對特征值的影響。首先,按照下式計算字符水平偏移量LO:
其中,[·]表示取整數。
消除垂直偏移量對特征值的影響與消除水平偏移量方法類(lèi)似,這里不再重復。
圖3所示為圖2優(yōu)化后的特征曲線(xiàn)。從圖中可以看出,優(yōu)化后的特征曲線(xiàn)左右為零值的特征數量大致相等,第一、二組的最小特征值大致相等,第三、四組最小特征值也大致相等。由此可見(jiàn),依據上述優(yōu)化方法對四組輪廓特征加以修正,可以有效地克服字符位置偏移對特征值的影響,增加同類(lèi)字符間的相關(guān)性。
2.2 一級粗分類(lèi)器設計
本文提取的粗分類(lèi)特征維數比較大,SVM能夠較好地解決小樣本、非線(xiàn)性及高維的模式識別問(wèn)題,而且在高維空間中的推廣能力并不受維數影響,所以本文選取SVM作為分類(lèi)器進(jìn)行車(chē)牌字符的識別。
2.2.1 支持向量機(SVM)算法原理
SVM是建立在統計學(xué)習理論的VC維(Vapnik-Chervonenkis Dimension)理論和結構風(fēng)險最小化原理SRM(Structural Risk Minimization)基礎上的一種新機器學(xué)習系統[3]。SVM方法是從線(xiàn)性可分情況下的最優(yōu)分類(lèi)面提出的。對于線(xiàn)性不可分情況,SVM通過(guò)增加一個(gè)松弛項ξi≥0和對錯分樣本的懲罰因子C進(jìn)行推廣。而對于非線(xiàn)性問(wèn)題,首先通過(guò)非線(xiàn)性變換將輸入空間變換到一個(gè)高維內積空間,然后在這個(gè)新空間中求取最優(yōu)超平面。由于在特征空間H中構造最優(yōu)超平面時(shí),訓練算法只涉及訓練樣本之間的內積運算(xi·xj)。
2.2.2 核函數的選取
根據Hilbert-Schmidt原理,只要一種核函數K(x,y)滿(mǎn)足Mercer條件,它就對應某一變換空間中的內積。K(x,y)只涉及x、y,并沒(méi)有高維運算。由此可見(jiàn),核函數的引入避免了非線(xiàn)性映射計算的復雜性。有研究表明,SVM方法并不十分依賴(lài)核函數的選取,即不同的核函數對分類(lèi)性能影響不大,所以本文選取應用廣泛的徑向基核函數(RBF)作為核函數:
2.3 可信度
可信度是不確定性推理中用于度量證據、規則和結論不確定性的一種方法。由于多種因素的影響,車(chē)牌字符識別過(guò)程中存在一定的不確定性,所以本文引入不確定性推理來(lái)判斷識別結果是否可以被信任。
2.3.1 可信度概念
可信度CF用于度量證據、結論和規則的不確定性程度[6],CF的作用域為[-1,1]。設一個(gè)不確定推理過(guò)程的證據為A,結論為B,推理規則為:IF A THEN B。
(1)證據的不確定性度量:CF(A)表示證據的可信度,CF(A)>0,表示A以CF(A)程度為真;CF(A)<0,表示A以CF(A)程度為假。
(2)規則的不確定性度量:CF(B,A)表示規則的可信度。CF(B,A)>0,表示證據增加了結論為真的程度;反之CF(B,A)<0,表示證據增加了結論為假的程度。
評論