一種基于模糊模板匹配的車(chē)牌漢字識別方法
字符識別屬于模式識別的范疇,通常的字符識別方法可分為2類(lèi):基于字符結構(筆畫(huà)特征)的結構識別和基于字符統計特征的統計識別。結構模式識別方法的優(yōu)點(diǎn)是可以識別復雜的模式,缺點(diǎn)是需要進(jìn)行筆畫(huà)特征的提取,在輸入圖像質(zhì)量不佳的情況下,這一點(diǎn)往往難以做到。在統計模式識別方法中,特征提取方便,識別速度與識別對象無(wú)關(guān),但需要得到字符集的穩定特征,且在字符筆畫(huà)較多時(shí)要求的特征量非常大。二種識別方法各有優(yōu)缺點(diǎn)。
人類(lèi)的視覺(jué)感知系統是一個(gè)魯棒性很強的、能抵御實(shí)際中可能遇到的各種變形和噪聲干擾的文字識別系統。人們的認字過(guò)程實(shí)際上是對漢字整體形象的把握,是對漢字圖像全局的處理過(guò)程[1]。因而,漢字的整體信息在無(wú)筆順識別中起著(zhù)無(wú)法替代的重要作用。
統計模式識別借助概率論的知識,判斷或決策對象的特征類(lèi)別,使得決策的錯誤率達到最小?;诮y計特征的識別方法先抽取識別對象的穩定特征,組成特征矢量,然后在字符集的特征空間中進(jìn)行特征匹配?;谝陨险J識,在分析汽車(chē)牌照中漢字字符的特點(diǎn)后,采用了有別于結構分析的一種基于字符圖像特征統計的模式識別方法進(jìn)行漢字識別。同時(shí)針對統計方法無(wú)法區分的相似漢字,提取其微結構信息進(jìn)行特殊的校正識別。
1 特征統計匹配
統計決策論其要點(diǎn)是提取待識別模式的一組統計特征,然后按照一定準則所確定的決策函數進(jìn)行分類(lèi)判決[2]。漢字的統計模式識別是將字符點(diǎn)陣看作一個(gè)整體,從該整體上經(jīng)過(guò)大量統計得到所用特征,用盡可能少的特征模式來(lái)描述盡可能多的信息。所采用的方法有:特征統計的方法、整體變換分析法[3]、幾何矩特征、筆劃密度特征、字符投影特征、外圍特征、微結構特征和特征點(diǎn)特征等。這些方法都具有各自的優(yōu)缺點(diǎn),應根據具體應用進(jìn)行選取。主要方法有外圍面積特征匹配法和網(wǎng)格特征匹配法。外圍面積特征反映了字符的輪廓信息。外圍面積特征提取法,主要是從周?chē)螤畹男睦韺W(xué)知識來(lái)獲得漢字信息的特征,即對文字周?chē)舷伦笥业男螤钸M(jìn)行量化,從而構造特征向量。網(wǎng)格特征實(shí)際是結構模式識別和統計模式識別相結合的產(chǎn)物。字符圖像被均勻或非均勻地劃分為若干區域,稱(chēng)之為“網(wǎng)格”。在每個(gè)網(wǎng)格內尋找各種特征,如目標面積比例、交叉點(diǎn)、筆劃端點(diǎn)的個(gè)數、細化后的筆劃長(cháng)度和筆劃密度等。特征統計以網(wǎng)格為單位,即使個(gè)別點(diǎn)統計有誤差也不會(huì )造成大的影響,從而增強了特征的抗干擾性。因此這種方法得到日益廣泛的應用。在實(shí)際的車(chē)牌漢字識別中,當相同漢字的二值圖形變動(dòng)較小時(shí)該方法較有效。具體應用:將尺寸為34×66象素的漢字二值圖均勻分成32個(gè)正方形的小區域(不考慮外邊框的1個(gè)象素),統計每個(gè)8×8的小區域內目標象素(白色)所占的面積比例,就得到了歸一化的32維特征矢量。統計多幅相同漢字的32維特征矢量,取均值作為該漢字的標準網(wǎng)格特征模板。識別時(shí),計算待識別漢字的32維網(wǎng)格特征矢量與模板矢量之間的Euclid距離,求得最小距離值,其對應的漢字即為識別結果。在具體應用中,由于外部原因常常會(huì )出現字符模糊、字符傾斜的情況,而網(wǎng)格特征匹配方法對字符模糊和傾斜較敏感,因此魯棒性不是很強,不適合實(shí)際應用。
2 模板匹配
考慮到以上2種主要識別方法存在的弊端,決定選用模板匹配的算法進(jìn)行字符的識別。實(shí)際研究中發(fā)現,二值化的圖形模板雖然直觀(guān),但其匹配計算過(guò)程過(guò)于簡(jiǎn)單直接,對傾斜、形變、殘損、模糊的待識別字符匹配誤差較大,因此魯棒性較差。而灰度模板由于色彩、光照等因素影響,難以找到普遍適用的模板形式實(shí)現直接的匹配計算。綜合以上二方面的問(wèn)題,在引入統計模式識別思想的基礎上,提出了基于二值圖形變動(dòng)分析的模糊模板匹配方案。
2.1 基于二值圖形變動(dòng)分析的模糊模板匹配
在含有汽車(chē)牌照的圖像中,將漢字定位并提取出來(lái)以后,還要完成規格化、二值化等操作。即使是相同的漢字,由于車(chē)牌傾斜、模糊,特別是由于每次定位不可能完全精確一致等諸多因素的影響,導致在二值圖中字體的形狀、大小都會(huì )不同,字體位置也會(huì )發(fā)生不同程度的偏移。將這種二值圖形的不規則現象稱(chēng)為圖形的變動(dòng)。在漢字識別的分析過(guò)程中,希望對圖形變動(dòng)的大小進(jìn)行量化處理。因此,提出了求圖形整體變動(dòng)量的統計方法,其優(yōu)點(diǎn)是不需要參照標準圖形,可以進(jìn)行客觀(guān)評價(jià),并構造出用于匹配識別的模糊模板。
對每一個(gè)車(chē)牌的漢字字符,選取n幅質(zhì)量較好的參考圖。將這n幅參考圖規格化為17×33的標準大小后進(jìn)行二值化處理,得到標準參考圖fi(x,y)。因此每個(gè)車(chē)牌漢字字符都有n幅由0、1所組成的二值圖像。將這n幅二值圖像對齊后疊加,再進(jìn)行歸一化。得到的模糊圖形F(x,y)。四個(gè)漢字的模糊圖形模板(不同方向的視覺(jué)效果)如圖1所示。
該模糊圖形上每一象素點(diǎn)實(shí)際上都對應著(zhù)一個(gè)概率值,該概率值代表白色目標(漢字筆劃)在該點(diǎn)出現的可能性。例如在模糊模板中若某一點(diǎn)值為1,表明在所有參加統計的二值圖形上漢字筆劃都經(jīng)過(guò)該點(diǎn),其為白色目標象素的可能性是100%,為黑色背景象素的可能性是0;反之亦然。進(jìn)行匹配識別時(shí),對一幅切分后的待識別漢字灰度圖,將其規格化、二值化,然后計算每一象素點(diǎn)與模板的吻合程度,即每一象素點(diǎn)正確匹配的置信度con(x,y)。引入置信度的公式:
f(x,y)為得到的二值化后的待識別圖像,把所有點(diǎn)的置信度平均后得到總的置信度con作為判別依據。最大置信度con所對應的模板漢字作為匹配識別輸出的結果。
公式中的width和height分別是歸一化后標準圖像的長(cháng)和寬。通過(guò)對實(shí)驗結果的分析發(fā)現,識別錯誤的圖像,往往嚴重變形、模糊,二值化效果差。
2.2 基于二值圖形變動(dòng)分析的模糊模板匹配的改進(jìn)算法
針對以上問(wèn)題,提出了一種簡(jiǎn)單的改進(jìn)算法。將切分后不同大小的灰度字符圖像規格化為17×33的標準尺寸以后,將各象素點(diǎn)的灰度值線(xiàn)性變換到[0,1]區間,再與模糊圖形模板匹配,計算Euclid距離,其最小距離值對應的模板漢字作為匹配識別輸出的結果。該方法的優(yōu)點(diǎn)是不用對灰度圖像作二值化處理,避免了由于二值化操作帶來(lái)的圖像信息損失。特別是對一些模糊圖像,若直接采用二值化效果較差,影響匹配準確度。因此使用該方法在一定程度上提高了識別正確率。
實(shí)驗中發(fā)現,對少數明暗程度變化大或對比度不強的模糊圖像,該方法也產(chǎn)生了少量識別錯誤。這是由于將待識別圖像的各點(diǎn)灰度值線(xiàn)性拉伸到[0,1]區間后,原始圖像明暗程度不同導致其平均值與對應模板的平均值并不一致,直接用Euclid距離進(jìn)行匹配,帶來(lái)了計算誤差。因此引入了歸一化相關(guān)性度量公式:
其中I(i,j)和Tn(i,j)分別是輸入的待識別的字符圖像和第n個(gè)模板,分別是輸入字符圖像所有灰度的均值和第n個(gè)模板的均值,w和h分別為圖像的長(cháng)和寬,S(I,Tn)是匹配函數,其值在0~1之間,代表待識別圖像與模板圖像的匹配程度。使用該公式計算相關(guān)性,可以避免由于明暗和對比度變化導致圖像和模板的“能量”不一致而帶來(lái)的匹配誤差,進(jìn)一步提高了匹配準確度。
3 試驗結果的進(jìn)一步校正
模板匹配表現的主要是漢字的整體特征,但是有些漢字存在著(zhù)一定程度上整體的相似性,因此必須對相似的字符進(jìn)行進(jìn)一步的校正才能提高識別的正確率。對相似漢字的區分,往往是尋找其特有的筆劃結構,這也是在統計模式識別中引入結構方法的必要之處。例如在車(chē)牌漢字識別中,“粵”字與其他省份漢字的最大區別是底部的鉤狀結構。為此對預處理后的17×33二值圖像的底部1/4部分作水平和垂直方向的投影,水平投影17個(gè)特征值(由左、右二邊分別投影得到),垂直投影33個(gè)特征值(由上、下二邊分別投影得到),形成50維的微結構投影特征矢量。“粵”字微結構特征及其統計41幅圖像后的微結構投影特征直方圖如圖2所示。經(jīng)統計平均后作為區分相似漢字的依據。實(shí)際校正時(shí),計算微結構特征的匹配距離。若小于預先設定的閾值,則直接返回該漢字作為識別結果。
4 實(shí)驗流程及結果
對識別300幅切分后的質(zhì)量較好的漢字灰度圖進(jìn)行識別,實(shí)驗流程如圖3所示。實(shí)驗結果表明,外圍面積特征匹配法正確率達88%,網(wǎng)格特征匹配法86%,簡(jiǎn)單模板匹配法91%,改進(jìn)算法的正確率達到了93%。如果對識別結果進(jìn)一步校正,正確率將提高到95%。若再進(jìn)一步增加訓練集,完善模板,相信正確率還可以繼續提高。
評論