條形碼識別算法研究與設計
本設計的目的是在A(yíng)OI(Automatic Optical Inspection,自動(dòng)光學(xué)檢測)設備提供的PCB板圖片中對PCB板的條形碼信息進(jìn)行識別,應用于電子通訊產(chǎn)品的生產(chǎn)線(xiàn)上,進(jìn)行PCB板的錯誤檢測。AOI通過(guò)攝像頭自動(dòng)掃描PCB、采集圖像、測試的焊點(diǎn)與數據庫中的合格參數進(jìn)行比較,經(jīng)過(guò)圖像處理,檢查出PCB上的缺陷,并通過(guò)顯示器把缺陷顯示、標識出來(lái),供維修人員修正。PCB上所貼的條形碼記錄了該PCB的身份信息,通過(guò)識別該條形碼字符來(lái)認證PCB板。
本文主要解決的問(wèn)題是條形碼的編碼規則如何轉換為實(shí)際獲得的像素點(diǎn)的參照標準,如何分割條形碼以及如何以后臺數據庫為基準識別條形碼。
1 條形碼識別的算法研究及其實(shí)現
1.1 條碼識別算法步驟
條形碼識別算法的過(guò)程主要分為以下這三個(gè)步驟:
(1) 對于一個(gè)條形碼圖像,要識別的是從靜區開(kāi)始的有效區域,算法中考慮了判別是否到達靜區,以此作為條碼識別工作的開(kāi)始標志;
(2) 算法中總體上采用把整個(gè)條形碼按照39碼型的編碼規則進(jìn)行分割,再依次找尋每個(gè)條形碼字符的邏輯值在數據庫中的匹配字符來(lái)輸出。
1.2 算法分析
在條形碼識別的算法分析過(guò)程中必須要解決三個(gè)比較關(guān)鍵的問(wèn)題:1)條碼的長(cháng)寬在圖像文件中用什么來(lái)衡量;2)條碼的碼字是不是要在識別之前分割出來(lái),如果要分割出來(lái),那么如何分割;3)分割后要怎么把對應的碼字進(jìn)行處理。
在設計之前理解了這三個(gè)問(wèn)題,整個(gè)設計就會(huì )獲得良好的解決。首先明確,所要處理的碼型是39碼。39碼的一個(gè)重要的特點(diǎn)就是,具有不可伸縮性,也就是說(shuō),一個(gè)條碼字符就是由占一定長(cháng)度的,9個(gè)元素組成的,其中3個(gè)寬元素6個(gè)窄元素。39碼符號均以*號開(kāi)始和結尾,即木號是39碼的起始,終止字符,并且39碼是離散碼,符號中兩個(gè)相鄰字符之間用一個(gè)位空分開(kāi)。假設把條形碼抽取9個(gè)元素,然后跳過(guò)1個(gè)往下抽取9個(gè),依次類(lèi)推,把抽取獲得的每9個(gè)元素組成條形碼的每個(gè)字符,只要檢測到前9條元素(由條和空組成,為了更好說(shuō)明,文中把條說(shuō)成黑條,而把空說(shuō)成白條)是*就開(kāi)始進(jìn)行條碼字符的識別,如果不是則放棄。
對于掃描得到的條碼BMP文件其白條和黑條的寬度及幾何長(cháng)度已經(jīng)失去意義,必須用另一種方法來(lái)表示。此時(shí)可以給出問(wèn)題1)的答案:長(cháng)寬用像素的個(gè)數來(lái)表示。對一個(gè)BMP文件,其像素的數據包含對應的RGB值,用以表征它的顏色。因此可以通過(guò)該像素的RGB值來(lái)辨認出是白色還是黑色。在理想的狀況下,白顏色的RGB值為(255,255,255)而黑顏色的RGB值為(0,0,0),但是實(shí)際條件下,一個(gè)條碼圖像不會(huì )達到那樣標準的RGB值,也就是有模糊的狀況,規定這樣一個(gè)判決準則:把RGB值大于(125,125,125)的像素認為是白色像素,而把RGB值小于(12 5,125,125)的像素認為是黑色的像素。在程序中采用列表PixelList=[]來(lái)存儲這些像素。然后基于以上的判決原則,程序實(shí)現“掃描”X軸,獲得每個(gè)像素,如果該當前的像素值符合是黑色的條件,就記錄到BlackCount,這時(shí)如果下一個(gè)的像素值還是黑色的就累加,如果下一個(gè)像素值符合是白色的條件,則把存儲黑色像素個(gè)數的變量BlackCount清空,以方便來(lái)記錄下一個(gè)黑條的像素個(gè)數。同樣地,對于白色像素也有類(lèi)似的操作。至此得到了一個(gè)列表GeneralList=[],里面存放著(zhù)掃描X軸每個(gè)被認為是黑條或是白條其對應的像素個(gè)數。
通過(guò)上面一步,把實(shí)際的條形碼轉換為用計算機所能運算和操作的方式,這里必須解決第(2)個(gè)問(wèn)題,即在開(kāi)始條碼識別的時(shí)候,要不要進(jìn)行碼字分割。顯然,這一點(diǎn)對簡(jiǎn)化整個(gè)識別工作是個(gè)很大的幫助,如果能夠正確地把條碼的各個(gè)碼字分離出來(lái),那么剩下的工作就僅僅是把獨立的碼字的邏輯值和數據庫相匹配,找尋到數據庫中匹配的字符,再把它輸出來(lái),實(shí)現這一點(diǎn)是容易的。因此,條碼分割是整個(gè)識別工作的難點(diǎn)和核心,整個(gè)算法重心也在此。
首先定義一個(gè)大列表CharList=[],由于列表中的元素可以為小列表,所以創(chuàng )建這個(gè)列表來(lái)放碼字,每個(gè)碼字為每個(gè)小列表,小列表里的元素是對應的黑條和白條的像素個(gè)數。如何實(shí)現碼字分割,首先考慮到39碼的特點(diǎn):一個(gè)碼字為9個(gè)元素,每個(gè)碼字中間用一個(gè)白條隔開(kāi)。所以只要在GeneralList=[]進(jìn)行操作,把需要的那個(gè)元素抽取存放到新的列表中即可。
其次是判斷是寬條還是窄條。先計算出黑條的平均像素個(gè)數,之所以考慮采用計算平均像素個(gè)數的方法,是為了解決條形碼出現小角度傾斜依然能夠成功識別這樣的況。寬條或窄條的判斷原則是:對黑條而言,如果其像素個(gè)數大于這個(gè)平均值就是寬條,如果小于這個(gè)平均值就是窄條。如果是寬條就賦邏輯值1,如果是窄條就賦邏輯值0。把這些邏輯值都放到列表中,這個(gè)時(shí)候的列表,也是列表的列表,大列表的元素是單個(gè)條碼字符的黑條的邏輯值列表,小列表里的元素是01010這樣的邏輯值,用來(lái)表示寬窄。同樣地,對于白條而言,也有類(lèi)似操作。至此,獲得了兩個(gè)大列表。一個(gè)是放黑條邏輯值的列表:BLogicList;一個(gè)是放白條邏輯值的列表WLogicList。大列表中的元素是每個(gè)碼字的邏輯值列表,這樣實(shí)現了碼字的分割工作。
對于第3)個(gè)問(wèn)題:分割之后要對碼字如何處理。首先,可以建立一個(gè)數據庫,將條碼規則的信息放入數據庫中。然后,只要在條形碼識別軟件中把數據庫和相應的程序相連接,查找匹配值即可。在A(yíng)ccess 2000數據庫中,黑條邏輯值和白條邏輯值都是以文本的數據類(lèi)型來(lái)存放,但是在列表中各個(gè)0101都是整型。因此把列表里面元素進(jìn)行數據類(lèi)型轉換,列表里的數字轉換為字符,成為一個(gè)字符串作為列表的元素存儲。
評論