一種文檔圖像檢索算法設計和實(shí)現
1.3 行線(xiàn)標記
通過(guò)對得到的二值圖像的行跳變的填補,文本行的變化相對比較平滑,這有利于行線(xiàn)的標記。本方法取每個(gè)文本行的下邊緣來(lái)作為行線(xiàn)。因為背景區域為黑色,文字區域為白色,所以對文檔圖像進(jìn)行掃描,從黑色區域進(jìn)入白色區域時(shí)所遇到的第一個(gè)像素進(jìn)行標記,這樣就把每一行的行線(xiàn)標記出來(lái)了,所得到的行線(xiàn)是單像素的。這種方法的優(yōu)點(diǎn)是可以抗傾斜。
圖5(a)為對圖1中的圖像中的行用直線(xiàn)的方式標記出來(lái)。為了驗證提取出的行線(xiàn)與原圖是否一致,將它與原圖(如圖5(b)所示)進(jìn)行了匹配,可以看出,所得結果是比較滿(mǎn)意的。
2 匹配算法
本文所采用的方法是將行線(xiàn)抽象為空間中的一個(gè)點(diǎn),點(diǎn)的灰度值定義為行線(xiàn)的長(cháng)度。全局匹配模式考慮版面的加權平均,用于全局位置進(jìn)行匹配,這個(gè)過(guò)程相當于文本區定位過(guò)程。局部匹配模式是定義兩個(gè)行在位置、尺寸上的變化情況,通過(guò)位置優(yōu)先(版面)得到匹配模式,進(jìn)而對匹配誤差能量進(jìn)行計算。
匹配方法轉化為兩組點(diǎn)之間的匹配定義問(wèn)題,點(diǎn)模式簡(jiǎn)化了問(wèn)題的復雜性,只包含了版面結構信息、長(cháng)度信息和尺寸信息。
中心點(diǎn)加權匹配方式不能完全解決問(wèn)題,圖像在兩個(gè)尺度上的縮放對這種方式影響極大。使用歸一化的尺寸可部分解決這個(gè)問(wèn)題,但歸一化后仍需計算中心點(diǎn)的位置,通過(guò)中心點(diǎn)進(jìn)行坐標轉換,使用坐標轉換后的新的點(diǎn)模式對差異性進(jìn)行度量。
每一行起始坐標的相對坐標是(xi′,yi′),xi′=xi-x0,yi′=yi-y0。圖6為將行線(xiàn)抽象為空間中的點(diǎn)的圖像,其中亮度代表該行的長(cháng)度,位置為起點(diǎn)坐標。
?。?)距離匹配模式計算
將兩個(gè)頁(yè)面的中心點(diǎn)對齊,從第一個(gè)頁(yè)面的第一行開(kāi)始,與另一個(gè)頁(yè)面每行進(jìn)行比較。假如另一個(gè)頁(yè)面的相對坐標是(uj′,vj′),j=0,…,n-1,每行長(cháng)度為wj。計算兩個(gè)待比較頁(yè)面的坐標及長(cháng)度的差Δxi、Δyi、Δzi,其中:Δxi=xi′-uj′,Δyi=yi′-vj′,Δzi=zi-wj。則定義差異能量為:
dEnerge(i)=Δxi+Δyi+Δzi
將第一個(gè)頁(yè)面的第一行與第二個(gè)頁(yè)面的每一行進(jìn)行比較,得到n個(gè)差異能量,求這n個(gè)差異能量的最小值min(dEnerge(i))。第一個(gè)頁(yè)面共有m行,將得到m個(gè)值,對其求和:
不匹配的情況經(jīng)常發(fā)生,例如一個(gè)圖像中含有4個(gè)點(diǎn)模式,另一個(gè)圖像中含有10個(gè)點(diǎn)模式,內部點(diǎn)模式之間具有結構相關(guān)性,結構上的相關(guān)性定義為點(diǎn)模式位置掩模距離,該距離用來(lái)度量點(diǎn)模式全局匹配能力。如果一個(gè)點(diǎn)模式為另一個(gè)點(diǎn)模式的子模式,則該方法實(shí)現子圖檢索功能,模式距離最小時(shí),產(chǎn)生最佳匹配。最佳匹配時(shí),產(chǎn)生更為細致的行線(xiàn)檢索能力。使用掩模方法是為了產(chǎn)生更好的查準率。
絕對值編碼器相關(guān)文章:絕對值編碼器原理 三維掃描儀相關(guān)文章:三維掃描儀原理
評論