一種文檔圖像檢索算法設計和實(shí)現
3 實(shí)驗結果與分析
應用上述方法進(jìn)行了實(shí)驗,數據為手寫(xiě)體英文,數據采集分辨率為100 dpi,256級灰度圖像,數據量為100幅文檔圖像。對不同的圖像分別比較它們的相似度。圖7(b)、(c)、(d)是與圖7(a)的相似度分別為40.422 9、45.760 7和43.407 8的圖像。圖8(b)、(c)、(d)是與圖8(a)原圖像版面結構相似的幾種圖像類(lèi)型。圖9(b)、(c)、(d)是與圖9(a)原圖像版面結構具有差異的幾種圖像類(lèi)型。
本文使用對100幅文檔圖像兩兩進(jìn)行版面結構的匹配,共有4 950種結果。實(shí)驗結果表明,兩種不同版面的能量差異最大的在340左右,如圖10所示。橫坐標顯示的是100幅圖像兩兩匹配出現的情況的數目,可以取到的最大坐標為4 950,縱坐標為各匹配情況對應的能量差異,最大值350。從圖中可以看出能量差異主要集中在50~200之間。
各個(gè)能量點(diǎn)的頻數的直方圖如圖11所示,圖中橫坐標為能量差異數據,最大為340左右,提取到350??v坐標為取到各個(gè)能量的情況的數目的累加。從圖11可以更直觀(guān)地觀(guān)察到能量差異在50~200之間的數目最多。
實(shí)驗結果表明:(1)文檔圖像的版面結構具有相對的穩定性。(2)點(diǎn)匹配模式計算了最小距離,可有效表示圖像的文本行基本信息。(3)距離匹配較為簡(jiǎn)單,使用了三個(gè)維度的一維距離,有較好的區分性。對距離計算統計表明,具有正態(tài)分布特性。(4)點(diǎn)匹配模式需進(jìn)一步進(jìn)行研究,算法的復雜度需進(jìn)一步降低,以進(jìn)行實(shí)時(shí)圖像處理。
本文針對文檔圖像的檢索方法進(jìn)行了研究,提出一種文檔圖像檢索的新方法。分析了文檔圖像版面特性,使用分割方法確定文本行,將文本行進(jìn)行標記,找出頁(yè)面的中心點(diǎn)坐標,中心點(diǎn)坐標將文本行的長(cháng)度作為權重考慮在內,得到相對坐標。根據相對坐標和文本行長(cháng)度得到一個(gè)差異能量,根據差異能量來(lái)進(jìn)行匹配。并對該方法進(jìn)行了實(shí)驗和結果分析。本方法的優(yōu)點(diǎn)是,當文檔的行出現傾斜和縮放時(shí),不影響匹配的進(jìn)行。但需要進(jìn)一步降低所用的點(diǎn)匹配模式時(shí)間復雜度,以進(jìn)行實(shí)時(shí)圖像處理。
評論