基于優(yōu)化GDTW-SVM算法的聯(lián)機手寫(xiě)識別
3 優(yōu)化GDTW-SVM算法
盡管GDTW-SVM獲得了較高的識別率,但是其計算復雜度高。DTW算法的計算復雜度是O(NT,NR),而SVM算法在訓練和識別過(guò)程中需要反復使用GDTW核函數,對于嵌入式設備的計算能力要求較高。因此,需要對GDTW核函數進(jìn)行優(yōu)化。
分析圖1中的最優(yōu)對齊路徑,當兩個(gè)樣本完全相同時(shí),最優(yōu)對齊路徑和對角線(xiàn)重合;當兩個(gè)樣本有所差別時(shí),最優(yōu)對齊路徑偏離對角線(xiàn),且差別(DTW距離)越大最優(yōu)路徑越偏離對角線(xiàn)。下面以字母m和n為例,進(jìn)一步分析以上結論。
(1)依次從字母n的所有訓練樣本中選擇一個(gè)樣本,計算其到字母n的所有訓練樣本最優(yōu)對齊路徑,并規整到80’80矩陣;
(2)將所有計算結果疊加后得到n-n最優(yōu)對齊路徑疊加圖;
(3)繪制疊加圖,即圖2的第一幅圖,圖中像素點(diǎn)灰度越高,代表越多最優(yōu)對齊路徑經(jīng)過(guò)此點(diǎn)。同理,繪制n-m最優(yōu)對齊路徑疊加圖和m-m最優(yōu)對齊路徑疊加圖,分別為圖2的第二和第三幅圖所示。本文引用地址:http://dyxdggzs.com/article/193871.htm
從圖2可以看到,兩個(gè)相同或相似字符的最優(yōu)對齊路徑集中在對角區域:由于n的不同樣本、m的不同樣本的起筆寫(xiě)法比收筆寫(xiě)法隨意,第一和第三幅圖的對角區域的左下角比較寬;n和m的最優(yōu)對齊路徑在對角區域中分布較均勻,且第二幅圖顯示對角區域的中部有明顯的低灰度區域。
假設訓練樣本可以代表聯(lián)機手寫(xiě)字符的特征,則可以通過(guò)僅計算對角區域中的最優(yōu)對齊路徑來(lái)優(yōu)化GDTW核函數。計算兩個(gè)樣本T=(t1,…,tNT)和R=(r1,…,rNR)的GDTW核函數時(shí),假定二者屬于相同的字符類(lèi),那么二者的差別不大,因此,在GDTW核函數計算中引入參數k和τ
式(9)中lbottom,ltop,lleft,lright如圖3所示。引入參數k和τ之后,不在NT×NR的矩陣中求解式(8),而是在k和τ約束的區域(即圖3中兩條虛線(xiàn)所夾的對角區域)中求解,計算最優(yōu)對齊路徑。
從直觀(guān)的角度看,參數k和τ減少了最優(yōu)對齊路徑的計算空間,因此,修改后的GDTW核函數的計算時(shí)間減少。而另外一方面,如果參數τ保持不變(如τ=0.6),參數k越小,最優(yōu)對齊路徑的前端的計算被約束在越小的空間,迫使其“最優(yōu)”對齊路徑的計算選擇非最優(yōu)對齊路徑,即參數k是兩個(gè)字符樣本頭部的相識程度的權重;類(lèi)似地,參數τ是兩個(gè)字符樣本尾部的相識程度的權重。參數k和τ的權重作用對于如數字“0”和“6”等相似字符的分類(lèi)有重要意義。
評論