基于多特征SVMs分類(lèi)器的手語(yǔ)識別*
SVMs的主要思想是建立一個(gè)超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。對于二維線(xiàn)性可分情況,令 H為把兩類(lèi)訓練樣本沒(méi)有錯誤地分開(kāi)的分類(lèi)線(xiàn),H1,H2分別為過(guò)各類(lèi)中離分類(lèi)線(xiàn)最近的樣本且平行于分類(lèi)線(xiàn)的直線(xiàn),它們之間的距離叫做分類(lèi)間隔。所謂最優(yōu)分類(lèi)線(xiàn)就是要求分類(lèi)線(xiàn)不但能將兩類(lèi)正確分開(kāi),而且使分類(lèi)間隔最大。在高維空間,最優(yōu)分類(lèi)線(xiàn)就成為最優(yōu)分類(lèi)面[8,9]。
設線(xiàn)性可分樣本集為(xi,yi)),i=1,2,…,n,x∈Rd,即x是d維特征向量,y∈{+1,-1}是類(lèi)別標號,d維空間線(xiàn)性判斷函數的一般形式為g(x)=w×x+b,分類(lèi)面方程為:w×x+b=0 (1)
式中w為權向量,b為分類(lèi)閾值。要求分類(lèi)面對所有樣本正確分類(lèi),就是要求它滿(mǎn)足:
Yi[w×xi+b]-1≥0,i=1,2,…,n (2)
滿(mǎn)足上述條件且使||w||2最小的分類(lèi)面就叫做最優(yōu)分類(lèi)面, H1,H2上的訓練樣本點(diǎn),也就是使式(2)中等號成立的樣本點(diǎn),稱(chēng)作支持向量。解這個(gè)最優(yōu)化問(wèn)題后得到的最優(yōu)分類(lèi)函數是:
在學(xué)習樣本是線(xiàn)性不可分,但卻是非線(xiàn)性可分的情況下,可以通過(guò)非線(xiàn)性變換把學(xué)習樣本變換到高維空間,使其在高維空間里是線(xiàn)性可分的。用核函數 K(x,y)代替原來(lái)的點(diǎn)積(x·y),Mercer定理指出,核函數 K(x,y)通過(guò)與其相聯(lián)系的非線(xiàn)性變換Φ隱含地把特征向量映射到高維特征空間,使得學(xué)習樣本成為線(xiàn)性可分的。常用的核函數有:
評論