基于多特征SVMs分類(lèi)器的手語(yǔ)識別*
引言
本文引用地址:http://dyxdggzs.com/article/93422.htm手語(yǔ)識別的目的就是通過(guò)計算機提供一種有效的、準確的機制將聾啞人常用的手語(yǔ)手勢識別出來(lái),使得他們與健全人之間的交互變得更方便、快捷。同時(shí),手語(yǔ)識別的應用還可以提供更自然的人機交互方式,方便聾啞人對計算機等常用信息設備的使用。目前手語(yǔ)識別可以分為基于視覺(jué)(圖像)的識別系統和基于數據手套(佩戴式設備)的識別系統?;谝曈X(jué)的手勢識別系統采用常見(jiàn)的視頻采集設備作為手勢感知輸入設備,價(jià)格便宜、便于安裝。鑒于基于視覺(jué)的手勢識別方法交互自然便利,適于普及應用,且更能反映機器模擬人類(lèi)視覺(jué)的功能,所以目前是手勢識別的研究重點(diǎn)。
手語(yǔ)識別的研究開(kāi)始于1982年,Shantz和Poizner實(shí)現了一個(gè)合成美國手語(yǔ)的計算機程序。之后,中國、美國、日本、德國等許多國家都進(jìn)行了自己國家的手語(yǔ)識別與合成研究,并取得了許多重要的研究成果。Triesch和Malsburg開(kāi)發(fā)了一種彈性圖模板匹配技術(shù)對復雜背景下的手形進(jìn)行分類(lèi)[1],在相對復雜的背景下的識別率達到86.2%。Davis和Shah將戴上指間具有高亮標記的視覺(jué)手套的手勢作為系統的輸入,可識別7種手勢[2]。Starner[3]等在對美國手語(yǔ)中帶有詞性的40個(gè)詞匯隨機組成的短句子識別率達到99.2%。Yang等人采用7Hu不變矩特征量進(jìn)行手語(yǔ)字母識別,最好識別率為90%[4]。
本文采用SVMs (Support Vector Machines,支持向量機)作為手語(yǔ)識別的分類(lèi)器,提出了一種基于視覺(jué)的手語(yǔ)字母識別方法。SVMs在解決小樣本、非線(xiàn)性及高維模式識別問(wèn)題中表現出許多特有的優(yōu)勢,并能夠推廣應用到函數擬合等其他機器學(xué)習問(wèn)題中。采用SVMs作為圖像分類(lèi)器首先要解決的問(wèn)題是:如何用典型視覺(jué)特征來(lái)表征圖像的不同視覺(jué)特性[5]。
在圖像特征提取方面,為了能夠同時(shí)表征圖像的全局特性和局部特性,需要同時(shí)提取圖像的全局特征和局部特征,并且這些特征中用以描述圖像整體形狀的特征應當具備平移、旋轉和尺度不變性。SIFT(Scale Invariant Feature Transform)是一種對尺度空間、圖像縮放、旋轉甚至仿射不變的圖像局部特征描述算子[6];而7Hu不變矩特征量具有平移、旋轉和尺度不變性的特點(diǎn),具有很好的穩定性,適合描述目標整體形狀。
手語(yǔ)簡(jiǎn)介
手語(yǔ)是一種聾人使用的語(yǔ)言,是一種靠動(dòng)作/視覺(jué)交際的特殊語(yǔ)言[7]。中國手語(yǔ)包括30個(gè)手指字母,大約5500個(gè)基本手勢詞。手指語(yǔ)是從字母語(yǔ)言發(fā)展起來(lái)的,是漢語(yǔ)手語(yǔ)的一種,用一個(gè)指式代表一個(gè)漢語(yǔ)拼音字母,按照漢語(yǔ)拼音方案拼成普通話(huà)。而手勢語(yǔ)則是由象形語(yǔ)言發(fā)展起來(lái)的。它充分利用人的手勢、表情和身體動(dòng)作形象地表達物體和行動(dòng)的最基本特征。
中國文字改革委員會(huì )、教育部等單位于1963年聯(lián)合公布實(shí)施漢語(yǔ)手指字母方案[7]。方案中包括漢語(yǔ)拼音中26個(gè)單字母(A~ Z)和4個(gè)雙字母(ZH、CH、SH、NG)如圖1所示。
圖1 中國手語(yǔ)字母表
評論