人臉識別技術(shù)的應用背景及研究現狀
(3)神經(jīng)網(wǎng)絡(luò )
從本質(zhì)上講,神經(jīng)網(wǎng)絡(luò )也是一種基于樣本的學(xué)習方法。將神經(jīng)網(wǎng)絡(luò )用于人臉檢測取得了很大的進(jìn)展。MIT的學(xué)者首先對人臉樣本集和非人臉樣本集聚類(lèi),以測試樣本與人臉樣本集和非人臉樣本集的子類(lèi)之間的距離作為分類(lèi)的度量,利用多層感知器(MLP)網(wǎng)絡(luò )作為分類(lèi)器。CMU的研究人員直接以圖像作為神經(jīng)網(wǎng)絡(luò )的輸入,設計了一個(gè)具有獨特結構的適用于人臉特征的神經(jīng)網(wǎng)絡(luò )分類(lèi)器,并通過(guò)前饋神經(jīng)網(wǎng)絡(luò )對檢測結果優(yōu)化。Raphael Feraud等利用多個(gè)神經(jīng)網(wǎng)絡(luò ):多層感知器(MLP)和約束產(chǎn)生式模型(CGM,Constrained Generative Model),實(shí)現了一個(gè)可應用于WEB中人臉圖像檢索的快速而準確的人臉檢測方法。Shang-Hung Lin等訓練了三個(gè)基于概率決策的神經(jīng)網(wǎng)絡(luò )(PDBNN,Probabilistic Decision Based Neural Network),用于人臉檢測,眼睛定位和人臉識別,實(shí)現了一個(gè)完整的人臉識別系統。
(4)基于隱馬爾可夫模型的方法
馬爾可夫模型是一個(gè)離散時(shí)序有限狀態(tài)自動(dòng)機,隱馬爾可夫模型(HMM)是指這一馬爾可夫模型的內部狀態(tài)外界不可見(jiàn),外界只能看到各個(gè)時(shí)刻的輸出值。對于人臉模式來(lái)說(shuō),我們可以把它分成前額,眼睛,鼻子,嘴巴和下巴這樣一個(gè)序列。人臉模式就可以通過(guò)對這些區域的有序的識別來(lái)檢測,這正好是隱馬爾可夫模型容易做到的。Samaria等人提出了使用HMM模型進(jìn)行人臉檢測的算法,他們使用人臉區域的結構信息作為隱馬爾可夫模型的狀態(tài)遷移條件。除此以外,基于A(yíng)daBoost的人臉識別算法,基于彩色信息的方法,基于形狀
分析的方法,以及多模態(tài)信息融合的方法,國外都進(jìn)行了大量的研究與實(shí)驗。
3.人臉識別技術(shù)在國內的研究現狀
國內關(guān)于人臉自動(dòng)識別的研究始于二十世紀80年代,主要的研究單位有清華大學(xué),哈爾濱工業(yè)大學(xué),中科院計算所,中科院自動(dòng)化所,復旦大學(xué),北京科技大學(xué)等,并都取得了一定的成果。國內的研究工作主要是集中在三大類(lèi)方法的研究:基于幾何特征的人臉正面自動(dòng)識別方法、基于代數特征的人臉正面自動(dòng)識別方法和基于連接機制的人臉正面自動(dòng)識別方法。周激流實(shí)現了具有反饋機制的人臉正面識別系統,運用積分投影法提取面部特征的關(guān)鍵點(diǎn)并用于識別,獲得了比較滿(mǎn)意的效果。他同時(shí)也嘗試了“穩定視點(diǎn)”特征提取方法,即為使識別系統中包含3D信息,他對人臉側面剪影識別做了一定的研究,并實(shí)現了正,側面互相參照的識別系統。彭輝、張長(cháng)水等對“特征臉”的方法做了進(jìn)一步的發(fā)展,提出采用類(lèi)間散布矩陣作為產(chǎn)生矩陣,進(jìn)一步降低了產(chǎn)生矩陣的維數,在保持識別率的情況下,大大降低了運算量。程永清,莊永明等對同類(lèi)圖像的平均灰度圖進(jìn)行SVD分解得到特征臉空間,每一幅圖像在特征臉空間上的投影作為其代數特征,然后利用層次判別進(jìn)行分類(lèi)。張輝,周洪祥,何振亞采用對稱(chēng)主元分析神經(jīng)網(wǎng)絡(luò ),用去冗余和權值正交相結合的方法對人臉進(jìn)行特征提取和識別。該方法所用特征數據量小,特征提取運算量也較小,比較好地實(shí)現了大量人臉樣本的存儲和人臉的快速識別。北京科技大學(xué)的王志良教授主要研究人工心理,建立了以數學(xué)公式為基礎的心理學(xué)模型。
4.當前人臉識別技術(shù)所存在的主要問(wèn)題
盡管人臉識別技術(shù)有著(zhù)廣闊的應用前景,但是無(wú)論是在識別率,還是在防偽性上,都與指紋,視網(wǎng)膜等有著(zhù)較大的差距,歸根結底,影響人臉識別效果的原因主要有以下的幾個(gè)方面:
1)人臉圖像的獲取過(guò)程中的不確定性(如光的方向,以及光的強度等)。
2)人臉模式的多樣性(如胡須,眼鏡,發(fā)型等)。
3)人臉塑性變形的不確定性(如表情等)。
4)所涉及的領(lǐng)域知識的綜合性(如心理學(xué),醫學(xué),模式識別,圖像處理,數學(xué)等)。正因為在人臉識別的過(guò)程中存在上述的各種各樣的問(wèn)題,因此在實(shí)際的檢測和識別過(guò)程中,當這些因素疊加到一起的時(shí)候,情況就變得更加復雜?;趲缀翁卣鞯淖R別方法,其存在的主要問(wèn)題在于,沒(méi)有形成一個(gè)統一的,優(yōu)秀的特征提取標準。在描述人臉的時(shí)候,受到表情,光照,姿態(tài)的影響比較大,無(wú)法準確地描述人臉特征。盡管如此,基于幾何特征的方法在處理人臉表情分析時(shí),仍然是一個(gè)最有效的依據。同時(shí),目前已經(jīng)提出了很多改進(jìn)的特征提取的算法,使得人臉幾何特征的提取越來(lái)越趨于合理,這里面最具代表性的方法就是結合3D人臉信息的特征點(diǎn)提取技術(shù)?;诖鷶堤卣鞯淖R別方法是目前在實(shí)際應用中使用得最多的一類(lèi)方法,其主要原因是由于代數特征矢量(即人臉圖像在特征空間的投影結果)對角度,表情等因素都具有一定的穩定性。但對于光照而言,似乎效果并不太明顯。這種代數的特征識別方法,無(wú)法應用于人臉的表情識別。
從某種意義上來(lái)說(shuō),人臉識別的各種方法,實(shí)際上就是在尋找一種人臉的描述方式,但是要找到一種能夠不受各種因素影響的描述方式非常地困難,無(wú)論是最早使用的幾何描述方式以及后來(lái)比較常用的代數描述方式,都不可避免地存在各種干擾。我們只能是在以后的研究中,逐漸去完善人臉的描述方式,使之更加有效,更加準確。
矢量控制相關(guān)文章:矢量控制原理
評論