人臉識別核心算法及技術(shù)解析
1、在檢測到人臉并定位面部關(guān)鍵特征點(diǎn)之后,主要的人臉區域就可以被裁剪出來(lái),經(jīng)過(guò)預處理之后,饋入后端的識別算法。識別算法要完成人臉特征的提取,并與庫存的已知人臉進(jìn)行比對,完成最終的分類(lèi)。我們在這方面的主要工作包括:
本文引用地址:http://dyxdggzs.com/article/201710/368495.htm· 基于LGBP的人臉識別方法
問(wèn)題:
統計學(xué)習目前已經(jīng)成為人臉識別領(lǐng)域的主流方法,但實(shí)踐表明,基于統計學(xué)習的方法往往會(huì )存在“推廣能力弱”的問(wèn)題,尤其在待識別圖像“屬性”未知的情況下,更難以確定采用什么樣的訓練圖像來(lái)訓練人臉模型。鑒于此,在對統計學(xué)習方法進(jìn)行研究的同時(shí),我們還考慮了非統計模式識別的一類(lèi)方法。
思路:
對于給定的人臉圖像,LGBP方法首先將其與多個(gè)不同尺度和方向的Gabor濾波器卷積(卷積結果稱(chēng)為Gabor特征圖譜)獲得多分辨率的變換圖像。然后將每個(gè)Gabor特征圖譜劃分成若干互不相交的局部空間區域,對每個(gè)區域提取局部鄰域像素的亮度變化模式,并在每個(gè)局部空間區域內提取這些變化模式的空間區域直方圖,所有Gabor特征圖譜的、所有區域的直方圖串接為一高維特征直方圖來(lái)編碼人臉圖像。并通過(guò)直方圖之間的相似度匹配技術(shù)(如直方圖交運算)來(lái)實(shí)現最終的人臉識別。在FERET四個(gè)人臉圖像測試集合上與FERET97的結果對比情況見(jiàn)下表。由此可見(jiàn),該方法具有良好的識別性能。而且LGBP方法具有計算速度快、無(wú)需大樣本學(xué)習、推廣能力強的優(yōu)點(diǎn)。
表.LGBP方法與FERET97最佳結果的對比情況
· 基于A(yíng)daBoost的Gabor特征選擇及判別分析方法
問(wèn)題:
人臉描述是人臉識別的核心問(wèn)題之一,人臉識別的研究實(shí)踐表明:在人臉三維形狀信息難以準確獲取的條件下,從圖像數據中提取多方向、多尺度的Gabor特征是一種合適的選擇。使用Gabor特征進(jìn)行人臉識別的典型方法包括彈性圖匹配方法(EGM)和Gabor特征判別分類(lèi)法(GFC)。EGM在實(shí)用中需要解決關(guān)鍵特征點(diǎn)的定位問(wèn)題,而且其速度也很難提高;而GFC則直接對下采樣的Gabor特征用PCA降維并進(jìn)行判別分析,盡管這避免了精確定位關(guān)鍵特征點(diǎn)的難題,但下采樣的特征維數仍然偏高,而且簡(jiǎn)單的下采樣策略很可能遺漏了非常多的有用特征。
摘要:
針對上述問(wèn)題,我們考慮如何對Gabor特征進(jìn)行有效降維,將目前受到極大關(guān)注的AdaBoost算法創(chuàng )新性的應用于Gabor特征的選擇上來(lái),用于提取對識別最有利的特征(我們稱(chēng)這些選擇出來(lái)的Gabor特征為AdaGabor特征),并最終通過(guò)對AdaGabor特征的判別分析實(shí)現識別(稱(chēng)該方法為AGFC識別方法)。在CAS-PEAL和FERET人臉圖像庫上的對比實(shí)驗表明:AGFC方法不但可以大大降低Gabor特征的維數從而可以更加有效地避免“維數災難問(wèn)題”,降低了計算復雜度,同時(shí)識別精度也有了較大的提高。將AGFC與EGM,GFC進(jìn)一步比較可以看出:無(wú)論是EGM還是GFC,均是主觀(guān)的選擇若干面部關(guān)鍵特征點(diǎn)提取人臉的特征表示,而我們提出的AGFC方法則是通過(guò)機器學(xué)習的方法自動(dòng)的選擇那些對區分不同人臉具有關(guān)鍵作用的Gabor特征。參見(jiàn)下圖所示三者之間的區別與聯(lián)系。
三種不同的人臉建模方法比較示意圖
· 基于SV的Kernel判別分析方法sv-KFD
摘要:
支持向量機(SVM)和Kernel Fisher分析是利用kernel方法解決線(xiàn)性不可分問(wèn)題的兩種不同途徑,我們將二者進(jìn)行了有機結合。我們首先證明了SVM最優(yōu)分類(lèi)面的法向量在基于支持向量的類(lèi)內散度矩陣的前提下具有零空間性質(zhì),基于此定義了核化的決策邊界特征矩陣(Kernelized Decision Boundary Feature Matrix,簡(jiǎn)寫(xiě)為KDBFM),最后利用基于零空間的Kernel Fisher方法計算投影空間。我們還進(jìn)一步提出了融合類(lèi)均值向量差及KDBFM來(lái)構建擴展的決策邊界特征矩陣(EKDBFM)的方法,并把這兩種方法成功地應用到了人臉識別領(lǐng)域,在FERET和CAS-PEAL數據庫的實(shí)驗結果表明該方法比傳統人臉識別算法具有更好的識別性能。
· 基于特定人臉子空間的人臉識別方法
問(wèn)題:
Eigenface是人臉識別領(lǐng)域最著(zhù)名的算法之一,本質(zhì)上是通過(guò)PCA來(lái)求取人臉圖像分布的線(xiàn)性子空間,該空間從最佳重構的角度反映了所有人臉圖像分布的共性特征,但對識別而言,這樣的特征卻未必有利于識別,識別任務(wù)需要的是最大可能區分不同人臉的特征。
摘要:
“特征臉”方法中所有人共有一個(gè)人臉子空間,而我們的方法則為每一個(gè)體人臉建立一個(gè)該個(gè)體對象所私有的人臉子空間,從而不但能夠更好的描述不同個(gè)體人臉之間的差異性,而且最大可能地擯棄了對識別不利的類(lèi)內差異性和噪聲,因而比傳統的“特征臉算法”具有更好的判別能力。另外,針對每個(gè)待識別個(gè)體只有單一訓練樣本的人臉識別問(wèn)題,我們提出了一種基于單一樣本生成多個(gè)訓練樣本的技術(shù),從而使得需要多個(gè)訓練樣本的個(gè)體人臉子空間方法可以適用于單訓練樣本人臉識別問(wèn)題。在Yale Face DatabaseB人臉庫對比實(shí)驗也表明我們提出的方法比傳統的特征臉?lè )椒?、模板匹配方法對表情、光照、和一定范圍內的姿態(tài)變化具有更優(yōu)的識別性能。
2、人體面貌識別技術(shù)包含三個(gè)部分:
?。?) 人體面貌檢測
面貌檢測是指在動(dòng)態(tài)的場(chǎng)景與復雜的背景中判斷是否存在面像,并分離出這種面像。一般有下列幾種方法:
?、賲⒖寄0宸?/p>
首先設計一個(gè)或數個(gè)標準人臉的模板,然后計算測試采集的樣品與標準模板之間的匹配程度,并通過(guò)閾值來(lái)判斷是否存在人臉;
?、谌四樢巹t法
由于人臉具有一定的結構分布特征,所謂人臉規則的方法即提取這些特征生成相應的規則以判斷測試樣品是否包含人臉;
?、蹣悠穼W(xué)習法
這種方法即采用模式識別中人工神經(jīng)網(wǎng)絡(luò )的方法,即通過(guò)對面像樣品集和非面像樣品集的學(xué)習產(chǎn)生分類(lèi)器;
?、苣w色模型法
這種方法是依據面貌膚色在色彩空間中分布相對集中的規律來(lái)進(jìn)行檢測。
?、萏卣髯幽?lè )?/p>
這種方法是將所有面像集合視為一個(gè)面像子空間,并基于檢測樣品與其在子孔間的投影之間的距離判斷是否存在面像。
值得提出的是,上述5種方法在實(shí)際檢測系統中也可綜合采用。
?。?)人體面貌跟蹤
面貌跟蹤是指對被檢測到的面貌進(jìn)行動(dòng)態(tài)目標跟蹤。具體采用基于模型的方法或基于運動(dòng)與模型相結合的方法。
此外,利用膚色模型跟蹤也不失為一種簡(jiǎn)單而有效的手段。
?。?)人體面貌比對
面貌比對是對被檢測到的面貌像進(jìn)行身份確認或在面像庫中進(jìn)行目標搜索。這實(shí)際上就是說(shuō),將采樣到的面像與庫存的面像依次進(jìn)行比對,并找出最佳的匹配對象。所以,面像的描述決定了面像識別的具體方法與性能。目前主要采用特征向量與面紋模板兩種描述方法:
?、偬卣飨蛄糠?/p>
該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性,然后再計算出它們的幾何特征量,而這些特征量形成一描述該面像的特征向量。
?、诿婕y模板法
該方法是在庫中存貯若干標準面像模板或面像器官模板,在進(jìn)行比對時(shí),將采樣面像所有象素與庫中所有模板采用歸一化相關(guān)量度量進(jìn)行匹配。
此外,還有采用模式識別的自相關(guān)網(wǎng)絡(luò )或特征與模板相結合的方法。
人體面貌識別技術(shù)的核心實(shí)際為“局部人體特征分析”和“圖形/神經(jīng)識別算法。”這種算法是利用人體面部各器官及特征部位的方法。如對應幾何關(guān)系多數據形成識別參數與數據庫中所有的原始參數進(jìn)行比較、判斷與確認。一般要求判斷時(shí)間低于1秒。
3、人體面貌的識別過(guò)程
一般分三步:
?。?)首先建立人體面貌的面像檔案。即用攝像機采集單位人員的人體面貌的面像文件或取他們的照片形成面像文件,并將這些面像文件生成面紋(Faceprint)編碼貯存起來(lái)。
?。?)獲取當前的人體面像
即用攝像機捕捉的當前出入人員的面像,或取照片輸入,并將當前的面像文件生成面紋編碼。
?。?)用當前的面紋編碼與檔案庫存的比對
即將當前的面像的面紋編碼與檔案庫存中的面紋編碼進(jìn)行檢索比對。上述的“面紋編碼”方式是根據人體面貌臉部的本質(zhì)特征和開(kāi)頭來(lái)工作的。這種面紋編碼可以抵抗光線(xiàn)、皮膚色調、面部毛發(fā)、發(fā)型、眼鏡、表情和姿態(tài)的變化,具有強大的可靠性,從而使它可以從百萬(wàn)人中精確地辯認出某個(gè)人。
人體面貌的識別過(guò)程,利用普通的圖像處理設備就能自動(dòng)、連續、實(shí)時(shí)地完成。
評論