一文讀懂:深扒人臉識別60年技術(shù)發(fā)展史
“他來(lái)聽(tīng)我的演唱會(huì ),門(mén)票換了手銬一對”。最近歌神張學(xué)友變阿SIR,演唱會(huì )上頻頻抓到罪犯,將人臉識別技術(shù)又一次推到了大眾的視線(xiàn)中。要說(shuō)人臉識別技術(shù)的爆發(fā),當屬去年9月份蘋(píng)果iPhone x的發(fā)布,不再需要指紋,只需要掃描面部就可以輕松解鎖手機。任何技術(shù)一旦進(jìn)入智能手機這個(gè)消費市場(chǎng),尤其是被蘋(píng)果這個(gè)標志性的品牌采用,就意味著(zhù)它將成為一種趨勢,一個(gè)智能設備的標配。
本文引用地址:http://dyxdggzs.com/article/201806/381878.htm在智能手機快速崛起的這幾年,其密碼鎖經(jīng)歷了從數字密碼、手勢解鎖到指紋識別的升級,發(fā)展到如今的虹膜識別和人臉識別??梢灶A料的是,由于全面屏幕的普及和更為安全、便捷的 FaceID 技術(shù)的出現,在不久的將來(lái),指紋識別也將被智能手機廠(chǎng)商們所拋棄,完成它的歷史使命。
那么人臉識別到底是一項怎樣的技術(shù),這期《趣科技》,與非網(wǎng)小編就將帶大家走進(jìn)人臉識別,聊聊這項黑科技。
人臉識別是啥玩意兒?
人臉識別技術(shù),是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉進(jìn)行臉部的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。傳統的人臉識別技術(shù)主要是基于可見(jiàn)光圖像的人臉識別,這也是人們熟悉的識別方式。簡(jiǎn)單的來(lái)說(shuō)就是一個(gè)讓計算機認出你的過(guò)程。
人臉識別技術(shù)主要是通過(guò)人臉圖像特征的提取與對比來(lái)進(jìn)行的。人臉識別系統將提取的人臉圖像的特征數據與數據庫中存儲的特征模板進(jìn)行搜索匹配,通過(guò)設定一個(gè)閾值,當相似度超過(guò)這一閾值,則把匹配得到的結果輸出。將待識別的人臉特征與已得到的人臉特征模板進(jìn)行比較,根據相似程度對人臉的身份信息進(jìn)行判斷。這一過(guò)程又分為兩類(lèi):一類(lèi)是確認,是一對一進(jìn)行圖像比較的過(guò)程,另一類(lèi)是辨認,是一對多進(jìn)行圖像匹配對比的過(guò)程。
廣義的人臉識別實(shí)際包括構建人臉識別系統的一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、人臉識別預處理、身份確認以及身份查找等;而狹義的人臉識別特指通過(guò)人臉進(jìn)行身份確認或者身份查找的技術(shù)或系統。
人臉識別技術(shù)發(fā)展
早在20世紀50年代,認知科學(xué)家就已著(zhù)手對人臉識別展開(kāi)研究。20世紀60年代,人臉識別工程化應用研究正式開(kāi)啟。當時(shí)的方法主要利用了人臉的幾何結構,通過(guò)分析人臉器官特征點(diǎn)及其之間的拓撲關(guān)系進(jìn)行辨識。這種方法簡(jiǎn)單直觀(guān),但是一旦人臉姿態(tài)、表情發(fā)生變化,則精度嚴重下降。
1991年,著(zhù)名的“特征臉”方法第一次將主成分分析和統計特征技術(shù)引入人臉識別,在實(shí)用效果上取得了長(cháng)足的進(jìn)步。這一思路也在后續研究中得到進(jìn)一步發(fā)揚光大,例如,Belhumer成功將Fisher判別準則應用于人臉?lè )诸?lèi),提出了基于線(xiàn)性判別分析的Fisherface方法。
由劍橋人臉數據集的特征分解獲得的前四個(gè)特征向量
21世紀的前十年,隨著(zhù)機器學(xué)習理論的發(fā)展,學(xué)者們相繼探索出了基于遺傳算法、支持向量機(Support Vector Machine, SVM)、boosting、流形學(xué)習以及核方法等進(jìn)行人臉識別。 2009年至2012年,稀疏表達(Sparse Representation)因為其優(yōu)美的理論和對遮擋因素的魯棒性成為當時(shí)的研究熱點(diǎn)。
與此同時(shí),業(yè)界也基本達成共識:基于人工精心設計的局部描述子進(jìn)行特征提取和子空間方法進(jìn)行特征選擇能夠取得最好的識別效果。Gabor及LBP特征描述子是迄今為止在人臉識別領(lǐng)域最為成功的兩種人工設計局部描述子。這期間,對各種人臉識別影響因子的針對性處理也是那一階段的研究熱點(diǎn),比如人臉光照歸一化、人臉姿態(tài)校正、人臉超分辨以及遮擋處理等。也是在這一階段,研究者的關(guān)注點(diǎn)開(kāi)始從受限場(chǎng)景下的人臉識別轉移到非受限環(huán)境下的人臉識別。LFW人臉識別公開(kāi)競賽在此背景下開(kāi)始流行,當時(shí)最好的識別系統盡管在受限的FRGC測試集上能取得99%以上的識別精度,但是在LFW上的最高精度僅僅在80%左右,距離實(shí)用看起來(lái)距離頗遠。
2013年,MSRA的研究者首度嘗試了10萬(wàn)規模的大訓練數據,并基于高維LBP特征和Joint Bayesian方法在LFW上獲得了95.17%的精度。這一結果表明:大訓練數據集對于有效提升非受限環(huán)境下的人臉識別很重要。然而,以上所有這些經(jīng)典方法,都難以處理大規模數據集的訓練場(chǎng)景。
2014年前后,隨著(zhù)大數據和深度學(xué)習的發(fā)展,神經(jīng)網(wǎng)絡(luò )重受矚目,并在圖像分類(lèi)、手寫(xiě)體識別、語(yǔ)音識別等應用中獲得了遠超經(jīng)典方法的結果。香港中文大學(xué)的Sun Yi等人提出將卷積神經(jīng)網(wǎng)絡(luò )應用到人臉識別上,采用20萬(wàn)訓練數據,在LFW上第一次得到超過(guò)人類(lèi)水平的識別精度,這是人臉識別發(fā)展歷史上的一座里程碑。
自此之后,研究者們不斷改進(jìn)網(wǎng)絡(luò )結構,同時(shí)擴大訓練樣本規模,將LFW上的識別精度推到99.5%以上。如表1所示,我們給出了人臉識別發(fā)展過(guò)程中一些經(jīng)典的方法及其在LFW上的精度,一個(gè)基本的趨勢是:訓練數據規模越來(lái)越大,識別精度越來(lái)越高。
人臉識別十大關(guān)鍵技術(shù)
1、人臉檢測(Face Detection)
“人臉檢測(Face Detection)”的作用就是要檢測出圖像中人臉所在位置。
人臉檢測算法的輸入是一張圖像,輸出是人臉框坐標序列,具體結果是0個(gè)人臉框或1個(gè)人臉框或多個(gè)人臉框。輸出的人臉坐標框可以為正方形、矩形等。
人臉檢測算法的原理簡(jiǎn)單來(lái)說(shuō)是一個(gè)“掃描”加“判定”的過(guò)程。即首先在整個(gè)圖像范圍內掃描,再逐個(gè)判定候選區域是否是人臉的過(guò)程。因此人臉檢測算法的計算速度會(huì )跟圖像尺寸大小以及圖像內容相關(guān)。在實(shí)際算法時(shí),我們可以通過(guò)設置“輸入圖像尺寸”、或“最小臉尺寸限制”、“人臉數量上限”的方式來(lái)加速算法。
舉例說(shuō)明:綠色矩形框標注的即為人臉檢測算法檢測到的人臉位置
2、人臉配準(Face Alignment)
“人臉配準(Face Alignment)”所實(shí)現的目的是定位出人臉上五官關(guān)鍵點(diǎn)坐標。
人臉配準算法的輸入是“一張人臉圖像”和“人臉坐標框”,輸出是五官關(guān)鍵點(diǎn)的坐標序列。五官關(guān)鍵點(diǎn)的數量是預先設定好的一個(gè)固定數值,常見(jiàn)的有5點(diǎn)、68點(diǎn)、90點(diǎn)等等。
當前效果的較好的一些人臉配準技術(shù)基本通過(guò)深度學(xué)習框架實(shí)現。這些方法都是基于人臉檢測的坐標框,按某種事先設定規則將人臉區域摳取出來(lái),縮放到固定尺寸,然后進(jìn)行關(guān)鍵點(diǎn)位置的計算。另外,相對于人臉檢測,或者是后面將提到的人臉特征提取的過(guò)程,人臉配準算法的計算耗時(shí)都要少很多。
舉例說(shuō)明:輸入圖像以及輸出結果如下,綠色圓點(diǎn)標注出了五官位置。
3、人臉屬性識別(Face Attribute)
“人臉屬性識別(Face Attribute)”是識別出人臉的性別、年齡、姿態(tài)、表情等屬性值的一項技術(shù)。這在有些相機APP中有所應用,可以自動(dòng)識別攝像頭視野中人物的性別、年齡等特征并標注出來(lái)。
一般的人臉屬性識別算法的輸入是“一張人臉圖”和“人臉五官關(guān)鍵點(diǎn)坐標”,輸出是人臉相應的屬性值。人臉屬性識別算法一般會(huì )根據人臉五官關(guān)鍵點(diǎn)坐標將人臉對齊,具體過(guò)程為旋轉、縮放、摳取等操作后,將人臉調整到預定的大小和形態(tài),以便之后進(jìn)行屬性分析。
人臉的屬性識別包括性別識別、年齡估計、表情識別、姿態(tài)識別、發(fā)型識別等等方面。一般來(lái)說(shuō)每種屬性的識別算法過(guò)程是獨立的,但是有一些新型的基于深度學(xué)習實(shí)現的算法可以實(shí)現同時(shí)輸出年齡、性別、姿態(tài)、表情等屬性識別結果。
舉例說(shuō)明:人臉屬性識別輸出結果如下
4、人臉提特征(Face Feature Extraction)
“人臉提特征(Face Feature Extraction)”是將一張人臉圖像轉化為可以表征人臉特點(diǎn)的特征,具體表現形式為一串固定長(cháng)度的數值。
人臉提特征過(guò)程的輸入是 “一張人臉圖”和“人臉五官關(guān)鍵點(diǎn)坐標”,輸出是人臉相應的一個(gè)數值串(特征)。人臉提特征算法實(shí)現的過(guò)程為:首先將五官關(guān)鍵點(diǎn)坐標進(jìn)行旋轉、縮放等等操作來(lái)實(shí)現人臉對齊,然后在提取特征并計算出數值串。
舉例說(shuō)明:人臉特征提取過(guò)程
5、人臉比對(Face Compare)
“人臉比對(Face Compare)”算法實(shí)現的目的是衡量?jì)蓚€(gè)人臉之間相似度。
人臉比對算法的輸入是兩個(gè)人臉特征人臉特征由前面的人臉提特征算法獲得,輸出是兩個(gè)特征之間的相似度。
舉例說(shuō)明:人臉對比過(guò)程,輸出結果為相似度96%
6、人臉驗證(Face Verification)
“人臉驗證(Face Verification)”是判定兩個(gè)人臉圖是否為同一人的算法。
它的輸入是兩個(gè)人臉特征,通過(guò)人臉比對獲得兩個(gè)人臉特征的相似度,通過(guò)與預設的閾值比較來(lái)驗證這兩個(gè)人臉特征是否屬于同一人。
舉例說(shuō)明:人臉驗證過(guò)程如下,相似度96%大于閾值75%,判定屬于同一個(gè)人
評論