動(dòng)態(tài)人臉識別技術(shù)難點(diǎn)與解決思路分析
作為一種比較新而且發(fā)展快的技術(shù),并不是所有人都對這門(mén)技術(shù)有較為清晰的認識和理解。比如人臉識別技術(shù)的算法是怎樣的,人臉識別技術(shù)目前發(fā)展到什么程度了,該技術(shù)對圖像類(lèi)別及質(zhì)量有何要求,在實(shí)際應用中又有那些分類(lèi)等等,這些問(wèn)題姚委員在講座中都一一為大家進(jìn)行了比較細致的解答,并對動(dòng)態(tài)人臉識別技術(shù)的系統構成和優(yōu)勢、動(dòng)態(tài)人臉識別與常規監控的區別也進(jìn)行了闡述。
如地鐵、高速公路卡口、車(chē)站卡口、超市反扒、邊檢、人群分析等等。因而很多廠(chǎng)家也生產(chǎn)了動(dòng)態(tài)人臉識別技術(shù)的相關(guān)產(chǎn)品,如具有人臉識別功能的攝像機、人臉識別分析儀等等。但是林林總總的人臉識別產(chǎn)品給人以豐富的選擇的同時(shí)也帶來(lái)了相當大的選擇困擾,到底如何選擇人臉識別產(chǎn)品呢?哪些產(chǎn)品在人臉識別方面技術(shù)比較先進(jìn)呢?
就這類(lèi)問(wèn)題,姚委員介紹了近期省公安局組織的人臉識別攝像機的測試,測試地點(diǎn)在東山口地鐵站某扶梯口進(jìn)行。在該測試中,性能表現最好的攝像機為Basler黑白攝像機,在監控名單庫1和庫2時(shí)采用低清算法的性能表現最好。在監控名單庫3時(shí)采用高清算法的性能表現最好,誤報率在1%時(shí)漏報率維持在25%的實(shí)際可用水平。
參照國標《安全防范視頻監控人臉識別系統技術(shù)要求》,該次測試監控名單庫相當于C級(監控名單庫容量為1萬(wàn)至10萬(wàn)人),參加測試人員也基本滿(mǎn)足于C級水平(注冊測試人員多于10人,每人至少通過(guò)2次,即不少于200人次通過(guò);非注冊測試人員需為注冊測試人員通過(guò)次數的2倍以上)。在該次測試中,沒(méi)有達到一級的系統性能級別,二級系統性能級別有1個(gè)測試組合,三級的性能級別有28個(gè)測試組合,四級的性能級別有10個(gè)測試組合。(誤報率在5%的情況下,漏報率小于5%的為一級,5%~20%為二級,20%~50%為三級,50%~70%為四級)。
從實(shí)際測試來(lái)看,用戶(hù)的預期與當前的技術(shù)水平之間的差距還是比較大的。人臉識別技術(shù)在動(dòng)態(tài)監控應用中面臨的壓力實(shí)際上也比較大。
1.用戶(hù)希望正確報警率要求高。而現實(shí)是理論上來(lái)說(shuō)必須接受高誤報率。在技術(shù)方面,要達到高正確報警率,可以通過(guò)降低閾值來(lái)實(shí)現,但是降低閾值的代價(jià)是:高誤報率。為了達到95%正確報警率,很多算法可能會(huì )產(chǎn)生300%或更高的誤報率。
2.用戶(hù)希望監控庫足夠大,往往要求數萬(wàn)或幾十萬(wàn),甚至上百萬(wàn)的監控名單,希望能捕到“大魚(yú)”?,F實(shí)是庫容量大就必須接受高誤報率。
3.用戶(hù)希望大規模成網(wǎng)建設,能夠勾畫(huà)出監控人員的活動(dòng)軌跡?,F實(shí)是必須高投入,重新建專(zhuān)用網(wǎng)絡(luò )和相關(guān)硬件。
4.用戶(hù)希望盡量使用目前的監控設備(攝像機和網(wǎng)絡(luò ))?,F實(shí)是現有的攝像機清晰度不夠,圖像質(zhì)量差,用于場(chǎng)景監控時(shí)視頻中人臉過(guò)小,網(wǎng)絡(luò )帶寬不夠等等造成無(wú)法使用現有設備。
5.用戶(hù)希望少產(chǎn)生誤報甚至不產(chǎn)生誤報?,F實(shí)是這樣就必將損失正確報警率和減少監控庫容量,與用戶(hù)的想法相違。
動(dòng)態(tài)人臉識別在應用中遇到的挑戰
1.光照問(wèn)題
面臨各種環(huán)境光源的考驗,可能出現側光、頂光、背光和高光等現象,而且有可能出現各個(gè)時(shí)段的光照不同,甚至在監控區域內各個(gè)位置的光照都不同。
2.人臉姿態(tài)和飾物問(wèn)題
因為監控是非配合型的,監控人員通過(guò)監控區域時(shí)以自然的姿態(tài)通過(guò),因此可能出現側臉、低頭、抬頭等的各種非正臉的姿態(tài)和佩戴帽子、黑框眼鏡、口罩等飾物現象。
3.攝像機的圖像問(wèn)題
攝像機很多技術(shù)參數影響視頻圖像的質(zhì)量,這些因素有感光器(CCD、CMOS)、感光器的大小、DSP的處理速度、內置圖像處理芯片和鏡頭等,同時(shí)攝像機內置的一些設置參數也將影響視頻質(zhì)量,如曝光時(shí)間、光圈、動(dòng)態(tài)白平衡等參數。
4.丟幀和丟臉問(wèn)題
需要的網(wǎng)絡(luò )識別和系統的計算識別可能會(huì )造成視頻的丟幀和丟臉現象,特別是監控人流量大的區域,由于網(wǎng)絡(luò )傳輸的帶寬問(wèn)題和計算能力問(wèn)題,常常引起丟幀和丟臉。
視頻人臉識別監控的最優(yōu)方案
1.使用更先進(jìn)的高清攝像頭(3-5百萬(wàn))。
2.室內均勻光線(xiàn),或室外白天,無(wú)側光和直射光
3.人群面向同樣的方向,朝向相機的方向。
4.恰當的監控點(diǎn),如走廊、巷子或安檢門(mén)/閘機口等(不要一群人同時(shí)出現)。
5.相機與人臉的角度小于20°。
決定監控系統性能的幾個(gè)主要因素:
1.模板庫的人數:不宜大,包含關(guān)鍵人物即可。
2.經(jīng)過(guò)攝像頭的人數:同時(shí)出現在攝像頭的人數決定了單位時(shí)間里的比對次數。
3.報警反饋時(shí)間:實(shí)時(shí)性越強,對系統性能要求越高。
4.攝像頭采集幀數:幀數越高,人員經(jīng)過(guò)攝像頭前采集的次數越多,比對的次數也越多。
報警過(guò)濾機制
建立報警過(guò)濾機制是解決錯誤報警率高的有效方法,當監控名單庫容量較大時(shí),可以通過(guò)此方法,將錯誤報警率控制在千分之N的之內,使動(dòng)態(tài)監控走向實(shí)際應用。
綜合來(lái)看,目前動(dòng)態(tài)人臉識別技術(shù)的發(fā)展還遠遠達不到用戶(hù)的需求,圖像分析不盡人意,正確報警率普遍不高,誤報率與大容量之間似乎不可調節,性?xún)r(jià)比較低等等問(wèn)題似乎成為了動(dòng)態(tài)人臉識別技術(shù)的絆腳石。但是,如何將這些絆腳石變?yōu)殇伮肥?,正式各廠(chǎng)商及技術(shù)人員需要努力的目標。
評論