自拍測運勢?這都是人臉識別技術(shù)的功勞
新年伊始,算雞年運勢是很多年輕人茶余飯后熱衷做的事情。雖然“算運勢”這種行為可能更多只是一種休閑,但也能給人們帶來(lái)信心或是提出警示,從心理暗示上真正“改變運勢”。
本文引用地址:http://dyxdggzs.com/article/201702/344057.htm
有意思的是,今年春節百度圖像搜索推出了一款“自拍測運勢”神器,打開(kāi)手機百度,對準攝像頭進(jìn)行自拍或上傳照片,圖像搜索就會(huì )給出新年運勢,引得不少網(wǎng)友上傳照片去測自己的運勢。這個(gè)新功能看起來(lái)挺可笑的,因為不少人笑稱(chēng),手機居然也可以算命了?其實(shí)這一點(diǎn)也不可笑,因為“自拍測運勢”用上了圖像識別的黑科技,而這一黑科技背后全靠真功夫。
“測運勢”背后到底有什么黑科技
“自拍測運勢”神器主要是利用百度圖像搜索功能,依托于百度圖像識別技術(shù),根據人臉識別技術(shù),對眉毛、眼睛、嘴唇、臉型等四個(gè)關(guān)鍵檢測點(diǎn)評價(jià)打分。綜合面部特征,結合中國傳統相面研究,為用戶(hù)提供新年運勢分析。
坦率來(lái)說(shuō),“測運勢”這個(gè)功能并無(wú)太多科學(xué)依據,但卻是真正的“黑科技”。因為人們的面部信息非常豐富,且每個(gè)人都截然不同,如臉型、眉毛、眼睛、鼻子等輪廓信息稱(chēng)之為關(guān)鍵點(diǎn)。
百度人臉識別技術(shù)主要還是把每個(gè)人的臉部圖像進(jìn)行多輪處理,如輪廓定位態(tài)校正、全局粗定位、局部精細定位,跟蹤人臉72個(gè)關(guān)鍵點(diǎn)的特征,最后組合成一個(gè)面部表情網(wǎng),來(lái)識別每個(gè)人的表情和相貌特征,以此再推斷出所謂的“運勢”,在春節娛樂(lè )大眾,給大家帶來(lái)一些歡樂(lè )。
除了“測運勢”以外,前不久搭載百度大腦的小度機器人還在《最強大腦》舞臺上戰勝了從未失算的“水哥”王昱珩,而比拼的內容就是人臉識別。當時(shí)王昱珩在節目錄制的前,主動(dòng)要求把視頻明暗度調低20%,讓挑戰難度增加了好幾倍,希望以此戰勝小度機器人。
王昱珩談到,對于增加難度,他想的是,是不是越暗,電腦的噪點(diǎn)就越多?如果把亮度降下來(lái)的話(huà),(電腦在處理的時(shí)候)可能就回不來(lái)(亮度)。不過(guò)圖像識別的精準度遠比人要高。機器識別主要也是靠圖像輪廓,并不畏懼亮度下降。
圖像識別看似簡(jiǎn)單實(shí)則難度極大
我們在看到測運勢的時(shí)候或是小度戰勝水哥的時(shí)候,大多只是幾秒鐘之間發(fā)生的。前面所講的跟蹤人臉72個(gè)關(guān)鍵點(diǎn)的特征似乎也只是一瞬間的事情。
不過(guò),識別面孔看似簡(jiǎn)單,實(shí)則很難。人類(lèi)臉部存在相似性,不同個(gè)體之間的區別不大,所有的人臉的結構都相似,甚至人臉器官的結構外形都很相似。這樣的特點(diǎn)對于利用人臉進(jìn)行定位是有利的,但是對于利用人臉區分人類(lèi)個(gè)體是不利的。
其次是個(gè)人人臉存在易變性,人臉的外形很不穩定,人可以通過(guò)臉部的變化產(chǎn)生很多表情,而在不同觀(guān)察角度,人臉的視覺(jué)圖像也相差很大,另外,人臉識別還受光照條件(例如白天和夜晚,室內和室外等)、人臉的很多遮蓋物(例如口罩、墨鏡、頭發(fā)、胡須等)、年齡等多方面因素的影響。
也正是如此,圖像識別的考驗算法以及數據量的豐富程度。國外有一個(gè)圖像數據庫叫LabelMe。上圖是其中一張圖像,標得非常細,房屋的外形、輪廓、窗戶(hù)、汽車(chē)、所有草地、馬路都標得很清楚。這個(gè)圖庫中大概有十萬(wàn)圖片,而真正標記清晰的圖像大概是一萬(wàn)張。這些圖片都是人工一點(diǎn)點(diǎn)輸入的。
就拿這次最強大腦節目中,小度機器人和水哥王昱珩之間比賽來(lái)看。小度的算法還要面臨各種環(huán)境光源的考驗,甚至還要面臨人臉姿態(tài)和飾物的考驗,以及攝像機的圖像問(wèn)題,乃至動(dòng)態(tài)監測中丟幀的影響。機器人在識別人臉時(shí)必須經(jīng)過(guò)人臉檢測、人臉預處理、人臉圖像特征提取、人臉圖像匹配與識別等一系列的過(guò)程。
這些難點(diǎn)其實(shí)都考驗著(zhù)機器視覺(jué)的準確率。不過(guò),隨著(zhù)百度在這一領(lǐng)域的研究深入,圖像識別技術(shù)將越來(lái)越精準。
人臉識別究竟可以有哪些實(shí)際運用
測運勢、搞綜藝節目當然和我們的生活還是存在一定的距離。那么圖像搜索在生活之中究竟又哪些實(shí)際運用呢?這可能才是真正會(huì )影響到我們的問(wèn)題。
圖像搜索、人臉識別等技術(shù)真正可以運用的領(lǐng)域有很多,比如這四大塊。
1、可以提供拍圖翻譯、拍題找答案、查藥品,以及識別美食檢索做法等一系列服務(wù),解決人們生活中很多文字“不可描述”,圖像才能描述的問(wèn)題。我們出門(mén)在外,如果看到自己喜歡的商品,可以打開(kāi)購物APP,識別后直接購買(mǎi)就好。像手機百度在識別紅燒肉的圖片時(shí),就會(huì )直接給出制造方法。
2、由于圖像識別技術(shù)遠比人要可靠,也被運用在互聯(lián)網(wǎng)金融的授信之中,能夠縮短中間環(huán)節,反而還提高授信安全度,甚至是實(shí)現刷臉支付。百度金融其實(shí)已經(jīng)把人臉識別運用在金融授信中。這種方式可以實(shí)現秒批,防止身份冒用的情況。讓金融安全得到極大提升。
3、我國二代證的普及使中國目前逾12億人的身份信息有了數碼照片數據,平安城市聯(lián)網(wǎng)的數百萬(wàn)臺監控攝像機每天也產(chǎn)生著(zhù)海量的數據信息,公安已經(jīng)跨入大數據應用時(shí)代。人臉識別技術(shù)在海量數據信息的支撐下已經(jīng)成為了為公安部門(mén)尋找走失兒童、偵破案件提供技術(shù)支持的重要基礎。
4、為無(wú)人駕駛等未來(lái)技術(shù)做好儲備,百度無(wú)人車(chē)在駕駛過(guò)程中之所以能自動(dòng)規避其他車(chē)輛和行人,就是因為有雷達不斷采集實(shí)時(shí)路況,車(chē)內有電腦對這些圖片、視頻進(jìn)行分析和處理??梢哉f(shuō),圖像識別技術(shù)會(huì )成為未來(lái)無(wú)人駕駛的一個(gè)重要的基礎支撐。
評論