新一代智能視頻分析技術(shù)的四大方向
近年來(lái)在視頻監控市場(chǎng)中,智能視頻分析技術(shù)成為熱點(diǎn)產(chǎn)品,諸如行為分析、車(chē)牌識別、人臉抓拍、客流統計等智能化技術(shù),在城市管理、公共安全、銀行、交通等行業(yè)得到了較廣泛的應用,取得了很好的社會(huì )效益和經(jīng)濟效益,成為安防企業(yè)一個(gè)新的技術(shù)制高點(diǎn)和發(fā)展方向。
隨著(zhù)智能化技術(shù)的普及使用,市場(chǎng)漸漸不再滿(mǎn)足于現有的智能化技術(shù)種類(lèi),而是尋求更新的算法、更豐富的業(yè)務(wù)應用、更整體化的系統應用,力求實(shí)現在應用的廣度、深度上的突破。為此,安防行業(yè)已經(jīng)開(kāi)始進(jìn)行對新一代智能視頻分析技術(shù)的研究,提出了一些新的產(chǎn)品形態(tài),新的應用模式,新的系統架構。這些新技術(shù)、新產(chǎn)品正在逐漸與市場(chǎng)結合,探求新的發(fā)展空間。
智能視頻的創(chuàng )新方向
在基礎的智能監控需求已經(jīng)得到滿(mǎn)足的情況下,智能視頻新技術(shù)集中向著(zhù)幾個(gè)方向發(fā)展:
第一,提升視覺(jué)感官體驗的技術(shù),包括圖像防抖動(dòng)、圖像增強等視頻預處理技術(shù)。
第二,提升分析準確率的技術(shù),主要是雙目識別技術(shù)。
第三,改善系統應用性的技術(shù),包括多球機聯(lián)動(dòng)跟蹤等。
第四,面向事后分析的技術(shù),包括圖像復原、圖像摘要檢索等技術(shù)。
以下分別就各項技術(shù)的實(shí)現、應用及前景做一些分析。
圖像防抖動(dòng)技術(shù)
圖像抖動(dòng)是在交通領(lǐng)域經(jīng)常見(jiàn)到的問(wèn)題,主要的成因是道路監控中高架安裝方式帶來(lái)的較高頻率小幅抖動(dòng),以及車(chē)載移動(dòng)監控中由于攝像位置變化帶來(lái)的低頻大幅抖動(dòng)。在模擬標清時(shí)代,主要會(huì )影響了大倍率下的圖像畫(huà)面,而在數字高清時(shí)代,在焦距達到20mm以上畫(huà)面就會(huì )明顯抖動(dòng),這對于監控內容的識別有明顯的影響。
圖像防抖動(dòng)的解決途徑主要有幾種:
采用軟件技術(shù)進(jìn)行處理
采集完整的傳感器圖像,圖像處理緩沖。
為實(shí)現防抖,預留邊緣圖像,對中心圖像進(jìn)行數字放大(圖像失真或模糊)。
使用預留邊緣圖像,對圖像進(jìn)行補償,達到防抖效果(補償區域縮放,邊緣模糊)。
硬件軟件結合的方式
為彌補圖像數字放大帶來(lái)的圖像模糊問(wèn)題,使用更大像素的圖像傳感器。
采用直接物理像素尺寸,對圖像抖動(dòng)區域進(jìn)行補償,避免圖像邊緣模糊。
圖像防抖動(dòng)技術(shù)在前端球機產(chǎn)品中應用時(shí),通常采用軟硬件結合的方式。技術(shù)關(guān)鍵點(diǎn)之一,是要克服圖像邊緣角落虛焦的現象。
圖像增強技術(shù)
當前監控系統面臨的重要問(wèn)題,是受到各種干擾因素的影響,使得系統不能在全天候、全天時(shí)下運行,系統的可靠度低,LCC值不經(jīng)濟。這些干擾因素主要包括如白天環(huán)境下的虛光、泛光、逆光,低照度環(huán)境,監控場(chǎng)景中強逆光的干擾,霧、灰霾等的大氣散射環(huán)境干擾,降雨、降雪、沙塵等氣象條件的影響。
圖像增強技術(shù)主要解決的問(wèn)題,是通過(guò)算法對視頻源進(jìn)行視覺(jué)改善處理,有效的改善畫(huà)質(zhì),提高圖像的清晰度,提高視覺(jué)可分辨性,使原本低質(zhì)量的圖像能夠滿(mǎn)足監控需要,達到清晰可辨的程度。
圖像增強的技術(shù)實(shí)現途徑,是突出原有圖像中需要重點(diǎn)觀(guān)測的內容,抑制非重點(diǎn)觀(guān)測內容,通過(guò)對像素的灰度值運算處理生成一幅新的圖像,以改善視覺(jué)效果。圖像增強的關(guān)鍵技術(shù)問(wèn)題有:
·對不同自適應不同時(shí)刻、不同程度的干擾因素。
·自適應不同的景深、視角、目標內容。
·有效分辨畫(huà)面內容,充分保留局部細節;畫(huà)面對比柔和,色彩過(guò)渡均衡,亮暗對比適中;色彩恒常性好,不受場(chǎng)景變化影響。
·正常環(huán)境下不影響畫(huà)質(zhì);未增強的畫(huà)面不失真。
圖像增強的產(chǎn)品形態(tài),涵蓋了從前端、編碼端到后臺顯示端的處理。在產(chǎn)品定位上,可以分為兩個(gè)方向:普適性產(chǎn)品,重點(diǎn)是正常氣候下,不降質(zhì)。惡劣氣候下有改善,但不是最好。作為標配集成到各個(gè)設備中。專(zhuān)業(yè)級產(chǎn)品,重點(diǎn)解決在惡劣的情況,達到最好的效果。如霧天專(zhuān)用、深海專(zhuān)用、低照度專(zhuān)用、軍事專(zhuān)用等等作為專(zhuān)用設備,應用整合于特種行業(yè)。
雙目立體視覺(jué)技術(shù)
雙目立體視覺(jué)技術(shù)的核心目的,是提高識別的準確率。由于立體視覺(jué)技術(shù)形成的視場(chǎng)中帶有物體的三維幾何信息,因此能夠有效的設定檢測規則,排除光線(xiàn)、影子等干擾因素,大幅提高智能分析的準確度。如果說(shuō)高清技術(shù)通過(guò)提升可用像素來(lái)提高分析的準確率,是戰術(shù)性的舉措,那么雙目立體視覺(jué)技術(shù)對視頻分析準確率的影響則是戰略性的。
雙目立體視覺(jué)技術(shù)是基于視差原理,并利用成像設備從不同的位置獲取被測物體的兩幅圖像,通過(guò)計算圖像對應點(diǎn)間的位置偏差,來(lái)獲取物體三維幾何信息的方法。
采用雙相機或多相機,對視場(chǎng)內空間的自由運動(dòng)體的三維位置坐標及姿態(tài)進(jìn)行高精度的測量,確定運動(dòng)目標的質(zhì)心位置,并根據標定結果對運動(dòng)目標進(jìn)行高精度跟蹤。
立體視覺(jué)技術(shù)的跟蹤,由于能夠辨識目標的三維坐標、姿態(tài)、相對距離、與背景環(huán)境的空間距離,因此能適應復雜的跟蹤背景環(huán)境。
多球機聯(lián)動(dòng)跟蹤
多球機聯(lián)動(dòng)跟蹤技術(shù),是以單球機智能跟蹤技術(shù)作為基礎的。從應用的層面上看,能夠將普通的跟蹤球機的單點(diǎn)式監控,提升為系統內對單個(gè)目標的無(wú)縫式接力跟蹤,配合電子地圖的使用,能夠容易的實(shí)現對高安全等級區域的無(wú)縫式跟蹤,并實(shí)現目標軌跡描繪、犯罪行為預警等高等級的安保需求。
多球機聯(lián)動(dòng)跟蹤技術(shù)的實(shí)現,需要首先具備多目標識別與跟蹤技術(shù)。在應用中,通常設定一臺球機作為發(fā)起點(diǎn),對廣域范圍內目標進(jìn)行的智能行為分析,并將同時(shí)監控的多個(gè)目標按照既定的策略進(jìn)行排序,并按照先后順序,指揮智能跟蹤球機逐個(gè)跟蹤監控目標。與單目標跟蹤相比,多目標跟蹤技術(shù)的關(guān)鍵點(diǎn)是數據關(guān)聯(lián)問(wèn)題,即建立一個(gè)統一的坐標系,使得發(fā)起球機可以將目標的坐標信息傳遞給跟蹤球機,實(shí)現聯(lián)動(dòng)跟蹤。
多目標跟蹤的過(guò)程可以劃分為以下幾部分:
數據關(guān)聯(lián):在觀(guān)測數據和目標之間建立起對應關(guān)系。常見(jiàn)的方法有最近鄰算法、聯(lián)合概率數據關(guān)聯(lián)濾波器、多假設跟蹤算法。
狀態(tài)估計:通常將多目標跟蹤問(wèn)題轉化成對多個(gè)單目標的跟蹤過(guò)程,并建立相應的狀態(tài)空間模型。為每個(gè)目標分配一個(gè)單目標跟蹤器,相互獨立地跟蹤每個(gè)目標,通過(guò)設計一些特殊的方法來(lái)處理目標之間的交互和遮擋問(wèn)題。
坐標傳遞:在關(guān)聯(lián)的球機之間建立統一的坐標系
在多目標監控場(chǎng)景中,提取目標的位置和運動(dòng)軌跡信息,發(fā)送給下一個(gè)球機,下一個(gè)球機根據目標的位置和運動(dòng)軌跡信息跟蹤鎖定目標。
另外,多目標跟蹤技術(shù)在實(shí)際的應用中,還需要重點(diǎn)優(yōu)化和改進(jìn)以下方面:提升算法的效率,以實(shí)現同時(shí)能夠跟蹤盡量多的目標;需要改進(jìn)算法的抗干擾性能,以減輕光線(xiàn)變化、影子、目標間遮擋等常見(jiàn)的干擾因素;需要能夠對每個(gè)目標排定警戒優(yōu)先級,以使球機在跟蹤時(shí)能夠及時(shí)切換到威脅等級更高的目標。
面向事后應用的智能技術(shù)
面對監控系統中海量的錄像數據,如何有效、高效的應用,減輕人工查看回放帶來(lái)的時(shí)效性差、成本高、疲勞問(wèn)題,并在不同分辨率、不同清晰度的錄像中準確的辨別出需要獲取的信息,行業(yè)提供了視頻復原、視頻摘要、視頻結構化檢索等技術(shù)手段。
視頻復原
解決對模糊錄像的有效辨別問(wèn)題。通過(guò)綜合應第四屆中國智能運輸大會(huì )暨第二屆深圳國際智能交通與衛星導航位置服務(wù)展覽會(huì )(2013.5.26-5.28深圳會(huì )展中心)www.its-expo.com 161用超分辨率、銳化濾波、去模糊濾波、輪廓增強、降噪濾波、變形校正、色彩調整、時(shí)空分析、視頻標注、多視頻比對、視頻穩定化等智能算法,對對焦不準、運動(dòng)模糊、噪聲干擾等原因導致的模糊視頻進(jìn)行處理,使之清晰可辨。
視頻摘要
將視頻摘要形成視頻片斷,不同時(shí)刻的目標“穿越時(shí)空”同時(shí)展現播放,使24小時(shí)的視頻被制作成一個(gè)簡(jiǎn)短到幾分鐘摘要視頻成為現實(shí)。視頻摘要不僅濃縮的是事件的精華,也是活動(dòng)事件的全部,沒(méi)有價(jià)值的視頻將被剔除。通過(guò)多分格快照技術(shù),可以在幾秒中看完所有的活動(dòng)目標成為可能,回溯原始視頻功能,瞬間鎖定目標在原始視頻中的位置。這些智能視頻分析功能的實(shí)現和應用將大大提高海量視頻監控錄像分析的效率。
視頻分類(lèi)檢索
傳統的視頻搜索功能主要是以物理條件的設定為主要搜索條件的,比如時(shí)間,日期等。而智能視頻檢索功能能夠通過(guò)認為設定的智能條件進(jìn)行快速的視頻搜索。比如:特定場(chǎng)景的變化條件、嫌疑物體(人、車(chē)、其他特征物體)的出現等為搜索條件,進(jìn)行特定視頻條件的智能搜索,結合其他智能視頻功能,可以使大量的無(wú)序信息在短時(shí)間內形成有價(jià)值的證據鏈。如圖7,輸入“紅色車(chē)”檢索條件,可比對得到相似度高的目標列表。
視頻分類(lèi)檢索技術(shù)未來(lái)的發(fā)展,應當是向著(zhù)結構化錄像存儲的方向,分步驟實(shí)現以下的技術(shù)目標:
結構化數據的可檢索:卡口、電警采集的車(chē)牌信息,獨立的小系統。
非結構化數據的可檢索:監控攝像機采集的視頻信息,顏色、行為、人臉、車(chē)型等。
視頻采集時(shí)數據結構化處理:在智能球機、IPC編碼時(shí)自動(dòng)生成視頻數據庫,而不是簡(jiǎn)單的錄像文件。
結構化錄像存儲是未來(lái)的方向,但還需要解決以下以下關(guān)鍵的技術(shù)問(wèn)題:視覺(jué)信息、高層語(yǔ)義信息數據描述技術(shù)、分類(lèi)規范和信息索引技術(shù)、存儲組織和高效搜索技術(shù)、提高智能分析技術(shù)的準確度、智能技術(shù)的硬件產(chǎn)品化、異地查詢(xún)和交換技術(shù)等。
結束語(yǔ)
以上對當前和未來(lái)的一些新的智能化視頻技術(shù)的前景、實(shí)現、應用方式做了一些概要性的分析??梢灶A見(jiàn)的是,這些技術(shù)將與現有的各項智能技術(shù)不斷的融合,并擴展到各種產(chǎn)品形態(tài)中,應用在視頻監控的各個(gè)環(huán)節,進(jìn)而變化為更多的智能化產(chǎn)品類(lèi)型,更豐富的業(yè)務(wù)應用,更靈活的系統結構,從而推動(dòng)智能視頻技術(shù)更深入的與行業(yè)用戶(hù)的業(yè)務(wù)需求相結合,為視頻技術(shù)開(kāi)拓出更大的行業(yè)市場(chǎng)。
評論