實(shí)時(shí)視頻圖像的清晰度檢測算法研究
實(shí)時(shí)視頻圖像的質(zhì)量分析已成為眾多應用領(lǐng)域性能好壞的關(guān)鍵因素之一,因此實(shí)時(shí)視頻圖像的清晰度檢測變得尤為重要。目前針對實(shí)時(shí)視頻圖像清晰度檢測的研究較少,圖像清晰度檢測算法的研究對象主要針對靜止的圖像?,F有的圖像清晰度檢測算法大致分為空域和頻域兩類(lèi)。在空域中多采用基于梯度的算法,如拉普拉斯(Laplace)算法、差分平方和(SPSMD)算法、Sobel算子等。此類(lèi)算法計算簡(jiǎn)潔、快速、抗噪性能好、可靠性較高。在頻域中多采用圖像的FFT變換(或其他變換),如功率譜(Power-spectra)算法等[1-2]。此類(lèi)算法的檢測效果好,但計算復雜度高、計算時(shí)間長(cháng),不適合應用在基于軟件實(shí)現的實(shí)時(shí)檢測系統中。
當前對實(shí)時(shí)視頻圖像的一種重要應用是對運動(dòng)目標的檢測,常用的目標檢測方法有幀差法、背景減法、光流法及運動(dòng)能量法[3],其中最簡(jiǎn)單而又快捷的方法是背景差法。其基本思想是通過(guò)對輸入圖像與背景圖像進(jìn)行比較來(lái)分割運動(dòng)目標,關(guān)鍵環(huán)節是背景圖像的提取。目前常用的背景提取方法有多幀圖像平均法、灰度統計法、中值濾波法、基于幀差的選擇方法、單高斯建模等。參考文獻[4]中對以上算法做了充分的研究。
本文是針對實(shí)時(shí)視頻圖像的清晰度檢測,基于實(shí)時(shí)視頻圖像背景基本保持不變的環(huán)境。通過(guò)比較上述算法,針對實(shí)時(shí)視頻圖像的特點(diǎn),提出一種基于背景提取與Sobel算子相結合的實(shí)時(shí)視頻圖像的清晰度檢測算法。
1 實(shí)時(shí)視頻圖像的清晰度檢測算法原理
當視頻播放畫(huà)面超過(guò)24幀/s時(shí),根據視覺(jué)暫留原理,人眼無(wú)法辨別每幅單獨的靜態(tài)畫(huà)面,看上去是平滑連續的視覺(jué)效果。視頻中的事物通常分為靜止和運動(dòng)兩類(lèi),連續多幀畫(huà)面中保持靜止的物體可視為靜止的背景,連續多幀畫(huà)面中位置變化的物體可視為運動(dòng)的前景。因此,實(shí)時(shí)視頻圖像中的每幀圖像都可以劃分為靜止的背景和運動(dòng)的前景兩類(lèi)區域。由于視頻序列圖像中運動(dòng)的前景區域隨機變化,引起圖像像素點(diǎn)梯度值的隨機改變,使得實(shí)時(shí)視頻圖像的清晰度檢測較難實(shí)現。因此,本文的算法是利用實(shí)時(shí)視頻圖像中靜止的背景區域檢測視頻序列圖像的清晰度,即由背景提取和清晰度檢測兩部分組成。
1.1 實(shí)時(shí)視頻圖像的背景提取
由參考文獻[5]可知,視頻序列中幀圖像的靜止背景區域由灰度值變化較小的像素點(diǎn)構成,每個(gè)像素點(diǎn)都有一個(gè)對應的像素值,這個(gè)值在一段時(shí)間內保持不變;運動(dòng)的前景區域由灰度值變化較大的像素點(diǎn)構成,各像素點(diǎn)在不同的幀圖像中的位置改變,形成運動(dòng)軌跡。背景提取的目標就是根據實(shí)時(shí)視頻圖像中像素值的上述特點(diǎn),找出圖像中背景像素點(diǎn)的值。采用多幀圖像累加平均的方法來(lái)獲取圖像的背景,從統計學(xué)角度,運動(dòng)物體可視為隨機噪聲,而均值可以降噪,采用多幀圖像累加取均值可消除運動(dòng)物體,獲得靜止的背景圖片。背景圖像的計算公式為:
式中,f(x,y)為圖像灰度,gx和gy可以用卷積模板來(lái)實(shí)現,如圖1所示。
傳統的邊緣檢測中,Sobel算子利用如圖1的水平和垂直兩個(gè)方向的模板,但實(shí)際情況中的梯度方向是未知的,因此利用兩個(gè)方向計算出來(lái)的結果存在一定的誤差。為了提高梯度計算精度,將模板的數量增加到4個(gè),如圖2所示,即0°、45°、90°、135° 4個(gè)方向。雖然繼續增加模板的數量可以進(jìn)一步提高計算精度,但考慮到計算效率,模板數量不宜過(guò)多。
2 算法描述
本算法大致分為三步:
(1)截取一段實(shí)時(shí)視頻圖像,獲取初始背景圖像。
(2)利用當前實(shí)時(shí)視頻圖像更新初始背景,獲得待檢測的背景圖像。
(3)根據Sobel算子計算背景圖像的邊緣梯度值之和,根據閾值判斷背景圖像的清晰度,得到實(shí)時(shí)視頻圖像的清晰度評價(jià)值。
算法描述如下:
從實(shí)時(shí)視頻圖像中截取一段時(shí)長(cháng)為1 min的視頻圖像,每5 s進(jìn)行1次采樣,共得到12幀圖像。為減少計算量,將采樣得到的12幀圖像由RGB空間轉換到灰度空間。對圖像中每個(gè)像素點(diǎn)的灰度值f(x,y)累加求平均,得到實(shí)時(shí)視頻圖像的初始背景圖像。計算公式為:
式中,n為邊緣點(diǎn)的個(gè)數。將value與清晰的實(shí)時(shí)視頻圖像背景的清晰度檢測范圍值(經(jīng)大量的實(shí)時(shí)視頻圖像實(shí)驗得到)比較,若value∈T(α1,α2),則實(shí)時(shí)視頻圖像是清晰的;若valueT(α1,α2),則實(shí)時(shí)視頻圖像是模糊的。
3 實(shí)驗結果與分析
目前,大部分的攝像系統都是基于RGB顏色空間,每個(gè)像素點(diǎn)在RGB空間中是一個(gè)三維矢量。為了減少計算量,使用灰度圖像序列,即將彩色視頻序列轉換成灰度視頻序列,基于灰度視頻圖像完成提取背景及實(shí)時(shí)視頻圖像的清晰度檢測。
實(shí)驗程序在PC機上運行,編程軟件是Matlab R2007b,采用的是24位RGB視頻序列,30幀/s,每幀圖片的分辨率是320×240。從實(shí)時(shí)視頻圖像中提取背景圖像后,本文分別采用Sobel算子、平方梯度法和快速檢測法三種算法對圖像的清晰度進(jìn)行檢測。
實(shí)驗拍攝的視頻圖如圖3所示。視頻中杯子為移動(dòng)的物體,杯子由視野的右側移動(dòng)到視野的左側,背景物體基本保持不變。圖3中的圖片1和圖片2分別是從實(shí)驗視頻中截取的圖片,杯子的位置不斷改變,圖片3為清晰的實(shí)時(shí)視頻圖像的背景圖像,其像素梯度值作為判斷視頻序列圖像清晰度的參考閾值,如表1所示。圖3中的圖征4~9分別是從6段不同的實(shí)時(shí)視頻圖像中提取的背景圖片。6段視頻序列圖像的清晰度逐漸減弱,其背景圖像也越來(lái)越模糊?;谏鲜霰尘皥D,本文采用了三種算法:Sobel算子清晰度檢測、平方梯度算法和快速檢測法。其中Sobel算子清晰度檢測如文中所述,平方梯度算法將微分值平方,計算公式為:
式中,圖像大小為M×N,f(x,y)表示(x,y)處的灰度值[6]??焖贆z測法是先求圖像的灰度均值,分別計算灰度值大于和小于圖像灰度均值的像素點(diǎn)的均值H和L,然后利用評價(jià)因子F=(H-L)/(H+L)來(lái)檢測實(shí)時(shí)視頻圖像的清晰度。
三種算法對實(shí)時(shí)視頻圖像的清晰度檢測結果如表1所示。清晰度評價(jià)值經(jīng)過(guò)歸一化處理,便于算法準確度性能的比較。由表1可知,Sobel算子清晰度檢測和平方梯度算法的清晰度評價(jià)值的變化趨勢與幅度和肉眼觀(guān)測到的事實(shí)基本相符,視頻序列圖像越模糊,清晰度評價(jià)值越小,即實(shí)時(shí)視頻圖像1、2、3的清晰度評價(jià)值在評價(jià)范圍內,實(shí)時(shí)視頻圖像是清晰的,實(shí)時(shí)視頻圖像4、5、6的清晰度評價(jià)值在評價(jià)范圍之外,實(shí)時(shí)視頻圖像是模糊的??焖贆z測算法對清晰度的敏感度低,視頻很模糊時(shí),評價(jià)值仍然較大,不能很好地衡量清晰度的變化幅度。表2比較了三種算法的時(shí)間性能,可知Sobel算子清晰度檢測算法與快速算法計算時(shí)間較為接近,平方梯度算法計算時(shí)間最長(cháng)。綜上所述,平方梯度算法評價(jià)效果較好,但實(shí)時(shí)性較差;快速算子計算速率高,但對模糊的靈敏度低;Sobel算子的評價(jià)效果好,實(shí)時(shí)性也符合系統的要求。
為了對實(shí)時(shí)視頻圖像的清晰度進(jìn)行實(shí)時(shí)檢測,針對實(shí)時(shí)視頻圖像的特點(diǎn),本文提出了采用背景提取和Sobel算子相結合的清晰度檢測算法,該算法在幀圖像清晰度檢測時(shí)計算效率高,能夠自動(dòng)實(shí)時(shí)地完成實(shí)時(shí)視頻圖像的清晰度檢測。但目前此算法僅適用于實(shí)時(shí)視頻圖像中背景基本不變或微小變化的場(chǎng)景。如果背景圖像變化幅度較大,需要調整判斷視頻清晰度的評價(jià)范圍作為新的評價(jià)標準,這也是后續工作的研究重點(diǎn),以使該算法在更多的場(chǎng)景中應用。
評論