一種改進(jìn)的高精度視頻幀間匹配算法
1、引言
本文引用地址:http://dyxdggzs.com/article/167021.htm圖像匹配技術(shù)是數字圖像處理領(lǐng)域的一項重要研究,并已在計算機視覺(jué)、虛擬現實(shí)場(chǎng)景生成、航空航天遙感測量、醫學(xué)影像分析、光學(xué)和雷達跟蹤、景物制導等領(lǐng)域得到了廣泛的應用。它涉及到許多相關(guān)領(lǐng)域,如圖像預處理、圖像采樣、圖像分割、特征提取等,并且將計算機視覺(jué)、多維信號和數值計算方法等緊密結合在一起。因此,如何找到一種有效的圖像匹配方法,使得它能快速而準確的從大量信息中找出所需圖像信息成為急待需要解決的問(wèn)題。
特征法[1]是圖像匹配算法中的一種經(jīng)典方法,其原理是選取圖像中的典型特征作為運動(dòng)估計的基本單元,這種方法比較接近于人的視覺(jué)特性,主要受制于特征提取的穩定性和特征定位的精確性。而SIFT (scale in-variant feature transform)特征[2,3]是一種對尺度、旋轉、亮度、仿射、噪音等都具有不變性的圖像局部特征。所以,本文針對視頻幀間匹配的要求,結合SIFT特征對尺度和旋轉具有不變性的優(yōu)點(diǎn),將歐式距離判別和RANSAC法融合到對SIFT特征點(diǎn)的匹配計算中,通過(guò)研究得到了一種高精度的視頻幀間匹配算法。
2、基于SIFT特征的視頻幀間匹配
在需要處理的視頻幀間圖像中,普遍地存在旋轉和尺度縮放,而常用的Harris角點(diǎn)[4] 和K-L角點(diǎn)[5]不適用于這種場(chǎng)合。SIFT特征是分別在兩幀圖像的高斯差分尺度空間(DOG scale-space)提取出的圖像局部特征,以某段在直升機上拍攝的航拍視頻為例,對視頻中某兩幀圖像的SIFT特征點(diǎn)進(jìn)行匹配,仿真結果如圖1所示。
圖1 視頻中某兩幀圖像的SIFT特征匹配結果
仿真結果表明,SIFT特征不僅具有對旋轉、尺度縮放、亮度變化的不變性,而且對視角變化、仿射變換、噪聲也具有一定程度的穩定性。由于該算法不以單個(gè)像素作為研究對象,所以提高了對圖像局部變形的適應能力。
但是在傳統的僅采用歐式距離判別法對特征點(diǎn)進(jìn)行匹配的過(guò)程中,仍舊存在誤匹配問(wèn)題。圖2是將相鄰兩幀圖像中提取的特征點(diǎn)在同一幀圖像中顯示,可以根據性質(zhì)將誤匹配點(diǎn)分為兩類(lèi):第一類(lèi)是完全匹配錯誤的點(diǎn),如圖2方框(a)所示,即被配對的兩幀圖像上的兩個(gè)點(diǎn)實(shí)際上不是一對具有匹配關(guān)系的點(diǎn),他們具有相同或極其相似的SIFT特征向量,但他們并不是同一個(gè)圖像特征;第二類(lèi)是有誤差的匹配點(diǎn),如圖2方框(b)所示,即兩個(gè)點(diǎn)雖然是同一個(gè)圖像特征,但是由于鏡頭的晃動(dòng),圖像的局部運動(dòng)及其他擾動(dòng)的影響,同一個(gè)點(diǎn)在兩幀圖像中的坐標差異與其他大部分點(diǎn)的坐標差異相比,存在較大的偏差。這兩種情況都會(huì )影響到運動(dòng)參數估計的準確度,因此都是需要被去除的誤匹配點(diǎn)。
圖2 歐式距離法判別匹配點(diǎn)
實(shí)驗表明,利用歐式距離進(jìn)行關(guān)鍵點(diǎn)匹配的匹配精度基本取決于比例閾值r 的大小,r 取值過(guò)大會(huì )出現大量錯匹配點(diǎn),而r取值過(guò)小可能得到的匹配點(diǎn)數目過(guò)少。然而存在這樣的情況,即如果兩幀圖像上的某兩個(gè)不同的特征點(diǎn)的特征向量的歐式距離值非常小,則閾值r 需要取足夠小的值才有可能去掉這一對錯誤的匹配點(diǎn),這樣一來(lái)匹配點(diǎn)總數目就太少甚至為零,甚至無(wú)法進(jìn)行后面的參數計算。故單純靠調節歐式距離匹配中的比例閾值r無(wú)法解決上述誤配點(diǎn)問(wèn)題,難以達到高精度、數目適中的特征點(diǎn)匹配結果。
3、匹配準則的改進(jìn)
RANSAC法和傳統的方法的區別在于傳統的方法先把全部的數據點(diǎn)作為內點(diǎn)而計算出初始參數值,然后重新計算并統計內點(diǎn)和外點(diǎn);而RANSAC法最開(kāi)始是利用一部分數據作為內點(diǎn)得到初始值,然后尋找數據集中所有別的內點(diǎn)。即應用RANSAC法對歐式距離法粗匹配的特征點(diǎn)進(jìn)行準確度檢驗,可以最大限度地減少噪聲及外點(diǎn)的影響。所以,本文首先采用關(guān)鍵點(diǎn)特征向量的歐式距離判定視頻中某兩幀圖像的特征點(diǎn)相似性,進(jìn)行粗略匹配,然后利用RANSAC法對粗略匹配結果進(jìn)行迭代演算[7,8],通過(guò)二次精確匹配來(lái)剔除粗匹配中的誤配點(diǎn),得到精確的匹配點(diǎn),從而得到精確的圖像匹配結果。
3.1 歐式距離判別法的一次粗匹配
當兩幀圖像的SIFT特征向量生成后,首先采用關(guān)鍵點(diǎn)特征向量的歐式距離作為兩幀圖像中關(guān)鍵點(diǎn)的相似性判定度量。歐氏距離(Euclidean distance)是一個(gè)通常采用的距離定義,它是在n維空間中兩個(gè)點(diǎn)之間的真實(shí)距離。
計算兩幀圖像中特征點(diǎn)的歐式距離的公式是:
(1)
Xi1表示第一幀圖像上某一點(diǎn)的第i 維坐標,Xi2表示第二幀圖像上某一點(diǎn)的第i 維坐標。
判斷準則:取圖像1中的某個(gè)關(guān)鍵點(diǎn),計算出圖像2中與其歐式距離最近的前兩個(gè)關(guān)鍵點(diǎn),在這兩個(gè)關(guān)鍵點(diǎn)中,如果最近的距離d1除以次近的距離d2少于某個(gè)比例閾值r ,則接受這一對匹配點(diǎn),否則拋棄。
評論