基于A(yíng)RM和CPLD的嵌入式視覺(jué)系統設計
② 計算質(zhì)心橫坐標。
③ 計算質(zhì)心縱坐標。
④ 識別物體的形狀。根據得到的每行跟蹤點(diǎn)的長(cháng)度,以及同一行中有幾段符合要求的連續跟蹤點(diǎn),可以得知物體從攝像頭角度看到的形狀。特別是在檢測平面上線(xiàn)條時(shí),可以識別是否有分支,這一點(diǎn)是幀處理模式無(wú)法做到的。
需要指出的是,行處理模式雖然會(huì )得到關(guān)于跟蹤目標的更多信息,但是每行處理的方式增大了處理器的負擔,處理速度也沒(méi)有幀處理快。
4 提高系統的工作速率
目前,系統工作在幀處理模式下的工作速率是25幀/s,作為系統功能的驗證,這里采用的算法是顏色跟蹤。如果僅做純粹的圖像采集,而不做圖像處理,那么系統可以達到OV6620的最高工作速率,即60幀/s。而在圖像處理方面,不同的圖像處理程序效率對系統的工作頻率有較大的影響。下面給出在通用ARM處理器下提高程序效率的幾個(gè)建議:
① 內嵌(inline)可通過(guò)刪除子函數調用的開(kāi)銷(xiāo)來(lái)提高性能。如果函數在別的模塊中不被調用,一個(gè)好的建議是用static標識函數;否則,編譯器將在內嵌譯碼里把該函數編譯成非內嵌的。
② 在ARM系統中,函數調用過(guò)程中參數個(gè)數≤4時(shí),通過(guò)R0~R3傳遞;參數個(gè)數>4時(shí),通過(guò)壓棧方式傳遞(需要額外的指令和慢速的存儲器操作)。通常限制參數的個(gè)數,使它為4或更少。如果不可避免,則把常用的前4個(gè)參數放在R0~R3中。
③ 在for(), while() do…while()的循環(huán)中,用“減到0”代替“加到某個(gè)值”。比如:
for (loop = 1; loop = total; loop++) //ADD和CMP
替換為:for (loop = total; loop != 0; loop--) //SUBS
第1種方式比較需要2條指令ADD和CMP,而第2種方式只需一條指令SUBS。
④ ARM核不含除法硬件,除法通常用一個(gè)運行庫函數來(lái)實(shí)現,運行需要很多個(gè)周期。一些除法操作在編譯時(shí)作為特例來(lái)處理,例如除以2的操作用左移代替余數的操作符“%”,通常使用模算法。如果這個(gè)值的模不是2的n次冪,則將花費大量的時(shí)間和代碼空間避免這種情況的發(fā)生。具體辦法是使用if()作狀態(tài)檢查。
比如,count的范圍是0~59:
count = (count+1) % 60;
用下面語(yǔ)句代替:
if (++count >= 60)
count = 0;
⑤ 避免使用大的局部結構體或數組,可以考慮用malloc/free代替。
⑥ 避免使用遞歸。
結語(yǔ)
本文介紹了一種基于A(yíng)RM和CPLD的嵌入式視覺(jué)系統,可以實(shí)現顏色跟蹤。在硬件設計上,圖像采集和圖像處理分離,更利于系統功能的升級。而視覺(jué)處理算法更注重處理的效率和實(shí)時(shí)性,同時(shí)根據不同的需要有兩種模式可供選擇。最后給出了提高程序效率的一些建議和方法。與基于PC機的視覺(jué)系統相比,該系統功耗低、體積小,適合應用于移動(dòng)機器人等領(lǐng)域。
評論