ARM NEON技術(shù)在車(chē)位識別算法中的應用
在CORTEX-A8平臺上使用該圖像處理算法進(jìn)行了大量的處理測試,圖像算法處理速度得到很大提升。最后在多個(gè)平臺下使用該圖像處理算法進(jìn)行測試對比,使用了NEON技術(shù)后其算法處理速度提升明顯,能夠滿(mǎn)足實(shí)時(shí)要求。
0 引言
隨著(zhù)城市越來(lái)越多家庭擁有汽車(chē),相應的停車(chē)場(chǎng)建設數目也越來(lái)越多,停車(chē)場(chǎng)管理系統也越來(lái)越重要。
而國內城市車(chē)多人多,空間擁擠給停車(chē)廠(chǎng)管理帶來(lái)諸多不便。車(chē)位檢測系統設計成嵌入式終端是一個(gè)好的選擇。圖像檢測算法的復雜度給實(shí)時(shí)檢測帶來(lái)難題,一般的圖像處理都是基于DSP完成,這帶來(lái)了成本的上升。
ARM 公司CORTEX-A 系列處理器的出現,極大地緩解了這個(gè)難題。
ARM 平臺能夠很好地支持Linux 系統,Linux 系統具有強大的網(wǎng)絡(luò )通訊功能,也給程序移植等帶來(lái)便利。本文的檢測算法在ARM平臺基于NEON技術(shù)進(jìn)行了優(yōu)化,在保證檢測精度的同時(shí),處理速度提升明顯,與使用DSP相比,大大節約了成本,為停車(chē)場(chǎng)管理系統的研究提供新的方向。
1 ARM NEON技術(shù)介紹
ARM 的NEON 通用SIMD 引擎可有效處理當前和將來(lái)的多媒體格式,從而改善用戶(hù)體驗。NEON 技術(shù)是通過(guò)清晰方式構建的,并可無(wú)縫用于其本身的獨立流水線(xiàn)和寄存器文件。NEON 技術(shù)是ARM Cortex-A系列處理器的128 位SIMD(單指令多數據)體系結構擴展,旨在為多媒體應用提供更加強大的加速功能,從而明顯改善程序性能。它具有32 個(gè)寄存器,64 位寬(是16 個(gè)寄存器,128 位寬的雙倍視圖)NEON 指令特點(diǎn)如下:
?。?)寄存器被視為同一數據類(lèi)型的元素的矢量;
?。?)數據類(lèi)型可為:有符號/無(wú)符號的8 位、16 位、32 位、64 位單精度浮點(diǎn);
?。?)指令在所有通道中執行同一操作。
NEON 寄存器可在多個(gè)通道內進(jìn)行并行運算,如圖1所示。
NEON 的指令都是以v 字母開(kāi)頭的,例如:vadd.i16q0,q1,q2,這就是一個(gè)NEON 的指令了,很明顯的特點(diǎn)就是v 開(kāi)頭,i 主要用來(lái)表明是一個(gè)整型(int),16 表示一個(gè)16 位的型,q0,q1,q2 都是128 位的寄存器(q 打頭的寄存器都是128 位的)。這個(gè)指令就是讓q1,q2 中裝載8 個(gè)16位的數據,然后執行加法操作,最后放到q0中去。這么一個(gè)指令就完成了8次加法運算,這也就是性能的提升,對于其他運算也是如此。
2 系統設計和算法介紹
本系統基于CORTEX-A8平臺實(shí)現,車(chē)位檢測系統架構如圖2所示。
采集通過(guò)模擬攝像頭,由TVP5150解碼后輸出8位Y∶Cb∶Cr=4∶2∶2的數據傳送的A8平臺,TVP5150驅動(dòng)基于VIDEO FOR LINUX2(V4L2)開(kāi)發(fā),因此視頻采集程序調用V4L2相關(guān)API函數即可完成。然后調用相關(guān)圖像處理程序,提取多個(gè)圖像特征,與背景圖像對比,進(jìn)行有車(chē)無(wú)車(chē)檢測,然后TCP/IP網(wǎng)絡(luò ) 將圖像和有車(chē)位車(chē)情況發(fā)送到上位機。
車(chē)位檢測算法流程如圖3所示。
本系統目前在一處地下停車(chē)場(chǎng)進(jìn)行測試驗證,如圖4在停車(chē)中采集到的背景和待測圖像,通過(guò)對100幅采集到800×600 分辨率的現場(chǎng)圖像,在CORTEX-A8 平臺上進(jìn)行測試,平均檢測時(shí)間為538 ms,該算法在地下停車(chē)場(chǎng)中準確率97%.表1 中給出了處理一幅待測圖像CORTEX-A8 和ARM11 平臺優(yōu)化前平均時(shí)間的測試對比結果(均使用GCC交叉編譯)。
評論