圖像屏幕尺寸綿放的C程序優(yōu)化技巧
引 言
嵌入式系統的核心部件是嵌入式處理器。在眾多的處理器中,ARM是專(zhuān)為嵌入式應用而設計的處理器,由于其低功耗、高性?xún)r(jià)比和易擴展性等特點(diǎn),在嵌入式系統中得到了最為廣泛的應用。在許多成功的32位嵌入式系統中,ARM處理器都是其核心組成部分。ARM內核已被廣泛應用于移動(dòng)電話(huà)、掌上設備以及種類(lèi)繁多的便攜式消費類(lèi)產(chǎn)品中。隨著(zhù)ARM處理器越來(lái)越廣泛的應用,如何提高代碼的執行效率已成為工程師關(guān)注的問(wèn)題,同時(shí)如何在實(shí)時(shí)嵌入式應用中,通過(guò)代碼優(yōu)化以減少消耗過(guò)多的CPU運行時(shí)間已成為人們關(guān)注的焦點(diǎn)。軟件開(kāi)發(fā)中,常用的代碼優(yōu)化技巧有“循環(huán)展開(kāi)”、“減少外存訪(fǎng)問(wèn)”、“考慮CPU帶寬”、“循環(huán)減計數”、“循環(huán)變量數據類(lèi)型”、“使用SWITCH取代條件判斷”等。而圖像在不同屏幕尺寸之間縮放的程序是嵌入式領(lǐng)域常常用到的功能。這里就以實(shí)現這樣一個(gè)常見(jiàn)功能的程序為例,說(shuō)明程序優(yōu)化的技巧。
1 實(shí)例分析
程序的目標是將一個(gè)長(cháng)寬為240×160,格式為RGB565的顯示緩沖區的內容映射到長(cháng)寬為320×240,格式也為RGB565的顯示緩沖區內。因為源數據寬度是240點(diǎn),所以,放大到目的區域的時(shí)候,就需要每3個(gè)源數據點(diǎn)中,重復1點(diǎn)的數據,變成4點(diǎn),放到目的顯示緩沖區中。同樣,每2行源數據也要重復1行,變成3行,放到目的顯示緩沖區中。源數據和目的數據分別定義如下(保證源顯示緩沖區和目的顯示緩沖區都是4字節對齊起始的):
注:以下所有程序均是使用ADS1.1編譯,CPU主頻為100 MHz,使用ARM7EJ-S為目標處理器,小端編譯方式,測試的時(shí)間是以所有的程序和數據均是Cache全命中為前提測試得到的。
2 原始程序
下面這段程序是沒(méi)有經(jīng)過(guò)任何優(yōu)化的程序,僅僅實(shí)現了相應的功能要求,運行時(shí)間為10 ms。
評論