基于FPGA+ARM的高速計算機屏幕信息記錄系統
隨著(zhù)計算機應用越來(lái)越廣泛,越來(lái)越多的重要信息需要由計算機屏幕顯示,因此對計算機屏幕記錄的需求越來(lái)越迫切。同時(shí), 伴隨著(zhù)顯示器的高速發(fā)展,計算機屏幕分辨率日益增大,需要記錄的圖像分辨率也逐漸增大,因此,對能夠記錄計算機屏幕信息的設備需要日益增長(cháng)。目前的圖像壓縮存儲方案大都無(wú)法支持高分辨率圖像,如ADI公司推出的圖像壓縮芯片ADV212[1],該芯片支持的最大分辨率為1 024×1 024,無(wú)法滿(mǎn)足SXGA(1 280×1 024)或更高的圖像分辨率。另外,在一些DSP解決方案中,因為DSP接口不靈活以及DSP本身處理能力的限制,很難支持高分辨圖像壓縮。
本設計開(kāi)發(fā)出了一套基于雙FPGA+ARM架構的高速計算機屏幕圖像壓縮系統。系統通過(guò)對圖像壓縮系統任務(wù)的劃分,利用FPGA的并行計算能力和靈活的編程方式,完成圖像壓縮算法。對于壓縮后的碼流,系統采用ARM管理,基于linux的嵌入式ARM系統能夠以文件的形式存儲碼流,另外,ARM對網(wǎng)絡(luò )和音頻常用設備能方便地管理。系統支持主流接口(VGA,DVI),壓縮后的碼流可以存儲在本地硬盤(pán),也可以通過(guò)網(wǎng)絡(luò )發(fā)送到遠端服務(wù)器。雙FPGA的設計對計算機屏幕圖像壓縮更為方便,原始圖像經(jīng)過(guò)前端預處理FPGA進(jìn)行幀間檢測,以決定該幀圖像進(jìn)入主FPGA的壓縮模式,主FPGA為核心壓縮引擎,負責完成高速圖像壓縮算法。
1 系統架構與實(shí)現
系統整體架構如圖1所示,采用雙FPGA+ARM架構,主要包括圖像前端預處理、圖像壓縮模塊和碼流管理部分。
前面一塊FPGA完成前端預處理,如分辨率檢測、色彩轉換和圖像分析等功能;后面一塊FPGA用來(lái)實(shí)現圖像實(shí)時(shí)壓縮,其中ARM對系統進(jìn)行管理,如壓縮后碼流管理、網(wǎng)絡(luò )管理和音頻錄制等。
1.1 預處理模塊
本系統同時(shí)支持VGA、DVI兩種主流顯卡接口。采用AD9888[2]作為視頻模數轉換器,TI公司的TFP403[3]為DVI接收芯片。Xilinx公司Virtex4[4](XC4VLX40)完成圖像預處理,主要包括圖像數據的采集、色彩空間轉換和幀間檢測。前端處理模塊如圖2所示。
1.1.1 圖像數據采集
預處理FPGA接收到的圖像數據為接口芯片送來(lái)的圖像數據,包括像素時(shí)鐘信號(PCLK)、場(chǎng)同步信號(VSYNC)、行同步信號(HSYNC)以及數據信號(R[7:0],G[7:0],B[7:0])。圖像數據的采集包括判斷圖像分辨率和提取圖像數據兩個(gè)步驟。
當前的計算機屏幕分辨率很多,工業(yè)VGA標準規定了各種分辨率的像素時(shí)鐘及場(chǎng)、行同步信號時(shí)序,根據相鄰場(chǎng)同步信號(VSYNC)之間行同步信號(HSYNC)數目,以及相鄰行同步信號(HSYNC)之間像素時(shí)鐘(PCLK)數目識別VGA信號分辨率。根據場(chǎng)同步信號(VSYNC)和行同步信號(HSYNC)提出圖像數據。
1.1.2 色彩空間轉換
VGA輸出為RGB信號,而人眼對圖像的亮度分量更為敏感,所以,對圖像數據進(jìn)行色彩空間轉換,將RGB信號轉換為YUV信號,轉換公式:
系統實(shí)現時(shí)采用4:2:2采樣模式,FPGA采用定點(diǎn)化處理后,得到亮度分量Y 和色度分量UV。
1.1.3 幀間檢測
幀間檢測的核心思想是對比相鄰兩幀圖像,判斷每個(gè)像素點(diǎn)是否變化。以3×3的塊為判斷單元,如果有變化則將該像素位置和像素值都存起來(lái);如果沒(méi)有變化則不傳輸這些信息。當得到了一個(gè)4×4的塊以后把這個(gè)16個(gè)點(diǎn)的信息作為一個(gè)整體傳給后面的模塊,然后統計1幀圖像總的碼流大小。如果該值低于一個(gè)設定的閾值,則認為當前幀沒(méi)有變化,直接傳當前幀變化部分的像素和位置信息到后面的碼流整理模塊;如果統計后碼流的大小大于設定的閾值,則將當前幀送入LX100中進(jìn)行壓縮。
1.2 圖像壓縮模塊
圖像壓縮為系統核心模塊,該壓縮引擎包括小波變換和熵編碼,算法全部由系統主FPGA完成。該FPGA芯片選用Xilinx公司的Virtex4[4]系列FPGA(XC4VLX160)。圖像壓縮引擎結構如圖3。
在系統算法設計中,圖像小波變換采用了基于離散小波變換的空間推舉算法(SCLA)[5]。不同于傳統的離散小波變換(DWT),SCLA對行與列同時(shí)進(jìn)行變換,其乘法次數是小波變換算法中最少的,而重建圖像質(zhì)量也很高,PSNR值優(yōu)于JPEG,接近JPEG2000。編碼算法采用了改進(jìn)的無(wú)鏈表零樹(shù)編碼算法(SLC),該算法綜合了多層次零樹(shù)編碼算法(SPIHT[6])和無(wú)鏈表零樹(shù)編碼(LZC[7])的特點(diǎn),在性能上優(yōu)于LZC,逼近SPIHT,而且易于硬件實(shí)現。
系統的架構由FPGA和兩片外部SDRAM實(shí)現。SDRAM用于緩存小波變換后的小波系數。FPGA完成小波變換算法SCLA和熵編碼算法SLC。SCLA算法由5個(gè)流水線(xiàn)小波濾波器完成,每個(gè)濾波器完成一層小波分解,而小波分解運算需要乘法器,在FPGA芯片選型時(shí),根據小波濾波器中需要乘法器的個(gè)數選擇FPGA。在本系統中,5個(gè)流水的小波濾波器包括36個(gè)乘法器,對于亮度分量Y和色度分量UV兩路數據并行處理,則需要72個(gè)乘法器,而在Virtex4系列FPGA(XC4VLX160)中有96個(gè)DSP單元。由小波變換得到小波系數,系統設計時(shí)采用2片外部SDRAM和FPGA片內SRAM結合的方法緩存小波系數。對于亮度分量Y和色度分量UV兩路數據并行處理以提高系統吞吐量,SDRAM1和SDRAM2分量用來(lái)緩存Y和UV的小波系數。熵編碼算法SLC負責對小波系數編碼,該算法以一棵小波樹(shù)為基本處理單元,即當前端小波系數構成一棵小波樹(shù)時(shí),熵編碼模塊便啟動(dòng)編碼,從而完成一幀圖像所有小波樹(shù)的編碼。
1.3 碼流管理模塊
對于圖像經(jīng)過(guò)FPGA壓縮后的碼流,系統采用ARM芯片進(jìn)行管理,該芯片為Cirrus Logic公司的工業(yè)級嵌入式處理器EP9315[8]。該處理器具有ARM920T核,最高主頻達200 MHz,并具有豐富的外圍接口,包括網(wǎng)絡(luò )、USB、音頻等。FPGA和ARM之間通信由I2C總線(xiàn)完成,當FPGA完成一幀圖像壓縮后,通過(guò)FPGA的GPIO發(fā)送一個(gè)終端信號給ARM,并準備好一幀碼流長(cháng)度等信息。ARM中斷服務(wù)程序響應該中斷,通過(guò)I2C接口讀走碼流長(cháng)度,通過(guò)映射SRAM的方式從FPGA讀取壓縮碼流到ARM內存,然后以文件的形式存儲碼流到本地硬盤(pán),或者通過(guò)網(wǎng)絡(luò )發(fā)送到遠端服務(wù)器。
2 實(shí)驗結果與性能
2.1 算法性能驗證
系統設計初期,用軟件對算法的性能進(jìn)行了驗證。在PC上對一組Lena等標準圖像進(jìn)行壓縮,得到不同的重建圖像,對重建圖像求解PSNR值,式(2)為PSNR計算公式。其中Mean Square Error(MSE)表示原始圖像和重建圖像對應像素的均方誤差值。
表1為本系統采用算法與JPEG及JPEG2000對標準圖像壓縮后重建圖像的PSNR比較。從表中可以看出,本系統采用算法遠優(yōu)于JPEG,接近JPEG2000。PSNR值的比較以壓縮比(對應表中Bitrate)為基準,即在相同壓縮比的情況下對比PSNR值。
2.2 硬件實(shí)現和硬件壓縮
硬件系統電路板采用10層板制作工藝,電路板面積為30.8 cm×16.7 cm,在100 MHz工作頻率下對系統測試,結果表明系統工作穩定。表2為系統對1 600×1 200、1 280×1 024和1 024×768三種常見(jiàn)分辨率的計算機屏幕進(jìn)行的記錄,記錄的圖像源采用了各類(lèi)計算機屏幕常見(jiàn)圖像,如Word文檔、PPT文件、動(dòng)態(tài)雷達圖像和一段視頻。其中,PPT的平均翻頁(yè)速度為60 s。由表2可以看出,系統對于Word文檔、PPT文檔等只有局部變化的圖像能夠達到非常高的壓縮比,壓縮幀率約為60幀/s。
本文結合應用提出圖像壓縮算,以FPGA為核心計算平臺,設計了一套計算機屏幕圖像記錄系統。系統實(shí)現了對1 280×1 024×24 bit圖像每秒記錄27幀,對1 600×1 200×24 bit圖像每秒記錄17幀,對PPT、Word文檔等只有局部變化的屏幕圖像每秒可記錄60幀,且壓縮后重建圖像質(zhì)量?jì)?yōu)于JPEG,與JPEG2000接近。同時(shí),對于壓縮后的碼流,系統采用ARM以文件的方式管理,有利于碼流本地存儲以及通過(guò)網(wǎng)絡(luò )傳輸等靈活的應用。另外,系統支持多種輸入接口,提高了硬件系統的靈活性,具有廣闊的應用前景。
評論